환승시간은 대중교통계획 및 정책 수립에 있어서 중요한 요소이다. 이에 본 연구에서는 교통카드 이용자료를 활용하여 대중교통 이용자의 환승시간 영향요인을 규명하고, 딥러닝 기법인 심층신경망 모형을 이용한 환승시간을 추정하였으며 이를 전통적인 회귀모형과 비교 분석하였다. 먼저 환승시간 영향요인의 경우, 주변 버스의 배차간격과 버스 정류장까지의 거리가 버스 환승시간에 양의 영향을 주었으며, 버스 노선수는 반대로 음의 영향을 주었다. 또한 지하철역이 속해있는 자치구에 따라서도 환승시간에 영향을 주는 것으로 나타났다. 도출된 환승시간 영향요인을 통해 딥러닝 모형을 구축하고 성능을 비교한 결과, 회귀모형보다 딥러닝 모형의 성능이 보다 우수하였다. 본 연구의 결과는 지역별 환승허용시간의 차등 적용 등 대중교통 환승정책의 기초 자료로 활용될 수 있을 것으로 판단된다.
환승시간은 대중교통계획 및 정책 수립에 있어서 중요한 요소이다. 이에 본 연구에서는 교통카드 이용자료를 활용하여 대중교통 이용자의 환승시간 영향요인을 규명하고, 딥러닝 기법인 심층신경망 모형을 이용한 환승시간을 추정하였으며 이를 전통적인 회귀모형과 비교 분석하였다. 먼저 환승시간 영향요인의 경우, 주변 버스의 배차간격과 버스 정류장까지의 거리가 버스 환승시간에 양의 영향을 주었으며, 버스 노선수는 반대로 음의 영향을 주었다. 또한 지하철역이 속해있는 자치구에 따라서도 환승시간에 영향을 주는 것으로 나타났다. 도출된 환승시간 영향요인을 통해 딥러닝 모형을 구축하고 성능을 비교한 결과, 회귀모형보다 딥러닝 모형의 성능이 보다 우수하였다. 본 연구의 결과는 지역별 환승허용시간의 차등 적용 등 대중교통 환승정책의 기초 자료로 활용될 수 있을 것으로 판단된다.
The transfer time is an important factor in establishing public transportation planning and policy. Therefore, in this study, the influencing factors of the transfer time for transit users were identified using smart card data, and the estimation results for the transfer time using the deep learning...
The transfer time is an important factor in establishing public transportation planning and policy. Therefore, in this study, the influencing factors of the transfer time for transit users were identified using smart card data, and the estimation results for the transfer time using the deep learning method such as deep neural network models were compared with traditional regression models. First, the intervals and the distance to the bus stop had positive effects on the subway-to-bus transfer time, and the number of bus routes had a negative effect. This also showed that the transfer time is affected by the area in which the subway station exists. Based on the influencing factors of the transfer time, the deep learning models were developed and their estimation results were compared with the regression model. For model performance, the deep learning models were better than those of the regression models. These results can be used as basic data for transfer policies such as the differential application of transit allowance times according to region.
The transfer time is an important factor in establishing public transportation planning and policy. Therefore, in this study, the influencing factors of the transfer time for transit users were identified using smart card data, and the estimation results for the transfer time using the deep learning method such as deep neural network models were compared with traditional regression models. First, the intervals and the distance to the bus stop had positive effects on the subway-to-bus transfer time, and the number of bus routes had a negative effect. This also showed that the transfer time is affected by the area in which the subway station exists. Based on the influencing factors of the transfer time, the deep learning models were developed and their estimation results were compared with the regression model. For model performance, the deep learning models were better than those of the regression models. These results can be used as basic data for transfer policies such as the differential application of transit allowance times according to region.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
환승통행 관련 연구 및 딥러닝 기법을 활용한 선행연구를 검토한 결과 대부분이 환승통행량에 관한 연구가 수행되었으며, 딥러닝 기법을 활용한 교통 분야의 연구에서도 대중교통 환승에 관한 연구는 미흡한 것으로 나타났다. 따라서 본 연구에서는 딥러닝 기법을 활용하여 서울시 대중교통 이용자의 지하철-버스 환승시간을 추정하고자 한다.
따라서 본 연구에서는 환승시간의 변동성이 상대적으로 높은 지하철→버스간의 환승통행을 대상으로 모형을 추정하고자 한다.
그러나 복잡한 요인들이 얽혀있는 도시의 교통 현상은 기존의 회귀분석이 설명하기 어려운 비선형적인 특성을 가지는 부분이 있어 최근에는 이런 비선형적인 특성을 반영하여 보다 높은 정확도로 추정이 가능한 딥러닝 기법을 활용한 연구가 증가하고 있다. 이에 본 연구에서는 대중교통의 환승체계 개선을 위해 서울시 내 환승시간을 새로운 연구방법론으로 주목받고 있는 딥러닝 기법으로 추정하고자 하며, 기존의 전통적인 방법론과 추정 결과를 비교 분석하고자 한다.
본 연구에서는 환승시간 추정을 위해 전통적인 통계모형과 달리 새로운 연구방법론인 딥러닝 기법을 활용하였다. 이에 환승통행 특성과 관련된 연구와 함께 교통 분야에서 딥러닝 기법을 활용한 연구에 대해 살펴보았다.
이는 출근시간대에는 대중교통 배차간격이 짧고 외적 요인에 영향을 덜 받기 때문인 것으로 판단된다. 이처럼 출근시간대와 퇴근시간대, 비첨두시간대에 환승시간에 영향을 미치는 요인에 차이가 있을 것으로 판단되어 본 연구에서는 일일, 출근시간대, 퇴근시간대, 비첨두시간대를 구분하여 환승시간 추정모형을 구축하고자 한다.
제안 방법
대중교통 운영 관련 변수로 버스 배차간격, 버스정류장까지의 거리, 버스 노선수를 구축하였으며, 버스 배차간격과 버스정류장까지의 거리는 환승시간과 마찬가지로 시간대별로 구분하여 산정하였다. 버스 배차간격은 지하철 역 2km 반경 내에 위치한 버스 정류장을 통과하는 노선들의 평균 배차간격을 산정한 뒤 노선별 환승통행량을 가중 평균하여 산출하였다.
Baek and Sohn(2017)은 인공신경망 기법을 활용하여 정류장별, 기종점별 대중교통 이용량을 추정하였다. 대중교통 이용량 추정을 위해 정류장 인근의 건축물 연면적, 용도 등의 활동 관련 변수, 배차간격, 버스 노선수, 지하철 노선수, 통행시간 등의 수단 관련 변수를 고려하였다. 추정 결과, 정류장별로 추정한 모형보다 기종점별로 추정한 모형이 더 우수한 성능을 나타냈다.
독립변수 설정과 함께 심층신경망 모형의 구조 설계가 필요한데, 본 연구에서는 은닉층의 개수와 은닉층 노드의 개수, 과적합을 막기 위한 드롭아웃 비율을 달리하여 각 시간대별로 모형의 최적 구조를 도출하였다. 은닉층의 개수는 3, 5, 7로, 은닉층 노드의 개수는 16, 32, 64, 128, 256으로, 드랍아웃 비율은 0.
90ha로 나타났다. 또한 각 지하철역이 속해있는 서울시 25개 지역구를 지역 더미(dummy) 변수로 구축하였다.
95%를 차지하였다. 또한 지하철역과 버스 정류장을 대상으로 5,000통행 이상의 환승이 이뤄지는 지점, 평균 환승시간이 10분 이상인 지점, 전체 통행 중 환승통행 비율이 50% 이상인 지점을 분석한 뒤 각 결과를 중첩하여 환승시설 개선이 필요한 지점을 도출하였다.
먼저 심층신경망 모형은 드롭아웃 비율, 은닉층의 개수, 은닉층 노드의 개수를 달리하여 각 시간대별로 최적의 모형을 구축하였다. 회귀분석 모형도 각 시간대별 수정된 결정계수는 0.
모형구축을 위해 2017년 5월 18일 기준의 서울시 교통카드 이용자료와 대중교통 기반정보 자료, 서울시 토지이용정보 및 건축물 연면적 자료 등을 활용하여 환승시간 및 대중교통 운영 관련 변수, 토지이용 및 지역 관련 변수를 구축하였다. 환승시간 추정을 위해서는 회귀모형과 함께 딥러닝 기법 중 심층신경망 모형을 개발하였으며, 이들 모형의 성능을 RMSE, %RMSE, MAE, MAPE 지표를 통해 비교하였다.
심층신경망 모형을 활용한 환승시간 추정은 일일, 출근시간대, 퇴근시간대, 비첨두시간대로 구분하여 총 4개의 모형을 구축하였다. 모형의 독립변수로는 배차간격, 버스정류장 거리, 버스 노선수, 상업지역 면적, 판매 및 편의시설 연면적, 지역 변수를 사용하였다.
대중교통 운영 관련 변수로 버스 배차간격, 버스정류장까지의 거리, 버스 노선수를 구축하였으며, 버스 배차간격과 버스정류장까지의 거리는 환승시간과 마찬가지로 시간대별로 구분하여 산정하였다. 버스 배차간격은 지하철 역 2km 반경 내에 위치한 버스 정류장을 통과하는 노선들의 평균 배차간격을 산정한 뒤 노선별 환승통행량을 가중 평균하여 산출하였다. 평균 배차간격은 일일 기준 약 10.
55분으로 출근시간대가 가장 짧은 것으로 나타났다. 버스 정류장까지의 거리도 지하철역으로부터 2km 반경 내에 위치한 버스 정류장까지의 거리를 환승통행량으로 가중 평균하여 산정하였다. 평균 버스 정류장까지의 거리는 일일 기준 162.
본 연구에서는 교통카드 이용자료를 활용하여 서울시의 지하철 역사별 버스 환승시간을 추정하였다. 환승 시간 추정을 위해 새로운 연구방법론인 딥러닝 기법을 활용하였으며, 전통적 추정방법인 회귀분석과 추정 결과를 비교분석하고자 하였다.
본 연구에서는 서울시 내 지하철 역사별 버스 환승시간을 추정하였다. 환승시간 추정에 있어 새로운 연구 방법론인 딥러닝 기법 중 심층신경망을 활용하였으며, 전통적인 회귀모형의 추정결과와 비교하였다.
본 연구는 2018년도 홍익대학교 학술연구진흥비의 지원을 받아 수행하였습니다. 본 연구의 초기 아이디어는 2019년도 한국ITS학회 추계학술대회에서 발표되었으며, 이를 바탕으로 수정·보완하여 본 논문을 작성하였습니다.
5%를 차지한다. 수도권 통합 환승할인제에 따라 환승 유효시간은 30분(오후 9시~익일 오전 7시는 1시간)이며, 환승 유효시간과 환승 유효거리(도보 속도 4km/h 기준)를 벗어난 통행에 대해서는 이상치로 제거하였다. 또한 지하철 개찰구에서 출구로 나가 버스 정류장까지의 이동거리를 심층신경망 모형을 활용한 대중교통 이용자의 환승시간 추정에 관한 연구 36 한국ITS학회논문지 제19권, 제1호(2020년 2월) 고려하여 이상치를 제거하였으며, 이상치 제거 결과 총 564,570건에 대하여 분석을 수행하였다.
심층신경망 모형을 활용한 환승시간 추정은 일일, 출근시간대, 퇴근시간대, 비첨두시간대로 구분하여 총 4개의 모형을 구축하였다. 모형의 독립변수로는 배차간격, 버스정류장 거리, 버스 노선수, 상업지역 면적, 판매 및 편의시설 연면적, 지역 변수를 사용하였다.
심층신경망모형과 회귀모형은 동일한 변수를 사용하였으며, 모형의 추정 성능을 평가하기 위하여 데이터를 학습 세트와 검증 데이터 세트로 분할하였다. 학습 데이터 세트와 검증 데이터세트의 구분은 임의추출법(random sampling)을 통해 이뤄졌으며, 전체 284개 역사 중 227개 역사(80%)를 학습에 사용하였고, 나머지 57개 역사(20%)를 학습된 모형의 추정성능 평가에 사용하였다.
독립변수 설정과 함께 심층신경망 모형의 구조 설계가 필요한데, 본 연구에서는 은닉층의 개수와 은닉층 노드의 개수, 과적합을 막기 위한 드롭아웃 비율을 달리하여 각 시간대별로 모형의 최적 구조를 도출하였다. 은닉층의 개수는 3, 5, 7로, 은닉층 노드의 개수는 16, 32, 64, 128, 256으로, 드랍아웃 비율은 0.2, 0.3, 0.5로 변화해가며 모형의 성능을 비교하였다.
은닉층의 개수와 은닉층 노드의 개수를 제외한 학습률(Learning rate), 학습횟수(Epoch), 활성화함수(Activation function), 손실함수(Loss function), 최적화함수(Optimizer)는 각 시간대별 모형에 동일하게 적용하였다. 이때, 활성화함수는 시그모이드(Sigmoid) 함수의 그라디언트(Gradient) 소실 문제를 해결할 수 있는 ReLU(Rectified Linear Unit) 함수를 사용하였으며, 손실함수는 회귀문제에서 주로 사용되는 MSE(Mean Square Error) 손실함수를 사용하였다.
5]와 같으며, 은닉층의 노드에서는 앞선 입력층에서 받은 정보와 가중치를 내적한 값을 출력하며, 이 출력값은 활성화함수를 거쳐 다음 은닉층으로 전달 여부가 결정된다. 이때 은닉층의 개수, 은닉층 노드의 개수, 활성화함수 등의 매개변수를 조정하여 최적 모형을 도출한다. 반면 회귀분석은 다양한 영향요인에 따른 영향력을 계량화하여 환승시간을 추정한다.
본 연구에서는 교통카드 이용자료를 활용하여 서울시의 지하철 역사별 버스 환승시간을 추정하였다. 환승 시간 추정을 위해 새로운 연구방법론인 딥러닝 기법을 활용하였으며, 전통적 추정방법인 회귀분석과 추정 결과를 비교분석하고자 하였다.
(2013)는 다항로짓모형을 이용하여 대구시의 환승교통수단선택모형을 구축하였다. 환승 유형은 버스-버스, 버스-지하철, 지하철-지하철, 버스-기타교통수단, 지하철-기타교통수단으로 구분하였으며, 독립변수로는 성별, 나이, 교통주체, 통행목적, 환승지역, 통행비율, 통행시간 변수를 사용하였다. 통행비용은 모든 환승유형에서 음의 영향을 주었으며, 통행시간은 지하철-지하철을 제외한 유형에서 양의 영향을 주는 것으로 나타났다.
Lee and Sohn(2015)은 Reversible-jump Markov Chain Monte Carlo 알고리즘을 기반으로 지하철 환승통행자들의 환승경로를 추정하였다. 환승경로는 이용량, 통행시간, 차내시간 등을 고려하여 다양한 경로를 추정하였으며, BIC(Bayesian Information Criterion)에 의해 추정된 기존 방법론과 비교하였다. 비교 결과, 기존모형에 비해 경로의 수, 평균 통행시간 등의 측면에서 추정력이 뛰어난 것으로 나타났다.
대상 데이터
Hwang(2014)은 대구시를 대상으로 다중회귀모형을 통해 버스와 지하철간 환승통행량에 영향을 미치는 요인을 분석하였다. 독립변수로는 지하철역별 연계버스 노선수, 환승시간, 지하철역의 공간적 위치, 지하철역과 연계되는 버스 노선의 특성을 반영한 버스노선의 연계지수를 사용하였다. 분석 결과, 버스노선의 연계지수와 지하철역 연계버스 노선수는 환승통행량에 양의 영향을 주었으나 환승시간은 음의 영향을 주었다.
수도권 통합 환승할인제에 따라 환승 유효시간은 30분(오후 9시~익일 오전 7시는 1시간)이며, 환승 유효시간과 환승 유효거리(도보 속도 4km/h 기준)를 벗어난 통행에 대해서는 이상치로 제거하였다. 또한 지하철 개찰구에서 출구로 나가 버스 정류장까지의 이동거리를 심층신경망 모형을 활용한 대중교통 이용자의 환승시간 추정에 관한 연구 36 한국ITS학회논문지 제19권, 제1호(2020년 2월) 고려하여 이상치를 제거하였으며, 이상치 제거 결과 총 564,570건에 대하여 분석을 수행하였다. [FIg.
먼저 서울시의 지하철 역사별 환승시간을 추정하기 위해 환승시간 및 대중교통 운영 자료, 토지이용 및 지역 관련 자료 등을 수집하였다. 수집자료는 2017년 5월 18일 목요일 기준이며, 교통카드 이용자료, 대중교통 기반정보자료, 서울시 토지이용정보, 건축물 연면적정보를 활용하였다.
먼저 서울시의 지하철 역사별 환승시간을 추정하기 위해 환승시간 및 대중교통 운영 자료, 토지이용 및 지역 관련 자료 등을 수집하였다. 수집자료는 2017년 5월 18일 목요일 기준이며, 교통카드 이용자료, 대중교통 기반정보자료, 서울시 토지이용정보, 건축물 연면적정보를 활용하였다. 교통카드 이용자료의 경우 환승시간이 기록되지 않는 지하철 간의 통행을 제외한 대중교통 환승통행은 2,020,962건으로 나타났으며, 이중 지하철→버스 환승통행은 718,130건으로 전체의 약 35.
지역 관련 변수로 지하철역 주변의 상업지역 면적, 판매 및 편의시설 연면적을 선정하였으며, 지하철역의 영향권인 반경 500m를 기준으로 면적을 산출하였다. 상업지역 면적은 평균 9.
심층신경망모형과 회귀모형은 동일한 변수를 사용하였으며, 모형의 추정 성능을 평가하기 위하여 데이터를 학습 세트와 검증 데이터 세트로 분할하였다. 학습 데이터 세트와 검증 데이터세트의 구분은 임의추출법(random sampling)을 통해 이뤄졌으며, 전체 284개 역사 중 227개 역사(80%)를 학습에 사용하였고, 나머지 57개 역사(20%)를 학습된 모형의 추정성능 평가에 사용하였다. 또한, 학습된 모형의 추정성능을 평가하기 위해 RMSE(Root Mean Square Error), %RMSE, MAE(Mean Absolute Error), MAPE(Mean Absolute Percentage Error) 지표를 사용하였다.
환승시간은 서울시 내 284개 지하철역을 기준으로 집계하였으며, 지하철역 2km 반경 내에 위치한 버스 정류장으로의 환승시간을 산정하였다. 환승시간 산정결과는 [Table 1]과 같다.
데이터처리
본 연구에서는 서울시 내 지하철 역사별 버스 환승시간을 추정하였다. 환승시간 추정에 있어 새로운 연구 방법론인 딥러닝 기법 중 심층신경망을 활용하였으며, 전통적인 회귀모형의 추정결과와 비교하였다.
모형구축을 위해 2017년 5월 18일 기준의 서울시 교통카드 이용자료와 대중교통 기반정보 자료, 서울시 토지이용정보 및 건축물 연면적 자료 등을 활용하여 환승시간 및 대중교통 운영 관련 변수, 토지이용 및 지역 관련 변수를 구축하였다. 환승시간 추정을 위해서는 회귀모형과 함께 딥러닝 기법 중 심층신경망 모형을 개발하였으며, 이들 모형의 성능을 RMSE, %RMSE, MAE, MAPE 지표를 통해 비교하였다.
이론/모형
이때, 활성화함수는 시그모이드(Sigmoid) 함수의 그라디언트(Gradient) 소실 문제를 해결할 수 있는 ReLU(Rectified Linear Unit) 함수를 사용하였으며, 손실함수는 회귀문제에서 주로 사용되는 MSE(Mean Square Error) 손실함수를 사용하였다. 또한 심층신경망에서 각 노드와 연결된 가중치를 조절하는 최적화함수는 Adam(Adaptive moment estimation)을 사용하였다. 심층신경망 모형의 학습에 대한 정보는 [Table 2]와 같다.
학습 데이터 세트와 검증 데이터세트의 구분은 임의추출법(random sampling)을 통해 이뤄졌으며, 전체 284개 역사 중 227개 역사(80%)를 학습에 사용하였고, 나머지 57개 역사(20%)를 학습된 모형의 추정성능 평가에 사용하였다. 또한, 학습된 모형의 추정성능을 평가하기 위해 RMSE(Root Mean Square Error), %RMSE, MAE(Mean Absolute Error), MAPE(Mean Absolute Percentage Error) 지표를 사용하였다.
본 연구에서는 환승시간 추정을 위해 전통적인 통계모형과 달리 새로운 연구방법론인 딥러닝 기법을 활용하였다. 이에 환승통행 특성과 관련된 연구와 함께 교통 분야에서 딥러닝 기법을 활용한 연구에 대해 살펴보았다.
은닉층의 개수와 은닉층 노드의 개수를 제외한 학습률(Learning rate), 학습횟수(Epoch), 활성화함수(Activation function), 손실함수(Loss function), 최적화함수(Optimizer)는 각 시간대별 모형에 동일하게 적용하였다. 이때, 활성화함수는 시그모이드(Sigmoid) 함수의 그라디언트(Gradient) 소실 문제를 해결할 수 있는 ReLU(Rectified Linear Unit) 함수를 사용하였으며, 손실함수는 회귀문제에서 주로 사용되는 MSE(Mean Square Error) 손실함수를 사용하였다. 또한 심층신경망에서 각 노드와 연결된 가중치를 조절하는 최적화함수는 Adam(Adaptive moment estimation)을 사용하였다.
성능/효과
또한 지하철 개찰구에서 출구로 나가 버스 정류장까지의 이동거리를 심층신경망 모형을 활용한 대중교통 이용자의 환승시간 추정에 관한 연구 36 한국ITS학회논문지 제19권, 제1호(2020년 2월) 고려하여 이상치를 제거하였으며, 이상치 제거 결과 총 564,570건에 대하여 분석을 수행하였다. [FIg. 1]과 [FIg. 2]의 시간대별 환승통행량 및 환승시간을 살펴보면 출근시간대(07~09시)와 퇴근시간대(18~20시)에 환승 통행이 집중되며, 출근시간대의 환승시간은 약 6.1분으로 다른 시간대에 비해 짧게 나타났다. 이는 출근시간대에는 대중교통 배차간격이 짧고 외적 요인에 영향을 덜 받기 때문인 것으로 판단된다.
이는 강동구가 상대적으로 주거지역이 높게 분포되어 있으며, 도심지역보다 지하철역이 적고 버스 배차간격도 길기 때문에 버스 환승시간이 증가하는 것으로 판단된다. 각 영향요인들의 표준화 계수를 살펴보면 버스 정류장까지의 거리가 가장 높게 나타나 버스 환승시간에 가장 큰 영향을 미치는 것으로 분석되었다.
버스 노선수는 시간대별로 다르지 않기 때문에 시간대별 구분 없이 구축하였다. 각 지하철역 환승이 가능한 버스 노선수는 평균 22.29개로 나타나며, 최소 2개, 최대 100개로 나타났다.
회귀모형을 활용한 버스 환승시간 추정결과는 [Table 4]와 같다. 각각의 버스 환승시간 추정모형을 살펴보면, 모형의 설명력을 나타내는 수정된 결정계수는 0.377~0.543으로 설명력이 충분한 것으로 분석되었다. 각 시간대별 환승시간 추정모형은 유사하게 나타났으며, 변수별 영향요인은 다음과 같다.
각 시간대별 환승시간 추정모형은 유사하게 나타났으며, 변수별 영향요인은 다음과 같다. 대중교통 운영 관련 변수 중 배차간격, 버스 정류장까지의 거리는 양의 영향력을 나타내어 지하철역 주변 버스의 배차간격이 길수록, 버스 정류장까지의 거리가 멀수록 버스 환승시간이 증가하는 것으로 분석되었다. 반대로 버스 노선수는 음의 영향력을 나타내어 지하철역 주변 버스 노선수가 많을수록 버스 환승시간이 짧아지는 것으로 분석되었다.
둘째, 개인에 대한 특성이 반영되지 않았다. 교통카드 이용자료에는 이용자의 연령, 성별 등에 대한 개인 속성이 기록되지 않기 때문에 모형에 개인적인 특성을 반영하기가 어려웠다.
이는 타시간대 보다 상대적으로 변동폭이 적은 출근시간대의 환승통행패턴의 예측력이 높음을 시사하고 있다. 또한 비첨두시간대를 제외한 모든 시간대에서 심층신경망 모형이 회귀모형보다 추정 성능이 더 높은 것으로 나타나 심층신경망 모형을 이용하여 환승시간을 추정하는 것이 보다 예측의 정확성을 높일 수 있을 것으로 판단된다. 추가적으로 대중교통 운영, 토지이용, 지역 특성 등의 관련 변수가 환승시간에 유의한 영향을 주는 것으로 분석되어, 향후 이들 요인을 고려한 대중교통 환승정책을 수립하는 것이 보다 효율적일 것이다.
통행비용은 모든 환승유형에서 음의 영향을 주었으며, 통행시간은 지하철-지하철을 제외한 유형에서 양의 영향을 주는 것으로 나타났다. 또한 환승유형선택에 대한 한계효과 분석을 수행하였는데, 총 통행시간이 증가할수록 버스-버스, 버스-지하철 환승 이용객들이 지하철-지하철 유형을 선택하는 것으로 분석되었다.
대중교통 운영 관련 변수 중 배차간격, 버스 정류장까지의 거리는 양의 영향력을 나타내어 지하철역 주변 버스의 배차간격이 길수록, 버스 정류장까지의 거리가 멀수록 버스 환승시간이 증가하는 것으로 분석되었다. 반대로 버스 노선수는 음의 영향력을 나타내어 지하철역 주변 버스 노선수가 많을수록 버스 환승시간이 짧아지는 것으로 분석되었다. 토지이용 관련 변수인 상업지역 면적, 판매 및 편의시설 연면적은 모두 양의 영향력을 나타내었다.
분석 결과, 업무시설면적 비율 및 백화점시설의 면적비가 높거나, 복합토지이용도가 높은 지역일수록 환승통행량이 많아지는 것으로 나타났다. 반면 인구밀도는 환승통행량에 음의 영향을 주는 것으로 나타났다.
05로 매우 작게 나타났다. 반면, 비첨두시간대의 경우 회귀모형의 RMSE가 2.84, 심층신경망의 RMSE가 3.05로 회귀모형의 추정 성능이 더 높은 것으로 나타났다. 전반적으로 심층신경망 모형이 회귀모형보다 추정 성능이 더 높게 나타났으나, 그 차이가 크지 않은 것은 심층신경망 모형이 284개 역사의 한정적인 데이터만을 학습하였기 때문인 것으로 판단된다.
독립변수로는 지하철역별 연계버스 노선수, 환승시간, 지하철역의 공간적 위치, 지하철역과 연계되는 버스 노선의 특성을 반영한 버스노선의 연계지수를 사용하였다. 분석 결과, 버스노선의 연계지수와 지하철역 연계버스 노선수는 환승통행량에 양의 영향을 주었으나 환승시간은 음의 영향을 주었다. 또한 지하철역이 환승수요가 더 많은 것으로 나타났다.
(2016)은 서울시를 대상으로 환승통행의 공간적 분포 등의 환승통행행태를 분석하고, 행정동 단위의 환승통행량과 토지이용의 관계를 규명하기 위해 다중회귀분석을 수행하였다. 분석 결과, 업무시설면적 비율 및 백화점시설의 면적비가 높거나, 복합토지이용도가 높은 지역일수록 환승통행량이 많아지는 것으로 나타났다. 반면 인구밀도는 환승통행량에 음의 영향을 주는 것으로 나타났다.
환승경로는 이용량, 통행시간, 차내시간 등을 고려하여 다양한 경로를 추정하였으며, BIC(Bayesian Information Criterion)에 의해 추정된 기존 방법론과 비교하였다. 비교 결과, 기존모형에 비해 경로의 수, 평균 통행시간 등의 측면에서 추정력이 뛰어난 것으로 나타났다.
셋째, 심층신경망 모형이 회귀모형에 비해 추정성능은 높았으나 그 차이가 크지는 않았는데, 이는 집계된 데이터를 활용하였기 때문이다. 본 연구에서는 서울특별시 284개 역의 집계된 환승시간을 추정하였기 때문에 전체 데이터의 개수가 284개에 불과하여 딥러닝을 통해 학습하고 검증하기에는 부족한 측면이 있다.
8%를 차지하고 있다. 시간대별 평균 환승시간 분포를 살펴보면 출근시간대에 평균 환승시간이 다른 시간대에 비해 짧게 나타났으며, 비첨두시간대에는 환승시간이 더 길게 나타났다. 이는 출근 시간대에 더 많은 버스가 운행하여 배차간격이 짧게 나타나고, 반대로 비첨두시간대에 배차간격이 길게 나타나기 때문인 것으로 판단된다.
실제 환승시간과 모형의 예측 환승시간 간의 MSE 값이 가장 작은 모형을 최적 모형으로 선택하였다. 시간대별로 선택된 모형을 살펴보면, 최종 모형의 [드롭아웃비율, 은닉층 개수, 은닉층 노드 개수]는 일일 모형의 경우 [0.2, 5, 64], 출근시간대 모형은 [0.3, 7, 16], 퇴근시간대 모형은 [0.2, 5, 128], 비첨두시간대 모형은 [0.3, 3, 64]로 선택되었다.
일일 모형의 경우 회귀모형의 RMSE는 1.78, 심층신경망 모형의 RMSE는 1.47로 심층신경망 모형이 0.31 낮게 나타나 다른 시간대의 모형에 비해 추정 성능 차이가 비교적 크게 나타났다. 출근시간대와 퇴근시간대 모두 심층신경망 모형의 추정 성능이 높았으나 RMSE 차이는 각 0.
대중교통 이용량 추정을 위해 정류장 인근의 건축물 연면적, 용도 등의 활동 관련 변수, 배차간격, 버스 노선수, 지하철 노선수, 통행시간 등의 수단 관련 변수를 고려하였다. 추정 결과, 정류장별로 추정한 모형보다 기종점별로 추정한 모형이 더 우수한 성능을 나타냈다. 이는 정류장별로 집계된 데이터에 비해 기종점별로 집계된 데이터의 양이 많기 때문인 것으로 판단하였다.
31 낮게 나타나 다른 시간대의 모형에 비해 추정 성능 차이가 비교적 크게 나타났다. 출근시간대와 퇴근시간대 모두 심층신경망 모형의 추정 성능이 높았으나 RMSE 차이는 각 0.01, 0.05로 매우 작게 나타났다. 반면, 비첨두시간대의 경우 회귀모형의 RMSE가 2.
반대로 버스 노선수는 음의 영향력을 나타내어 지하철역 주변 버스 노선수가 많을수록 버스 환승시간이 짧아지는 것으로 분석되었다. 토지이용 관련 변수인 상업지역 면적, 판매 및 편의시설 연면적은 모두 양의 영향력을 나타내었다. 지하철역에서 버스로 환승 시 지하철역 인근이 상업지역으로 지정되어 관련 시설이 많거나 판매 및 편의시설이 많을수록 환승도중에 쇼핑 활동 등을 유발시켜 버스 환승시간이 더 증가하는 것으로 분석된다.
환승 유형은 버스-버스, 버스-지하철, 지하철-지하철, 버스-기타교통수단, 지하철-기타교통수단으로 구분하였으며, 독립변수로는 성별, 나이, 교통주체, 통행목적, 환승지역, 통행비율, 통행시간 변수를 사용하였다. 통행비용은 모든 환승유형에서 음의 영향을 주었으며, 통행시간은 지하철-지하철을 제외한 유형에서 양의 영향을 주는 것으로 나타났다. 또한 환승유형선택에 대한 한계효과 분석을 수행하였는데, 총 통행시간이 증가할수록 버스-버스, 버스-지하철 환승 이용객들이 지하철-지하철 유형을 선택하는 것으로 분석되었다.
버스 정류장까지의 거리도 지하철역으로부터 2km 반경 내에 위치한 버스 정류장까지의 거리를 환승통행량으로 가중 평균하여 산정하였다. 평균 버스 정류장까지의 거리는 일일 기준 162.26m, 출근시간대 148.69m, 퇴근시간대 164.10m, 비첨두시간대 161.98m로 환승시간, 버스 배차간격과 마찬가지로 출근시간대에 가장 짧은 것으로 나타났다. 버스 노선수는 시간대별로 다르지 않기 때문에 시간대별 구분 없이 구축하였다.
환승시간 산정결과는 [Table 1]과 같다. 평균 환승시간은 일일 기준 약 8.65분, 출근시간대 6.66분, 퇴근시간대 9.04분, 비첨두시간대 9.34분으로 출근시간대에 환승시간이 가장 짧은 것으로 나타났다. 표준편차 역시 출근시간대에 1.
4]와 같이 나타난다. 평균 환승시간이 10분을 초과하는 지하철역은 서울역, 종각역, 용산역, 명동역 등 서울 중심부와 잠원역, 잠실나루역, 고덕역, 마천역 등 동남부 지역으로 대부분이 지하철역과 버스 정류장 간의 거리가 멀고, 유동인구가 많은 지역인 것으로 나타났다.
Lim(2017)은 서울시 2013년 교통카드 이용자료를 활용하여 환승통행행태를 분석하였으며, 시간대별 환승시간에 영향을 미치는 요인에 대하여 규명하기 위해 다중회귀분석을 수행하였다. 환승시간에는 지하철역과 버스 정류장사이의 거리, 버스 배차간격의 변동성(CV), 상업지역 면적, 도소매업 사업체수, 판매시설 연면적이 양의 영향력을 미치고, 버스 노선수는 음의 영향력을 미치는 것으로 나타났다.
구축한 회귀모형과 심층신경망 모형의 추정 성능은 [Table 5]와 같다. 회귀모형과 심층신경망 모형 모두 출근시간대의 RMSE가 각각 1.04, 1.03으로 모형의 추정 성능이 가장 높았으며, 비첨두시간대의 RMSE가 각 2.84, 3.05로 추정 성능이 가장 낮게 나타났다.
543으로 설명력이 충분한 것으로 나타났다. 회귀모형과 심층신경망 모형의 추정 성능을 비교한 결과, 두 가지 모형 모두 출근시간대 모형이 추정 성능이 가장 높았으며, 비첨두시간대 모형이 가장 낮은 것으로 나타났다. 이는 타시간대 보다 상대적으로 변동폭이 적은 출근시간대의 환승통행패턴의 예측력이 높음을 시사하고 있다.
회귀모형과 심층신망 모형의 추정 성능을 시간대별로 비교하면, 비첨두시간대를 제외하면 모든 시간대에서 심층신경망의 RMSE, %RMSE, MAE, MAPE 지표가 가장 낮은 것으로 평가되어 심층신경망 모형이 회귀모형보다 좀 더 높은 추정 성능을 보였다.
먼저 심층신경망 모형은 드롭아웃 비율, 은닉층의 개수, 은닉층 노드의 개수를 달리하여 각 시간대별로 최적의 모형을 구축하였다. 회귀분석 모형도 각 시간대별 수정된 결정계수는 0.377~0.543으로 설명력이 충분한 것으로 나타났다. 회귀모형과 심층신경망 모형의 추정 성능을 비교한 결과, 두 가지 모형 모두 출근시간대 모형이 추정 성능이 가장 높았으며, 비첨두시간대 모형이 가장 낮은 것으로 나타났다.
후속연구
또한, 공간적 범위가 서울시로 한정되어 있어 시도간을 오가는 광역버스 등의 환승패턴이 반영되었다고 보기 어렵다. 따라서 향후에는 공간적 범위를 수도권으로 확대하며, 일일 이용자료가 아닌 일주일 이상의 자료를 활용하여 시계열적 특성을 반영해야 할 것이다.
본 연구에서는 서울특별시 284개 역의 집계된 환승시간을 추정하였기 때문에 전체 데이터의 개수가 284개에 불과하여 딥러닝을 통해 학습하고 검증하기에는 부족한 측면이 있다. 따라서, 환승시간 추정의 관점에서 볼 때 역별로 집계된 데이터가 아닌 개인 속성을 포함한 개별 통행 데이터를 활용한다면 보다 정밀한 추정이 가능할 것으로 판단된다.
또한 비첨두시간대를 제외한 모든 시간대에서 심층신경망 모형이 회귀모형보다 추정 성능이 더 높은 것으로 나타나 심층신경망 모형을 이용하여 환승시간을 추정하는 것이 보다 예측의 정확성을 높일 수 있을 것으로 판단된다. 추가적으로 대중교통 운영, 토지이용, 지역 특성 등의 관련 변수가 환승시간에 유의한 영향을 주는 것으로 분석되어, 향후 이들 요인을 고려한 대중교통 환승정책을 수립하는 것이 보다 효율적일 것이다.
교통카드 이용자료에는 이용자의 연령, 성별 등에 대한 개인 속성이 기록되지 않기 때문에 모형에 개인적인 특성을 반영하기가 어려웠다. 하지만 이용자의 연령과 성별 등이 환승시간에 유의미한 영향을 줄 수 있으므로 향후 개인적인 특성을 반영할 수 있는 방안에 대한 고려가 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
인공신경망이 침체기를 맞은 이유는?
딥러닝의 대표적인 방법론 중 하나인 인공신경망은 인간의 뇌의 정보처리 및 전달과정을 수학적인 측면에서 관찰하여 시뮬레이션한 것으로 1943년 Warren McCulloch와 Walter Pitts에 의해 처음 제안되었다. 하지만 제안된 인공신경망이 단순한 XOR 분류문제도 해결하지 못하는 것이 수학적으로 증명됨에 따라 인공신경망 연구는 침제기를 맞는다. 이후 1980~1990년도에 다층 인공신경망을 통해 XOR 분류 문제를 해결하면서 활발한 연구가 진행되었으나, 당시에는 음성, 언어, 영상과 같은 신호에 대한 식별의 어려움과 당시 학습 알고리즘은 인공신경망의 학습시간에 현실적이지 않다는 한계가 있었다(Deng and Yu, 2014).
인공신경망은 무엇인가?
딥러닝의 대표적인 방법론 중 하나인 인공신경망은 인간의 뇌의 정보처리 및 전달과정을 수학적인 측면에서 관찰하여 시뮬레이션한 것으로 1943년 Warren McCulloch와 Walter Pitts에 의해 처음 제안되었다. 하지만 제안된 인공신경망이 단순한 XOR 분류문제도 해결하지 못하는 것이 수학적으로 증명됨에 따라 인공신경망 연구는 침제기를 맞는다.
인공신경망 기법을 활용하여 정류장별, 기종점별 대중교통 이용량을 추정한 결과는?
대중교통 이용량 추정을 위해 정류장 인근의 건축물 연면적, 용도 등의 활동 관련 변수, 배차간격, 버스 노선수, 지하철 노선수, 통행시간 등의 수단 관련 변수를 고려하였다. 추정 결과, 정류장별로 추정한 모형보다 기종점별로 추정한 모형이 더 우수한 성능을 나타냈다. 이는 정류장별로 집계된 데이터에 비해 기종점별로 집계된 데이터의 양이 많기 때문인 것으로 판단하였다.
참고문헌 (20)
Baek J. H. and Sohn K. M.(2017), "Deep-Learning Architectures to Forecast Bus Ridership at the Stop and Stop-To-Stop Levels for Dense and Crowded Bus Networks," Applied Artificial Intelligence, vol. 30, no. 9, pp.861-885.
Duan Y., Lv Y., Liu Y. and Wang F.(2016), "An efficient realization of deep learning for traffic data imputation," Transportation Research Part C, vol. 72, pp.168-181.
Han G. I. and Sohn K. M.(2016), "Activity imputation for trip-chains elicited from smart-card data using a continuous hidden Markov model," Transportation Research Part B, vol. 83, pp.121-135.
Huang W., Hong H., LI M. and Hu W.(2013), "Deep Architecture for Traffic Flow Prediction," ADMA2013, vol. 8347, no. 2, pp.165-176.
Hwang J. H.(2014), "Analyzing Factors Affecting Public Transit Transfer Volume: Focused on Daegu City," Journal of Korean Society of Transportation, vol. 32, no. 3, pp.179-186.
Jang W. J.(2010), "Travel Time and Transfer Analysis Using Trnasit Smart Card Data," Transportation Research Record: Journal of the Transportation Research Board, vol. 2144, pp.142-149.
Jung J. Y. and Sohn K. M.(2017). "Deep-learning architecture to forecast destinations of bus passengers from entry-only smart-card data," The Institution of Engineering and Technology, vol. 11, no. 6, pp.334-339.
Lee M. S. and Sohn K. M.(2015), "Inferring the Route-Use Patterns of Metro Passengers Based Only on Travel-Time Data Within a Bayesian Framework Using a Reversible-Jump Markov Chain Monte Carlo(MCMC) Simulation," Transportation Research Part B, vol. 81, pp.1-17.
Lee S. H., Kim J. S., Kim M. S. and Woo Y. H.(2013), "A Study on Users' Travel Behavior Analysis of Transit Transfer," The Journal of The Korea Institute of Intelligent Transport Systems, vol. 12, no. 12, pp.147-157.
Lim S. Y.(2017), Exploring the Relationship between Transfer Trips and Land Use, Masters dissertation, Hongik University, Korea.
Lim S. Y., Lee H. S. and Choo S. H.(2016), "Analysis of Influencing Factors on Transfer Time of Public Transportation in Seoul-Focusing on Transfer Users from Subway to Bus," The Journal of The Korea Institute of Intelligent Transport Systems, vol. 15, no. 2, pp.1-12.
Lv Y., Duan Y., Kang W., Li Z. and Wang F.(2015), "Traffic Flow Prediction With Big Data: A Deep Learning Approach," IEEE Transactions on Intelligent Transportation System, vol. 16, no. 2, pp.865-873.
Ma X., Tao Z., Wang Y., Yu H. and Wang Y.(2015), "Long Short-Term Memory Neural Network for Traffic Speed Prediction Using Remote Microwave Sensor Data," Transportation Research Part C, vol. 54, pp.187-197.
Ma X., Yu H., Wang Y. and Wang Y.(2015), "Large-Scale Transportation Network Congestion Evolution Prediction Using Deep Learning Theory," PLoS One, vol. 10, no. 3, pp.1-17.
Ministry of Land, Infrastructure and Transport(2018), Public Transportation Investigation 2018, p.14.
Polson N. G. and Sokolov V. O.(2017) "Deep learning for short-term traffic flow prediction," Transportation Research Part C, vol. 79, pp.1-17.
Ryu J. D. and Yoon I. S.(2018), Development of Expressway Traffic Accident Prediction Model Using Deep Learning, Doctoral dissertation, Ajou University, Korea.
Seoul Solution, https://www.seoulsolution.kr, 2018.4.18.
Xiong G., Kang W., Wang F., Zhu F., Lv Y., Dong X., Riekki J. and Pirttikangas S.(2015), "Continuous Travel Time Prediction for Transit Signal Priority Based on a Deep Network," IEEE 18th International Conference, pp.524-528.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.