버스정보 시스템을 이용하는 시민들은 더 정확한 예측 정보를 원한다. 하지만 평균 기반 단기간 예측 알고리즘을 사용하는 대부분의 버스정보시스템에서는 교통흐름, 신호주기, 정차시간 등의 영향이 고려되지 않기 때문에 많은 오차를 포함하고 있는 실정이다. 따라서 본 논문에서는 오차의 영향요인 분석을 통해 예측정보의 정밀도를 향상시켜 시민들의 편의를 도모하고자 한다. 이에 현재 운영되고 있는 버스정보 시스템의 자료를 토대로 오차의 영향요인을 분석했다. 분석 데이터에서 시간대별 특성과 지리적 여건에 의한 영향이 복합적으로 나타나고, 정차시간과 단위구간속도에 미치는 영향도가 다름을 보였다. 이에 따라 정차시간은 일반화 가법 모형을 사용하여 시간, GPS 좌표, 통과 노선수의 설명변수로 패턴을 구축하고, 단위구간에 대해 은닉 마르코프 모델을 사용하여 교통흐름에 따른 영향도를 고려한 패턴을 구축했다. 패턴 구축의 결과로 정밀한 실시간예측이 가능하고, 노선 통행속도의 장기간 예측이 가능했다. 마지막으로 관측 데이터와 예측 데이터의 통계적 검정 과정을 통해 전구간 예측에 적합한 모델임을 보였다. 본 논문의 결과로 시민들에게 더 정확한 예측 정보를 제공하고, 장기간 예측은 배차시간 등의 의사결정에 중요한 역할을 수행할 수 있으리라 생각한다.
버스정보 시스템을 이용하는 시민들은 더 정확한 예측 정보를 원한다. 하지만 평균 기반 단기간 예측 알고리즘을 사용하는 대부분의 버스정보시스템에서는 교통흐름, 신호주기, 정차시간 등의 영향이 고려되지 않기 때문에 많은 오차를 포함하고 있는 실정이다. 따라서 본 논문에서는 오차의 영향요인 분석을 통해 예측정보의 정밀도를 향상시켜 시민들의 편의를 도모하고자 한다. 이에 현재 운영되고 있는 버스정보 시스템의 자료를 토대로 오차의 영향요인을 분석했다. 분석 데이터에서 시간대별 특성과 지리적 여건에 의한 영향이 복합적으로 나타나고, 정차시간과 단위구간속도에 미치는 영향도가 다름을 보였다. 이에 따라 정차시간은 일반화 가법 모형을 사용하여 시간, GPS 좌표, 통과 노선수의 설명변수로 패턴을 구축하고, 단위구간에 대해 은닉 마르코프 모델을 사용하여 교통흐름에 따른 영향도를 고려한 패턴을 구축했다. 패턴 구축의 결과로 정밀한 실시간예측이 가능하고, 노선 통행속도의 장기간 예측이 가능했다. 마지막으로 관측 데이터와 예측 데이터의 통계적 검정 과정을 통해 전구간 예측에 적합한 모델임을 보였다. 본 논문의 결과로 시민들에게 더 정확한 예측 정보를 제공하고, 장기간 예측은 배차시간 등의 의사결정에 중요한 역할을 수행할 수 있으리라 생각한다.
Citizens want more accurate forecast information using Bus Information System. However, most bus information systems that use an average based short-term prediction algorithm include many errors because they do not consider the effects of the traffic flow, signal period, and halting time. In this pa...
Citizens want more accurate forecast information using Bus Information System. However, most bus information systems that use an average based short-term prediction algorithm include many errors because they do not consider the effects of the traffic flow, signal period, and halting time. In this paper, we try to improve the precision of forecast information by analyzing the influencing factors of the error, thereby making the convenience of the citizens. We analyzed the influence factors of the error using BIS data. It is shown in the analyzed data that the effects of the time characteristics and geographical conditions are mixed, and that effects on halting time and passes speed is different. Therefore, the halt time is constructed using Generalized Additive Model with explanatory variable such as hour, GPS coordinate and number of routes, and we used Hidden Markov Model to construct a pattern considering the influence of traffic flow on the unit section. As a result of the pattern construction, accurate real-time forecasting and long-term prediction of route travel time were possible. Finally, it is shown that this model is suitable for travel time prediction through statistical test between observed data and predicted data. As a result of this paper, we can provide more precise forecast information to the citizens, and we think that long-term forecasting can play an important role in decision making such as route scheduling.
Citizens want more accurate forecast information using Bus Information System. However, most bus information systems that use an average based short-term prediction algorithm include many errors because they do not consider the effects of the traffic flow, signal period, and halting time. In this paper, we try to improve the precision of forecast information by analyzing the influencing factors of the error, thereby making the convenience of the citizens. We analyzed the influence factors of the error using BIS data. It is shown in the analyzed data that the effects of the time characteristics and geographical conditions are mixed, and that effects on halting time and passes speed is different. Therefore, the halt time is constructed using Generalized Additive Model with explanatory variable such as hour, GPS coordinate and number of routes, and we used Hidden Markov Model to construct a pattern considering the influence of traffic flow on the unit section. As a result of the pattern construction, accurate real-time forecasting and long-term prediction of route travel time were possible. Finally, it is shown that this model is suitable for travel time prediction through statistical test between observed data and predicted data. As a result of this paper, we can provide more precise forecast information to the citizens, and we think that long-term forecasting can play an important role in decision making such as route scheduling.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 버스정보시스템에서 수집되는 데이터에 영향을 미치는 요인을 분석하고 제약사항을 극복하는 두 개의 모형을 제시했다. 또한, 모형의 정규성을 검증하고 최종모형의 유의성 검정을 통해 모델의 예측력을 보였다.
제안 방법
또한 버스의 고장으로 인한 대기, 시간동기화 오류 등의 시스템 문제 등에 의한 이상치가 나타난다. 각 노드별 정차시간 데이터의 사분위 범위(inter quartile range; IQR)를 계산하고 3사분위수(75%) + 1.5 X IQR 보다 크면 이상치로 판단하여 제거했다[9-12].
링크의 거리 데이터는 모두 상이하다. 구간마다 공통의 속성을 적용하기 위하여 출발/도착 데이터의 시간차를 구하고 기반정보의 구간거리로 속도(km/h)로 변환했다.
본 논문에서 버스정보 시스템의 운행시간 예측은 두가지 모델로 적합(fitting) 되었다. 첫 번째로 정차시간 예측을 위해 일반화 가법 모형을 이용했다.
본 논문에서는 2015년 한해 수집된 순천시 버스 정보 시스템의 데이터를 이용하여 구간 통행속도 예측 방법으로 은닉 마르코프 모델을 사용하고, 정차시간 예측을 위해 일반화 가법모형을 사용한 혼합 모델을 구축했다.
모수가 3(M=3)인 경우 AIC와 BIC가 최소이며 모수가 4(M=4)인 경우와 비교해 –logL값의 차이가 크지 않다. 본 논문에서는 3개의 상태를 가진 은닉 마르코프 모델을 사용하여 구간의 속도를 예측한다.
일반화 가법 모형은 반응변수의 분포와 연결 함수(link function)의 정의에 따라 다양한 형태의 모형을 적합할 수 있다. 비모수적 특징을 갖는 정차시간 데이터의 분포에 따라 로그함수를 연결함수로 사용했으며 반응변수의 분포는 포아송 분포(Poisson distribution)로 모델을 적합(fitting)했다.
구간 속도 분포는 평균을 중심으로 양측에 동일한 분산을 가지는 가우시안 분포로 특징을 표현하기는 어렵다. 이러한 과정에서 복수개의 가우시안 분포들의 합으로 구성되는 혼합모델을 고려했다.
또한 추후 노선의 변경이나 노선의 추가삭제에 의해 요인변수가 변경되며 전체 변수들과 계수들의 재계산이 요구된다. 이러한 문제를 해결하기 위해 정류장별로 수집된 데이터의 3사분위수를 구하고 범주형으로 변환 후 요인변수로 이용했다.
19는 누적 관측데이터와 누적 예측데이터의 비교 도표이다. 회색은 관측데이터이며, 운행일은 2015년 6월 16일 화요일이며 운행시간은 20시 30분부터 21시 20분까지 총 50분을 운행했다. 검정색은 출발시간을 기준으로 한 예측 데이터이다.
20은 누적 관측데이터와 누적 예측데이터의 비교 도표이다. 회색은 관측데이터이며, 운행일은 2015년 7월 23일 목요일이며 운행시간은 17시 36분부터 18시 30분까지 총 54분을 운행했다. 관측 데이터와 예측 데이터사이 산포(dispersion)의 차이를 비교하기 위해 F-검정을 수행했다.
대상 데이터
본 논문에서 사용된 데이터는 전라남도 순천시의 버스정보 시스템 데이터이다. 출/퇴근시간대의 영향력, 신호주기, 버스전용차선 운행여부 등의 조건이 비슷한 인근지역(광양, 여수 등)의 데이터에도 유의한 결과를 도출하는지에 대한 연구가 필요하다.
본 논문에서 사용된 자료는 분석 대상 도시 버스정보시스템의 2015년 실제 운행 노선에서 수집된 데이터이다. 수집된 데이터의 정류장은 2298개소이며 데이터의 이상치 (outlier)를 포함한 평균 정류장 정차시간은 26초이다.
본 논문에서 사용된 자료는 분석 대상 도시 버스정보시스템의 2015년 실제 운행 노선에서 수집된 데이터이다. 수집된 데이터의 정류장은 2298개소이며 데이터의 이상치 (outlier)를 포함한 평균 정류장 정차시간은 26초이다. 하나의 노선은 최소 5개 이상의 정류장을 통과하며 순환노선의 경우 최대 149개의 정류장을 통과한다.
데이터처리
회색은 관측데이터이며, 운행일은 2015년 7월 23일 목요일이며 운행시간은 17시 36분부터 18시 30분까지 총 54분을 운행했다. 관측 데이터와 예측 데이터사이 산포(dispersion)의 차이를 비교하기 위해 F-검정을 수행했다.
Table 7은 관측데이터와 예측 데이터의 표준편차와 평균이다. 등분산성을 만족하는 관측 데이터와 예측 데이터 사이의 유의성을 확인하기 위해 T-검정을 이용했다.
본 논문에서는 버스정보시스템에서 수집되는 데이터에 영향을 미치는 요인을 분석하고 제약사항을 극복하는 두 개의 모형을 제시했다. 또한, 모형의 정규성을 검증하고 최종모형의 유의성 검정을 통해 모델의 예측력을 보였다.
분산분석은 관측 데이터와 모델링 데이터 사이의 분산 비교를 통해 계산된 통계량으로 유의성을 검정하는 방법이다. 반응변수의 비모수적 특성에 따라 카이제곱 분포를 이용하여 계산된 통계량과 유의확률을 보인다. 유의수준 5%에서 모든 변수가 매우 작은 값으로 나타나고 있으며 사용된 변수 모두 매우 유의한 설명변수임을 보인다.
이론/모형
첫 번째로 정차시간 예측을 위해 일반화 가법 모형을 이용했다. 두 번째로 구간 통행속도 예측을 위해 은닉 마르코프 모델을 이용했다. 정차시간 모델은 정류장별로 별도의 테이블 구축 필요성이 없는 모델로 범주형 변수와 설명변수로 추정된 모델을 이용하여 주중과 주말의 정차시간을 예측한다.
정차시간과 통행속도 예측의 정확도를 높이기 위해 정차 시간 모델링에는 일반화 가법모형을 사용하고, 통행속도 예측은 은닉 마르코프 모델을 사용했다. 일반화 가법모형은 설명변수의 영향력을 고려하고, 정류장별 테이블의 구성이 필요하지 않은 정차시간 패턴에 적합한 모델임을 보였다.
본 논문에서 버스정보 시스템의 운행시간 예측은 두가지 모델로 적합(fitting) 되었다. 첫 번째로 정차시간 예측을 위해 일반화 가법 모형을 이용했다. 두 번째로 구간 통행속도 예측을 위해 은닉 마르코프 모델을 이용했다.
성능/효과
9이다. 두 결과 모두 신뢰구간이 0을 포함하고 유의수준 5%에서 관측 데이터와 예측데이터 사이의 동질성 가설을 지지하는 매우 유의한 결과이다.
반응변수의 비모수적 특성에 따라 카이제곱 분포를 이용하여 계산된 통계량과 유의확률을 보인다. 유의수준 5%에서 모든 변수가 매우 작은 값으로 나타나고 있으며 사용된 변수 모두 매우 유의한 설명변수임을 보인다.
정차시간과 통행속도 예측의 정확도를 높이기 위해 정차 시간 모델링에는 일반화 가법모형을 사용하고, 통행속도 예측은 은닉 마르코프 모델을 사용했다. 일반화 가법모형은 설명변수의 영향력을 고려하고, 정류장별 테이블의 구성이 필요하지 않은 정차시간 패턴에 적합한 모델임을 보였다.
후속연구
분석 대상 도시의 정류장은 2298개소로 각 정류장별 특징 반영을 위해 요인변수로 정류장 고유번호를 이용하기에는 시스템의 부하에 미치는 영향이 매우 크다. 또한 추후 노선의 변경이나 노선의 추가삭제에 의해 요인변수가 변경되며 전체 변수들과 계수들의 재계산이 요구된다. 이러한 문제를 해결하기 위해 정류장별로 수집된 데이터의 3사분위수를 구하고 범주형으로 변환 후 요인변수로 이용했다.
본 논문에서 사용된 데이터는 전라남도 순천시의 버스정보 시스템 데이터이다. 출/퇴근시간대의 영향력, 신호주기, 버스전용차선 운행여부 등의 조건이 비슷한 인근지역(광양, 여수 등)의 데이터에도 유의한 결과를 도출하는지에 대한 연구가 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
버스 정보 시스템의 역할은?
버스 정보 시스템(BIS)은 GPS가 포함된 차내 장치(OBE)를 통해 차량으로부터 수신된 정보를 노선, 통과구간, 정류장 등의 기반정보로 가공하여 시민들에게 버스 도착 예정 시간과 버스의 현재위치 등의 정보를 제공한다. 버스 도착시간 예측 정보 제공은 대중교통의 편의성 개선에 능동적인 역할을 수행하고 있다[1-3].
일반적인 버스 도착시간 예측 시스템의 문제점은?
일반적으로 버스정보 시스템에 사용되는 예측 모형은 도로의 교통흐름, 신호주기, 이상 상황, 데이터 결측 등의 상황을 고려하지 않은 모델이다. 또한 시스템에서 수집되는 데이터는 시간정보와 위치, 거리 등의 기반정보에 의존하여 계산된 단순 데이터로 교통흐름과 신호주기를 반영하여 모델링을 수행하기는 매우 어렵다. 은닉 마르코프 모델은 관측데이터에 은닉된 상태의 요소가 포함된다고 가정하고 데이터 순서의 확률을 계산하여 관찰된 결과로 은닉상태를 도출하는 모델이다.
버스 도착시간 예측을 위한 대표적인 방법에는 어떤 것들이 있는가?
버스 도착시간 예측 정보 제공은 대중교통의 편의성 개선에 능동적인 역할을 수행하고 있다[1-3]. 버스 도착시간 예측을 위한 대표적인 방법으로는 이동평균필터, 동적 선형 모형, 회귀 모형 등의 기법이 있으며 구간별로 계산된 데이터 테이블을 이용하는 방법이다[2, 3].
참고문헌 (17)
H. G. Kim, C. Y. Park, D. C. Shin, C. S. Shin, Y. Y. Cho, and J. W. Park, "A Study on Traffic Analysis Using Bus Information System," The KIPS Transactions on Computer and Communication Systems, Vol.5, No.9, pp.261-267, 2016.
H. G. Kim, C. Y. Park, C. S. Shin, Y. Y. Cho, and J. W. Park, "Time Series Analysis for Traffic Flow Using Dynamic Linear Model," The KIPS Transactions on Computer and Communication Systems, Vol.6, No.4, pp.179-188, 2017.
C. Y. Park, H. G. Kim, C. S. Shin, Y. Y. Cho, and J. W. Park, "Arrival Time Estimation for Bus Information System Using Hidden Markov Model," The KIPS Transactions on Computer and Communication Systems, Vol.6, No.4, pp. 189-196, 2017.
S. H. Lee, B. S. Moon, and B. J. Park, "The Bus Arrival Time Prediction using Bus Delay Time," Journal of Korean Society of Transportation, Vol.28, No.1, pp.125-134, Feb., 2010.
Liu. H, "Generalized Additive Model. Ph.D." Thesis, University of Minnesota Duluth, Duluth, MN, USA, 2008.
M. J. Choo, "A Study on the Application of Generalized Additive Model in predicting customer churn of the mobile phone company," Master thesis, Ewha Womans Univ., Korea, 2011.
L. R. RABINER, "A tutorial on Hidden Markov Models and Selected Applications in Speech Recognition," Proceedings of the IEEE, Vol.77, No.2, Feb., 1989.
I. Visser. "Seven things to remember about hidden Markov models: A tutorial on Markovian models for time series," Journal of Mathematical Psychology, Vol.55, pp.403-415, Jul., 2011.
S. H. Lee, B. S. Moon, and B. J. Park, "The Bus Arrival Time Prediction using Markov Chain," The Journal of The Korea Institute of Intelligent Transport Systems, Vol.8, No.3, pp. 1-10, Jun., 2009.
B. S. Choi, H. C. Kang, S, K, Lee, and S. T. Han, "A Study for Traffic Forecasting Using Traffic Statistic Information," The Korean Journal of Applied Statistics, Vol.22, No.6, pp. 1177-1190, Oct., 2009.
T. G. Kim, H. C. Ahn, and S. G. Kim, "Predictive Modeling of the Bus Arrival Time on the Arterial using Real-Time BIS Data," Journal of The Korean Society of Civil Engineers, Vol.29, No.1, pp.1-9, Jan., 2009.
Y. Y. Lee, "A Study on Estimate to Link Travel Time Using Traveling Data of Bus Information System," Journal of Korean Society of Transportation, Vol.30, No.3, pp.241-246, 2010.
B. Portugais and M. Khanal, "State-Space Models With Kalman Filtering for Freeway Traffic Forecasting," International Journal of Modern Engineering, Vol.15, No.1, pp.11-14, 2014.
G. Petris, and S. Petrone, "State Space Models in R," Journal of Statistical Software, Vol.41, No.4, pp.1-25, 2011,
G. Petris, S. Petrone, and P. Campagnoli, "Dynamic Linear Models with R," Springer Science Business Media, 2009.
Indrabayu, R. Y. Bakti, I. S. Areni, and A. A. Prayogi, "Vehicle detection and tracking using Gaussian Mixture Model and Kalman Filter," 2016 International Conference on Computational Intelligence and Cybernetics, pp.115-119, Nov., 2016.
C. Zeng and W. Li, "Application of Extended Kalman Filter for tracking high dynamic GPS signal," 2016 IEEE International Conference on Signal and Image Processing (ICSIP), pp.503-507, Aug., 2016.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.