본 연구는 불특정 다수의 도로이용자들이 경로우회 시 갖는 의사결정과정속에 내포된 비선형성과 불확실성을 고려한 정도 있는 모형구축으로 주요 우회결정요인을 분석하는 것이 주요 목적이다. 이를 위하여 고속도로 및 국도를 이용하는 운전자를 대상으로 우회여부에 관련된 SP조사를 실시하였고, 조사결과에 대하여 의사결정나무와 신경망이론의 결합된 모형을 구축하여 운전자 우회결정요인을 분석하였다. 분석결과 운전자 우회여부결정에 영향을 미치는 요인은 우회도로 인지여부, 교통정보 신뢰도 및 이용빈도, 경로전환빈도, 나이순으로 나타났다. 또한 오분류표를 통한 기존 모형과의 예측력의 비교결과 결합된 모형의 오분류율이 8.7%로 기존 모형인 로짓모형 12.8%, 의사결정나무 단독 모형 13.8%와 비교했을 때 가장 예측력이 높은 것으로 나타나 운전자 우회결정요인 분석에 관한 모형의 적용 타당성을 확인할 수 있었다. 본 연구의 결과는 향후 교통량 분산효과와 도로망 효율 증대를 위한 효과적인 우회관리전략 수립 시 기초 자료로 활용가능하리라 사료된다.
본 연구는 불특정 다수의 도로이용자들이 경로우회 시 갖는 의사결정과정속에 내포된 비선형성과 불확실성을 고려한 정도 있는 모형구축으로 주요 우회결정요인을 분석하는 것이 주요 목적이다. 이를 위하여 고속도로 및 국도를 이용하는 운전자를 대상으로 우회여부에 관련된 SP조사를 실시하였고, 조사결과에 대하여 의사결정나무와 신경망이론의 결합된 모형을 구축하여 운전자 우회결정요인을 분석하였다. 분석결과 운전자 우회여부결정에 영향을 미치는 요인은 우회도로 인지여부, 교통정보 신뢰도 및 이용빈도, 경로전환빈도, 나이순으로 나타났다. 또한 오분류표를 통한 기존 모형과의 예측력의 비교결과 결합된 모형의 오분류율이 8.7%로 기존 모형인 로짓모형 12.8%, 의사결정나무 단독 모형 13.8%와 비교했을 때 가장 예측력이 높은 것으로 나타나 운전자 우회결정요인 분석에 관한 모형의 적용 타당성을 확인할 수 있었다. 본 연구의 결과는 향후 교통량 분산효과와 도로망 효율 증대를 위한 효과적인 우회관리전략 수립 시 기초 자료로 활용가능하리라 사료된다.
This study's purpose is to analyse factors of determination about detouring for makinga standard model in regard of unfavorableness and uncertainty when unspecified individual recipients make a decision at the time of course detour. In order to achieve this, we surveyed SP investigation whether maki...
This study's purpose is to analyse factors of determination about detouring for makinga standard model in regard of unfavorableness and uncertainty when unspecified individual recipients make a decision at the time of course detour. In order to achieve this, we surveyed SP investigation whether making a detour or not for drivers as a target who take a high way and National highway. Based on this result, we analysed detour determination factors of drivers, establishing a combination model of Decision Tree and Neural Network model. The result demonstrates the effected factors on drivers' detour determination are in ordering of the recognition of alternative routevs, reliable and frequency of using traffic information, frequency of transition routes and age. Moreover, from the outcome in comparison with an existing model and prediction through undistributed data, the rate of combination model 8.7% illustrates the most predictable way in contrast with logit model 12.8%, and Individual Model of Decision Tree 13.8% which are existed. This reveals that the analysis of drivers' detour determination factors is valid to apply. Hence, overall study considers as a practical foundation to make effective detour strategies for increasing the utility of route networking and dispersion in the volume of traffic from now on.
This study's purpose is to analyse factors of determination about detouring for makinga standard model in regard of unfavorableness and uncertainty when unspecified individual recipients make a decision at the time of course detour. In order to achieve this, we surveyed SP investigation whether making a detour or not for drivers as a target who take a high way and National highway. Based on this result, we analysed detour determination factors of drivers, establishing a combination model of Decision Tree and Neural Network model. The result demonstrates the effected factors on drivers' detour determination are in ordering of the recognition of alternative routevs, reliable and frequency of using traffic information, frequency of transition routes and age. Moreover, from the outcome in comparison with an existing model and prediction through undistributed data, the rate of combination model 8.7% illustrates the most predictable way in contrast with logit model 12.8%, and Individual Model of Decision Tree 13.8% which are existed. This reveals that the analysis of drivers' detour determination factors is valid to apply. Hence, overall study considers as a practical foundation to make effective detour strategies for increasing the utility of route networking and dispersion in the volume of traffic from now on.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 연구는 기존 우회결정요인을 추출하는 모형들의 단점을 보완하여 운전자가 우회결정시 갖는 의사결정과정을 분석하기 위해 SP조사를 실시하였다.
나타났다. 따라서 본 연구에서는 많은 기존 문헌에서 우회결정모형을 정립하는데 사용되었던 로짓모형 등 단독모형의 단점을 보완하고자 데이터마이닝의 대표적 기법인 의사결정나무모형과 신경망모형의 결합모형 구죽으로 결정 요인들간의 교호관계 파악과 모형의 정확도 향상으로 신뢰성이 높은 주요 우회결정요인들을 선정하고자 한다.
따라서, 본 연구에서는 이러한 기존 로짓모형의 한계성을 보완하고자 의사결정나무 분석을 통한 주요 우회요인간의 교호작용 및 비선형성의 용이한 해석과 신경망 모형의 결합을 통한 높은 예측력 확보로 설명력있는 모형을 구축하였다.
본 연구는 운전자의 우회의사결정과정 속에 내포되어 있는 비선형성과 불확실성을 밝혀내기 위해 의사결정나무와 신경망 이론을 결합한 모형을 구축하여 우회결정요인 분석을 실시하였다. 그 결과, 기존 연구에서 우회결정요인 분석 시 전통적으로 사용되었던 로짓모형과 의사결정나무 단독 모형과의 비교를 검토한 결과 다음과 같은 결론을 얻을 수 있었다.
본 연구에서는 가상의 VMS 정보제공(지체 및 돌발) 상황에서의 우회여부를 설문조사 함으로써, 운전자의 우회결정모형을 구축하는 방법론을 채택하였다. SP 모형을 위한 주요 설계항목은 다음과 같다.
본 연구에서는 운전자가 우회결정시에 영향을 주는 요인들을 선정하기 위하여 기존의 연구 및 문헌 등을 통해 대상요소들을 검토하여 각 특성별 변수들을 선정하였다.
운전자 우회요인분석에 대한 기존 연구를 검토한 결과 우회 여건, 운전경력, 정보제공 메시지, 우회도로 인식여부 등 다양한 우회요인들이 분석되었고, 그에 따른 다양한 교통정보제공 방안에 관하여 연구가 진행 되었다.
의사결정나무와 신경망 결합모델은 의사결정나무모형의 장점인 결과 해석의 용이성과 교호작용 또는 비선형성을 통해 규칙이 생성된 변수를 선정하고 예측력에 큰 장점을 갖는 신경망 모형에 결합시킴으로써, 두 모형 간의 장단점의 상호보완을 통해 보다 정도 높은 예측 결과를 얻고자 한다.
이에따라 그 데이터 속에 존재하는 관계, 패턴, 규칙 등을 탐색하고 찾아내어 모형화함으로써 유용한 지식을 추출하는 데이터 마이닝 기법의 의사결정나무와 신경망 이론의 결합모형 구축 및 모형의 적용타당성을 검토하고, 그에 따른 운전자 우회결정 요인을 분석하는데 주목적을 두었다.
즉, 의사결정나무모형을 통해 우회의사결정과정 시영향을 주는 의미 있는 변수들의 파악과 그들의 인과관계를 설명하여, 신경망이론의 결과에 대한 해석의 난이성의 문제를 해결하고 모형의 정확도 또한 높이고자 한다.
제안 방법
결합모형을 구축하는 신경망모형은 가장 많이 사용되는 다층(Multilayer Perception)신경망으로 입력변수를 가지고 입력층에서부터 출력층에 이르기까지 기중치를 반복적으로 부과하는 과정을 거쳐 모형을 만들어 분석을 하였다.
기존 연구고찰에서는 선행된 우회결정요인 및 데이터마이닝과 관련된 연구를 개략적으로 살펴보고, 데이터마이닝 기법인 의사결정나무와 신경망 모형에 대한 이론적 고찰을 통한 본 연구의 적용성을 검토하였다.
따라서 본 연구에서는 분류와 예측에 효과적이며, 독립 변인들 간의 교호작용을 명확하고 쉽게 이해가 가능한 의사결정나무의 모형의 결과를 신경망이론의 입력변수로 사용하여 결과생성의 원인과 이유를 설명하고, 모형의 예측률을 높일 수 있는 모형을 구축하였다.
또한 의사결정나무 모형을 통해 분석된 요인들을 신경망 모형에 입력변수로 사용하여 의사결정나무모형과 신경망 결합에 의한 운전자 우회결정 모형을 구축하였다. 모형의 정확도 및 타당성을 검토하기 위해 오분류표를 이용하여 타 모형간의 정확도를 비교하였다.
모형의 정확도 및 타당성을 검토하기 위해 오분류표를 이용하여 타 모형간의 정확도를 비교하였다. 이에 본연구의 수행절차는 그림 1과 같다.
또한 분석의 과정 및 결과가 나무구조에 의해 표현되기 때문에, 분류 또는 예측을 목적으로 하는 다른 방법들에 비해 연구자가 분석과정을 쉽게 이해하고 설명할 수 있다는 장점을 지니고 있다(진현정, 2010). 본 연구에서는 운전자들의 우회 시주 영향을 미치는 변수들을 추출하는것을 목표로 모형을 사용하였다.
본 연구에서는 의사결정나무와 신경망 결합모형의 객관적 평가를 위하여 우회결정문제를 추정하는 전통적인 방법인 로짓모형 및 의사결정나무 단독모형과의 결과값 비교를 실시하였다. 각 모형의 적합도는 오분류표(Miscalssification Table)을 통해 비교하였다.
선정된 변수들을 바탕으로 SP조사 기법을 활용하여 우회결정에 영향을 주는 요인을 개인특성변수, 통행특성변수, 정보제공변수로 구분하여 설문조사 data를 구축하였고, 데이터마이닝 기법인 의사결정나무 모형을 통하여 운전자가 우회결정시에 주요 영향을 미치는 요인들을 추출하여 그 요인들간의 교호관계에 대해서 분석하였다.
의사결정나무 모형을 통해 최고의 이익비율을 기준으로 각 마디를 형성하는데 사용된 주요 우회결정요인을 신경망모형의 입력변수로 설정하였다. 또한 모형의 과대적합(Over fitting)이 일어나면 표본 내에서는 뛰어난 적합도를 가져올 수 있지만 표본 밖의 데이터에서는 적합도가 떨어지는 문제를 발생시킬 수 있기 때문에 이를 확인하기 위하여 전체 데이터 중 80%를 모형을 수립하는 훈련데이터로, 나머지 20%를 검증데이터로 분리하여 사용하였다.
판별모형이 입력되는 데이터를 분석하여 더 좋은 적중률을 보일 수 있는 모형을 선정하였다. 선정된 각 모형이 예측을 수행하는 구조의 모형으로서, 결합모형의 타당한 평가를 위해 단일모형을 별도로 구축하여 예측결과를 비교 평가한 결과 단일모형보다 정확도가 8.
하지만 언제나 CHAID 알고리즘이 최적분리를 보장해 주는 것이 아니기 때문에 본 연구에서는 CHAID의 수정된 분석 방법으로 예측변수에서 모든 가능한 분리를 고려하여 최적분리를 찾을 수 있도록 보완한Exhaustive CHAID 알고리즘을 바탕으로 모형을 구축하였다.
대상 데이터
입력변수로 설정하였다. 또한 모형의 과대적합(Over fitting)이 일어나면 표본 내에서는 뛰어난 적합도를 가져올 수 있지만 표본 밖의 데이터에서는 적합도가 떨어지는 문제를 발생시킬 수 있기 때문에 이를 확인하기 위하여 전체 데이터 중 80%를 모형을 수립하는 훈련데이터로, 나머지 20%를 검증데이터로 분리하여 사용하였다.
이론/모형
실시하였다. 각 모형의 적합도는 오분류표(Miscalssification Table)을 통해 비교하였다.
모형을 형성하는 알고리즘으로는 목적함수가 연결강도에 대하여 비선형 함수인 것의 최적화를 위해 가장 널리 이용되는 역 전파 알고리즘을 사용하였다.
은닉층과 출력층에 제시되는 값을 변형시켜 출력하는데 사용하는 활성화 함수로는 다층 신경망에서 가장 많이 사용되며 그 유의성 또한 뛰어난 것으로 알려져 있는 시그모이드 함수를 사용하였다. 시그모이드 함수는 각 변수들을 의 범위로 변환하여 처리하는 함수이다.
성능/효과
결과로 나타난 네트워크 다이어그램을 해석하면 우회를 선택하는 경우 우회도로 인지여부, 교통정보 이용빈도, 교통정보 신뢰여부가 가중치가 높은 것으로 분석되어 중요한 변수로 판단된다.
둘째, 의사결정나무와 신경망 결합모형을 통해 기존로짓모형에서 설명할 수 없었던 우회결정 영향변수간의 교호관계를 용이하게 설명하였다.
3%로 분석되었다. 또한 우회도로를 인지하며 교통정보를 신뢰하는 수준이 높지 않거나 보통인 경우 78.1%가 우회를 선택하였고, 이 중 교통정보를 보통 이상의 빈도로 이용하는 운전자의 우회선택확률이 85.6%로 나타났다. 반면, 우회도로를 인지하고 있더라도 교통정보를 신뢰하지 않는 경우 우회하지 않을 확률이100%로 분석되었다.
6%가 VMS를 통해 교통정보를 제공받는 것으로 나타났다. 또한 운잔자의 교통정보 신뢰도는 62.6%로 비교적 높았으며, 사고발생에 따른 지체정보 메시지를 받았을 때 우회할 확률이 45.4% 로 가장 영향을 주는 메세지 유형으로 확인되었다.
또한 훈련데이터와 검정데이터를 구분하여 분할표본 타당성 검사를 실시한 결과 훈련표본의 오분류가 나오게 될 위험도 추정값이 0.123이고 검정표본의 오분류가 나오게 될 위험도 추정값은 0.087로 두 데이터에서 얻는 결과의 차이가 적어 모형의 안전성이 있다고 판단된다.
모형의 적합도 비교결과 의사결정나무 단독 모형의 경우 오분류율이 13.8%로 기존 로짓모형의 오분류율인 12.6%보다 예측력이 낮았으나 의사결정나무와 신경망 결합모형의 오분류율은 8.7%로 예측력 이 가장 높은 것으로 나타나 모형의 적합도가 우수한 것으로 분석되었다.
반면 우회도로를 인지하지 못하는 운전자의 경우 우회를 하지 않을 확률이 높고, 특히 교통정보 신뢰도가 낮은 20대의 경우가 우회하지 않을 확률이 가장 높은 것으로 나타났다.
2와 같다. 분석결과를 살펴보면, 노드분할에 있어서 기준이 되는 Pearson 카이제곱 통계량에 따라 운전자 우회여부결정에 가장 영향을 미치는 요인은 우회도로 인지여부로 나타났고, 그 다음으로 교통정보 신뢰도 및 이용빈도, 경로전환빈도, 나이순으로 나타났다.
판별모형이 입력되는 데이터를 분석하여 더 좋은 적중률을 보일 수 있는 모형을 선정하였다. 선정된 각 모형이 예측을 수행하는 구조의 모형으로서, 결합모형의 타당한 평가를 위해 단일모형을 별도로 구축하여 예측결과를 비교 평가한 결과 단일모형보다 정확도가 8.6% 향상된 것으로 분석했다.
설문결과 성별의 경우 남성이 58.6%, 여성이 41.4% 의 비율로 나타났으며, 나이대별로는 30~40대의 연령이 66.4%로 가장 많았다. 지역은 서울 및 수도권이 71.
9%로 분석되었다. 우회도로를 인지하고 있는 운전자는 64.1%로 확인되었으며, 도로이용자의 48.6%가 VMS를 통해 교통정보를 제공받는 것으로 나타났다. 또한 운잔자의 교통정보 신뢰도는 62.
우회도로를 인지하고 있으며 교통정보를 매우 신뢰하는 운전자의 90.8%가 우회를 선택하는 것으로 나타났고, 이 경우 경로전환을 자주하는 운전자의 우회선택 확률은 97.3%로 분석되었다. 또한 우회도로를 인지하며 교통정보를 신뢰하는 수준이 높지 않거나 보통인 경우 78.
운전자 통행특성을 분석한 결과 통행목적은 통근이 56.0%로 가장 높게 나타났으며, 주요 도로 운행 횟수로는 주당 1~3회 운행하는 운전자가 77.9%로 분석되었다. 우회도로를 인지하고 있는 운전자는 64.
이 결과에 따라, 모형의 분석결과 운전자의 우회결정에 영향을 미치는 다양한 요인들 가운데 우회인지 여부와 신뢰도가 가장 영향력 있는 변수로 나타났다.
이상의 분석을 통해 우회도로인지 여부와 신뢰도는 매우 밀접한 관계를 갖고 있는 것을 확인했고, 특히 우회도로를 인지하며 교통정보를 신뢰하는 경우 우회확률이 매우 높고, 경로전환빈도와 교통정보 이용빈도가 높을수록 우회확률이 높은 것으로 분석 된다.
이에 분석결과를 구체적으로 살펴보면 전체 표본 집합에서 우회도로를 인지하고 있는 운전자 중 78.8%가 우회를 선택하는 것으로 파악되었다. 반면 우회도로를 인지하지 못한 운전자의 경우 82.
첫째, 의사결정나무와 신경망 결합모형의 적합도 결과 오분류율이 8.7%로 기존 모형인 로짓모형 12.6%, 의사결정나무 단독 모형 13.8% 보다 낮은 것으로 분석되어, 운전자 우회결정요인 분석에 관한 모형의 적용 타당성을 확인하였다.
특히 우회도로를 인지하고 있고, 교통정보를 신뢰하는 경우, 우회경험여부와 정보이용여부에 따라서 우회를 선택하는 것으로 나타났다.
후속연구
그리고 의사결정나무와 신경망의 결합에 의한 모형구축이 운전자 우회결정요인 분석에 적용 타당성을 확인한 만큼 본 모형을 바탕으로 다양한 교통분야에서 운전자의 의사결정과정의 불확실성을 확인할 수 있는 연구가 진행되어야 할 필요가 있는 것으로 판단된다.
또한 본 모델의 적용성을 높이기 위하여 실제 도로 상황에 맞는 시뮬레이션을 실시하고, 운전자 우회상황에서의 실측값과 비교하는 등의 더욱 정밀도 있는 연구가 진행된다면, 본 연구에서 제외되었던 변수인 운전경력이나 교통정보 이용빈도, 우회메세지 등 다른 요인들에 대한 영향력을 세부적으로 알 수 있다.
이러한 결과를 바탕으로, 교통량 분산효과와 도로망 효율 증대를 극대화하기 위한 우회관리전략 수립 방안으로 신뢰성 있는 정확한 정보제공이 무엇보다 중요하며, 특히 우회도로를 인지하지 못하는 도로이용자들을 위한 교통정보 서비스 제공방안이 필요할 것으로 판단된다
향후 연구과제로는 본 연구의 실증분석에 사용된 348명의 숫자는 연구를 위한 관측치로는 크게 부족하다고 볼 수 없으나, 의사결정나무모형의 자식마디로 갈수록 각 범주에 속하는 운전자의 수가 줄어들기 때문에, 현장에 적용 가능한 신뢰성있는 분석을 위해서 보다 많은 양의 표본수가 필요할 젓으로 판단된다.
참고문헌 (10)
강병서, 김계수(2010), SPSS17.0 사회과학 통계분석, 한나래아카데미.
김연지(2003), 의사결정나무를 이용한 신경망의 해석, 박사학위논문, 한국과학기술연구원.
김일평(2008), 우회결정요인 분석을 통한 교통정보 제공 방안에 관한 연구, 박사학위논문, 홍익대학교.
김중효,신재만,박제진,하태준(2010), 유전자 알고리즘과 신경망 이론의 결합에 의한 신호교차로 위험도 예측모형 개발에 관한 연구, 대한토목학회논문집 D, Vol.30 No.4, pp.351-360
서임기, 박상명, 이병주, 남궁문(2006). 교통정보의 신뢰도와 만족도가 경로선택에 미치는 영향. 대한토목학회 학술대회, Vol.2006.No.10, pp.3063-3066.
염현섭(2005), 신용평점표와 혼합모형을 이용한 부실기업 예측모형, 석사학위논문, 연세대학교.
이진천(2000), 입력자료 판별에 따른 데이터 마이닝 기법선택을 통한 시스템의 성능 개선, 석사학위논문, 아주대학교.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.