일반국도 도로특성분류를 위한 통계적 군집분석과 Kohonen Self-Organizing Maps의 비교연구 A Comparative Study on Statistical Clustering Methods and Kohonen Self-Organizing Maps for Highway Characteristic Classification of National Highway원문보기
본 연구는 기존의 도로기능분류 정의와 방법론을 벗어나 교통특성에 따른 도로분류 방법론인 도로특성분류를 기초로 분석을 수행하였다. 도로특성분류에 대한 일련의 과정 중에서 다양한 교통특성을 반영하는 설명변수를 기초로 요인점수를 산출하고, 동질한 도로구간을 그룹핑하는 군집화 분석과정과 적정 군집수 도출에 따른 군집결과비교에 본 연구는 초점을 맞추었다. 도로분류를 위해 병합적 계층 군집분석인 Ward법, 비계층적 군집분석인 K-means법, 자율신경 회로망을 이용한 K-SOM을 사용하여 비교분석하였다. 각 군집기법에 대한 결과를 토대로 비교분석한 결과, 군집 수 5 이하에서는 K-means법, 군집 수 14 이상에서는 Kohonen selforganizing maps가 가장 우수한 것으로 나타났으며, 군집수 5~9사이에서는 Ward법과 Kmeans법의 군집 성능이 불규칙한 패턴을 보임에 따라 세밀한 결과분석을 통해 우수성을 결정하는 것이 바람직할 것으로 분석되었다. 본 연구결과는 다양한 교통특성을 고려한 도로구간의 군집 속성을 분석하고 예측하는 분류화 작업에 중요한 기초적인 자료로 사용될 것으로 기대된다.
본 연구는 기존의 도로기능분류 정의와 방법론을 벗어나 교통특성에 따른 도로분류 방법론인 도로특성분류를 기초로 분석을 수행하였다. 도로특성분류에 대한 일련의 과정 중에서 다양한 교통특성을 반영하는 설명변수를 기초로 요인점수를 산출하고, 동질한 도로구간을 그룹핑하는 군집화 분석과정과 적정 군집수 도출에 따른 군집결과비교에 본 연구는 초점을 맞추었다. 도로분류를 위해 병합적 계층 군집분석인 Ward법, 비계층적 군집분석인 K-means법, 자율신경 회로망을 이용한 K-SOM을 사용하여 비교분석하였다. 각 군집기법에 대한 결과를 토대로 비교분석한 결과, 군집 수 5 이하에서는 K-means법, 군집 수 14 이상에서는 Kohonen selforganizing maps가 가장 우수한 것으로 나타났으며, 군집수 5~9사이에서는 Ward법과 Kmeans법의 군집 성능이 불규칙한 패턴을 보임에 따라 세밀한 결과분석을 통해 우수성을 결정하는 것이 바람직할 것으로 분석되었다. 본 연구결과는 다양한 교통특성을 고려한 도로구간의 군집 속성을 분석하고 예측하는 분류화 작업에 중요한 기초적인 자료로 사용될 것으로 기대된다.
This paper is described clustering analysis of traffic characteristics-based highway classification in order to deviate from methodologies of existing highway functional classification. This research focuses on comparing the clustering techniques performance based on the total within-group errors an...
This paper is described clustering analysis of traffic characteristics-based highway classification in order to deviate from methodologies of existing highway functional classification. This research focuses on comparing the clustering techniques performance based on the total within-group errors and deriving the optimal number of cluster. This research analyzed statistical clustering method (Hierarchical Ward's minimum-variance method, Nonhierarchical K-means method) and Kohonen self-organizing maps clustering method for highway characteristic classification. The outcomes of cluster techniques compared for the number of samples and traffic characteristics from subsets derived by the optimal number of cluster. As a comprehensive result, the k-means method is superior result to other methods less than 12. For a cluster of more than 20, Kohonen self-organizing maps is the best result in the cluster method. The main contribution of this research is expected to use important the basic road attribution information that produced the highway characteristic classification.
This paper is described clustering analysis of traffic characteristics-based highway classification in order to deviate from methodologies of existing highway functional classification. This research focuses on comparing the clustering techniques performance based on the total within-group errors and deriving the optimal number of cluster. This research analyzed statistical clustering method (Hierarchical Ward's minimum-variance method, Nonhierarchical K-means method) and Kohonen self-organizing maps clustering method for highway characteristic classification. The outcomes of cluster techniques compared for the number of samples and traffic characteristics from subsets derived by the optimal number of cluster. As a comprehensive result, the k-means method is superior result to other methods less than 12. For a cluster of more than 20, Kohonen self-organizing maps is the best result in the cluster method. The main contribution of this research is expected to use important the basic road attribution information that produced the highway characteristic classification.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구는 기존의 도로기능분류(highway functional classification) 정의와 방법론을 벗어나 교통특성에 따른 도로분류 방법론을 기초로 분석을 수행하였다. 도로특성분류(highway characteristic classification)는 시간대별, 구간별, 지역별 등의 다양한 통행패턴분석이 가능하여 교통계획, 교통운영관리 등의 교통전반에 걸쳐 도로설계 및 교통정책 수립에 중요한 판단기준으로 이용할 수 있다.
본 연구는 도로특성분류의 개념을 근거로 다양한 교통특성을 반영하는 설명변수를 통해 변수들간의 유사성(similarity) 정도를 측정하여 동질한 도로구간을 그룹핑하는 군집화(clustering) 과정과 적정 군집수를 도출하여 군집기법의 성능 평가를 중점적으로 분석하고자 한다. 도로특성분류를 위한 군집기법은 통계적인 기법과 Kohonen self-organizing maps를 적용하였으며, 군집의 속성을 분석하고 예측하는 분류화(classification) 과정에 기초적인 자료로 사용될 것으로 기대된다.
제안 방법
도로특성분류를 위해 분석에 적용될 설명변수는 표 3에 제시된 바와 같이 주간변동계수, 첨두시간대변동계수, 주중 주말비율, 주말계수, 휴가변동계수, 월변동계수, 요일변동계수, K30, D30, K200 summation value, D200 summation value, 트럭비율로 총 12개로 선정하였다. 일반적인 시간교통량 특성변수로는 주간변동계수, 월변동 계수, 요일변동계수, K30, K200 summation value를 선정하였다.
또한, 일반적으로 도시부, 지방부, 관광부 등의 도로특성에서 보다 세밀하고 정확한 분류를 위해 방향별 특성변수인 D30, D200 summation value를 선정하였고, 해당도로의 이용차량특성을 반영하기 위해 트럭비율을 설명변수로 추가하였다.
본 연구는 4단계의 도로특성분류 중에서 2단계인 도로 군 집화(highway clustering)에 초첨을 맞추어 군집기법들간의 우수성을 비교분석하였다.
이 연구에서 요인의 회전은 요인간의 상관이 없다고 가정하는 직각회전방법(orthogonal rotation method) 중에 베리맥스(varimax)법을 선택하였고 요인구조의 적합성 검토는 공통분(communality), 고유치(eigenvalue), 누적분산 비율, 요인부하량(factor loading) 등을 분석한 결과 타당한 것으로 나타났으며, 최종적으로 4개의 요인으로 구성된 요인점수(factor score)를 추출하였다. 본 연구에서는 이 연구 결과에서 도출된 요인점수를 군집분석에 대한 입력자료로 활용하였다.
표의 내용은 4개의 설명변수에 대해 표본수, 평균, 표준편차, 변동 계수(coefficient of variation CV)를 제시하였다. 세 군집방법에 대한 보다 객관적인 성능평가를 위해 변동계수를 산출하였다. 변동계수는 표준편차를 평균값으로 나눈 것으로 상대변동(relative variation)이라고도 하며 흩어짐의 정도, 즉 산포의 정도를 나타낸다.
도로특성분류(highway characteristic classification)는 시간대별, 구간별, 지역별 등의 다양한 통행패턴분석이 가능하여 교통계획, 교통운영관리 등의 교통전반에 걸쳐 도로설계 및 교통정책 수립에 중요한 판단기준으로 이용할 수 있다. 이러한 도로특성 분류 일련의 과정 중에서 다양한 교통특성을 반영하는 설명 변수를 기초로 요인점수를 산출하고, 동질한 도로구간을 그룹핑하는 군집화(clustering) 분석과정과 적정 군집수 도출에 따른 군집결과비교에 본 연구는 초점을 맞추었다. 최적의 군집분석 방법론 정립은 새로운 도로유형 및 특성분류를 규명하는데 가장 중요한 분석과정이다.
도로특성분류를 위해 분석에 적용될 설명변수는 표 3에 제시된 바와 같이 주간변동계수, 첨두시간대변동계수, 주중 주말비율, 주말계수, 휴가변동계수, 월변동계수, 요일변동계수, K30, D30, K200 summation value, D200 summation value, 트럭비율로 총 12개로 선정하였다. 일반적인 시간교통량 특성변수로는 주간변동계수, 월변동 계수, 요일변동계수, K30, K200 summation value를 선정하였다. 특히 출퇴근 통행 특성을 반영하기 위해 추가로 첨두시간대변동계수를 선정하였다.
적정 군집 수는 상대적으로 감소하는 총 군집 내 오차로 결정하였다. 즉, 군집의 수가 증가하면서 이 값의 변화폭이 갑자기 커지게 되는(local peak) 단계에서의 해당하는 군집을 적정 군집 수로 결정하였다. 이러한 기준을 토대로 분석하면, 표 4에서 알 수 있듯이, 세 군집분석 모두 적정 군집수가 5로 나타났다.
일반적인 시간교통량 특성변수로는 주간변동계수, 월변동 계수, 요일변동계수, K30, K200 summation value를 선정하였다. 특히 출퇴근 통행 특성을 반영하기 위해 추가로 첨두시간대변동계수를 선정하였다. 이 변수들은 첨두시간대별, 요일별 및 월별 교통량 통행패턴을 잘 반영해준다.
대상 데이터
본 연구에서는 도로교통량 통계연보에서 제공하고 있는 일반국도 2002년~2006년 상시조사지점의 교통량을 분석자료로 사용하였다. 상시 교통량은 도로를 이용하는 각종 통행차량의 통과대수를 종류별, 방향별 및 시간대별로 관측한 자료로서, 도로의 통행패턴 및 행태를 분석하는데 활용된다.
상시 교통량은 도로를 이용하는 각종 통행차량의 통과대수를 종류별, 방향별 및 시간대별로 관측한 자료로서, 도로의 통행패턴 및 행태를 분석하는데 활용된다. 표 2에서 알 수 있듯이 4년간 상시조자지점을 토대로 결측치 및 통계연보와 일치하지 않는 자료를 제외한 총 1,730개 지점을 분석에 적용하였다.
데이터처리
3장에서 세 군집분석의 성능을 비교분석하기 위해 평가지표를 TWGE로 선정하였으며, 이를 근거로 다양한 군집수에 대한 세 군집분석의 결과를 비교분석하였고 적정 군집수는 5로 도출되었다. 4장에서는 적정 군집수 5를 토대로 세 군집분석결과의 교통특성을 비교분석하였다.
도로특성분류를 위해 병합적 계층 군집분석인 Ward법, 비 계층적 군집분석인 K-means법, 자율신경 회로망을 이용한 K-SOM을 사용하여 비교분석하였다. 본 연구는 각 관측치간의 유사성을 측정하여 군집화를 하기 위해 유클리디안 거리를 적용하였으며, 군집의 정확성과 적합성을 판단하기 위해 군집 내 오차(within-group error)를 사용하였다.
또한, 그림 3에서 통계적인 군집분석 중에 상대적으로 우수한 K-means법과 자율신경망인 K-SOM을 비교해보면 군집 수가 작은 경우에 K-means법이 훨씬 우수하게 나타나지만, 군집수가 증가할수록 TWGE의 차이가 감소하면서 군집수 14이상에서는 K-SOM이 더 우수한 것으로 나타났다. 이러한 결과가 나타난 원인을 분석해보면, 첫째 12개의 설명변수에 대한 객관적인 입력자료를 확보하기 위해 탐색적 요인분석을 통한 요인점수를 산출하였다. 이는 설명변수들간의 다중 공선성, 극단치 및 이상치 문제 등이 최소화되면서 자료의 속성에서 불완전한 패턴이 상당부분 해결되었으므로 K-SOM과 같은 패턴인식에 대한 학습방법보다는 통계적인 접근방법이 더 효과적인 것으로 판단된다.
표 5, 표 6은 2002~2006년 분석자료 가운데 2006년 도로교통량 통계연보 상시조사 339개 지점을 토대로 군집수 5개에 대한 군집분석별 결과를 나열한 것이다. 표의 내용은 4개의 설명변수에 대해 표본수, 평균, 표준편차, 변동 계수(coefficient of variation CV)를 제시하였다. 세 군집방법에 대한 보다 객관적인 성능평가를 위해 변동계수를 산출하였다.
이론/모형
본 군집분석의 입력자료로 사용된 요인점수는 4차원 벡터(4-dimensional vectors)로 구성되어 있다. 따라서 각 군집분석의 평가척도를 측정하기 위해 군집 내 오차(within-group error) 개념을 적용하였으며, 정의는 다음과 같다.
또한, 인공지능기법 중에 하나인 Kohonen Self-Organizing Maps(SOM) 신경회로망(이하 K-SOM으로 명함)은 비지도학습법(unsupervised learning rule)을 이용한 대표적인 자율 신경회로망으로서, 본 연구에서는 통계적인 군집기법과의 비교분석을 위해 적용하였다.
본 결과분석에서 병합적 계층 군집기법인 ward법은 SAS 9.1로 분석하였으며, 비계층적 군집기법인 K-means법과 자율 신경 회로망을 이용한 군집기법인 K-SOM은 Clementine 10.1를 사용하여 분석하였다.
도로특성분류를 위해 병합적 계층 군집분석인 Ward법, 비 계층적 군집분석인 K-means법, 자율신경 회로망을 이용한 K-SOM을 사용하여 비교분석하였다. 본 연구는 각 관측치간의 유사성을 측정하여 군집화를 하기 위해 유클리디안 거리를 적용하였으며, 군집의 정확성과 적합성을 판단하기 위해 군집 내 오차(within-group error)를 사용하였다. 분석결과, 군집수 5 이하에서는 K-means법이 우수하게 나타났고, 군집수 14 이상에서는 K-SOM이 우수하게 나타났다.
본 연구는 병합적 계층 군집분석 중에 가장 널리 사용하고 군집의 정확도가 상대적으로 양호한 ward's minimum- variance 법(이하 ward법이라 명함)을 적용하였다.
성능/효과
특히, 군집수가 14 이상에서는 K-SOM이 더 우수한 것으로 나타났다. 군집수가 증가할수록 군집간의 유사성을 도출하는데 어려움이 있기 때문에 이러한 군집방법에는 전통적인 통계적 분석방법보다는 신경망이론과 같은 인공지능기법이 더 우수한 것으로 분석된다. K-SOM의 이러한 경향은 Monthly traffic factor를 설명변수로 한 Lingras(1995) 연구와 비교하면 보다 명확한 결론을 도출할 수 있다.
이는 설명변수들간의 다중 공선성, 극단치 및 이상치 문제 등이 최소화되면서 자료의 속성에서 불완전한 패턴이 상당부분 해결되었으므로 K-SOM과 같은 패턴인식에 대한 학습방법보다는 통계적인 접근방법이 더 효과적인 것으로 판단된다. 둘째, K-SOM은 승리 뉴런과 이웃하는 뉴런의 연결강도를 갱신할 때 발생하는 오차에 상관없이 임의의 시간 함수를 학습계수로 하여, 연결강도를 일률적으로 조정하는 단점이 있는데 도로특성분류에 대한 군집분석에서 군집수가 작은 경우 통계적 군집분석보다 학습효율이 좋지 않은 것으로 판단된다.
이러한 군집방법은 각각의 관측치에 대해서 K개의 군집중심까지의 거리를 구하고, 가장 가까운 군집에 해당 관측치(표본수)를 할당하기 때문에 본 연구와 같이 관측치가 많은 경우 Ward법에 비해 군집을 형성하는 편의(bias)가 적어지는 경향이 있다. 따라서, 관측 치가 많은 군집분석에서는 Ward법보다는 K- means법이 더 우수하게 나타났다.
또한, 계층적(hierarchical) 군집분석인 Ward법과 비계층적(non-hierarchical) 군집분석인 K-means법은 유사한 결과패턴을 보이지만 그룹3, 4에서 다소 상이한 결과가 나타나는 것으로 분석되었다. 따라서, 교통특성에 따른 도로분류를 수행하는데 있어서 관측치(표본수)가 많으면서 군집수가 적은 경우에는 Ward법보다는 K-means법이 더 우수한 것으로 나타났다.
이러한 군집의 불규칙한 결과패턴은 그림 2에서 보다 명확히 알 수 있다. 따라서, 군집수가 5~9사이의 군집분석을 수행할 경우에는 Ward법과 K-means법을 비교분석하여 최종적인 결론을 도출하는 것이 적합할 것으로 판단된다. 기존의 연구를 보면, 이러한 비교분석없이 한 가지의 군집기법을 선택하여 분석하는 경우가 대부분이었다.
따라서, 다양한 교통특성을 고려한 도로분류에서 군집수가 적은 경우에는 신경망 이론보다는 통계적인 군집기법이 더 우수한 것으로 나타났으며, 통계적인 군집기법 중에서도 계층적 군집분석인 Ward법보다는 비계층적 군집분석인 Kmeans법이 더 우수한 것으로 나타났다. 하지만, 군집수가 6~10사이인 경우는 두 통계적인 군집분석 결과를 보다 세밀하게 살펴볼 필요가 있을 것으로 판단된다.
군집수가 적은 경우에 K-means법이 우수하게 나타난 원인은 탐색적 요인분석을 통한 요인점수를 입력자료로 사용함에 따라 설명변수들간의 다중공선성, 극단치, 이상치 문제 등이 최소화되면서 패턴인식에 대한 학습방법보다는 K-means 군집방법이 더 효과적인 것으로 판단된다. 또한 군집수 5~9사이에서는 Ward법과 K-means법의 군집 성능이 불규칙한 패턴을 보임에 따라 어떠한 통계적 군집분석이 더 우수한지는 보다 세밀한 결과분석이 필요한 것으로 분석되었다. 적정 군집수는 상대적으로 감소하는 총 군집 내 오차를 가지고 결정하였으며, 세 군집분석 모두 적정 군집수가 5로 나타났다.
하여 분석하여 보면, 비지도학습법(unsupervised learning rule)을 이용한 자율 신경회로망인 K-SOM은 군집수가 적은 경우에는 비효율적인 결과를 도출하는 것으로 나타났다. 또한, 계층적(hierarchical) 군집분석인 Ward법과 비계층적(non-hierarchical) 군집분석인 K-means법은 유사한 결과패턴을 보이지만 그룹3, 4에서 다소 상이한 결과가 나타나는 것으로 분석되었다. 따라서, 교통특성에 따른 도로분류를 수행하는데 있어서 관측치(표본수)가 많으면서 군집수가 적은 경우에는 Ward법보다는 K-means법이 더 우수한 것으로 나타났다.
Ward법의 경우 군집수 2~3에서는 TWGE가 가장 높게 나타남에 따라 군집수가 매우 작은 경우에는 사용하지 않는 것이 바람직할 것으로 판단되며, K-SOM은 세 군집기법 중에서 가장 좋지 않은 결과가 나타남에 따라 군집수가 10미만인 경우에는 사용하지 않는 것이 바람직하다. 또한, 군집수가 6인 경우에는 세 군집방법의 TWGE 차이가 가장 작은 것으로 나타났으며, 이 경우에는 Ward법이 근소한 차이로 우수하게 나타났다. 특히, 군집수 5~9사이에는 Ward법과 K-means법이 근소한 값을 나타내며 군집의 성능이 불규칙하게 나타났다.
또한, 그림 3에서 통계적인 군집분석 중에 상대적으로 우수한 K-means법과 자율신경망인 K-SOM을 비교해보면 군집 수가 작은 경우에 K-means법이 훨씬 우수하게 나타나지만, 군집수가 증가할수록 TWGE의 차이가 감소하면서 군집수 14이상에서는 K-SOM이 더 우수한 것으로 나타났다. 이러한 결과가 나타난 원인을 분석해보면, 첫째 12개의 설명변수에 대한 객관적인 입력자료를 확보하기 위해 탐색적 요인분석을 통한 요인점수를 산출하였다.
특히 두 군집분석간의 표본수가 상이 하게 나타난 그룹3, 4에서 차이를 보이고 있다. 방향별 통행 특성을 반영하는 D200 summation value과 이용차량특성을 반영하는 트럭비율에 대한 변동계수는 두 통계적인 군집분석이 전반적으로 유사하게 나타났지만 그룹3, 4에서 약간의 차이를 보이는 것으로 분석되었다.
본 연구에서는 도로특성분류를 수행하는데 있어 요인분석을 통해 산출된 요인점수를 군집분석의 입력자료로 사용한 경우, 군집수가 적을 때는 통계적 군집방법이 신경망 기법보다 우수하게 나타났다. 따라서, 통계적 방법 중에서 병합적 계층 군집분석의 8가지 방법(Average linkage, Centroid method, Single method, Median method, EML, Flexible-beta method, McQuitty's similarity analysis, Ward's minimum-variance method)과 비계층적인 군집분석인 Kmeans method에 대해 보다 다양한 평가지표(R-square 통계량, pseudo-F 통계량, cubic clustering criterion 등)를 통한 세밀한 분석이 필요할 것으로 판단된다.
본 연구는 각 관측치간의 유사성을 측정하여 군집화를 하기 위해 유클리디안 거리를 적용하였으며, 군집의 정확성과 적합성을 판단하기 위해 군집 내 오차(within-group error)를 사용하였다. 분석결과, 군집수 5 이하에서는 K-means법이 우수하게 나타났고, 군집수 14 이상에서는 K-SOM이 우수하게 나타났다. 군집수가 적은 경우에 K-means법이 우수하게 나타난 원인은 탐색적 요인분석을 통한 요인점수를 입력자료로 사용함에 따라 설명변수들간의 다중공선성, 극단치, 이상치 문제 등이 최소화되면서 패턴인식에 대한 학습방법보다는 K-means 군집방법이 더 효과적인 것으로 판단된다.
조준한 외 2인(2008)은 위에서 제시한 12개의 설명변수에 대해 탐색적 요인분석을 이용하여 설명변수들간의 상관관계 분석, 적정 설명변수 선정, 요인점수 산출에 대해 연구하였다. 이 연구에서 요인의 회전은 요인간의 상관이 없다고 가정하는 직각회전방법(orthogonal rotation method) 중에 베리맥스(varimax)법을 선택하였고 요인구조의 적합성 검토는 공통분(communality), 고유치(eigenvalue), 누적분산 비율, 요인부하량(factor loading) 등을 분석한 결과 타당한 것으로 나타났으며, 최종적으로 4개의 요인으로 구성된 요인점수(factor score)를 추출하였다. 본 연구에서는 이 연구 결과에서 도출된 요인점수를 군집분석에 대한 입력자료로 활용하였다.
그림 4를 살펴보면, 통계적인 군집분석인 Ward법과 Kmeans법은 산발적인 차이를 보이고 있으며, 특히 그룹3, 4에서 상이한 결과를 보이고 있다. 이러한 결과는 Ward법과 K-means법의 TWGE가 각각 739,755와 709,943으로 분석됨에 따라 그 차이값이 29,812로 나타났으며, 이로 인해 두군집분석의 군집별 표본수가 다소 상이하게 나타난 것으로 분석되었다. 또한, K-SOM은 전반적으로 통계적 군집기법과 상당한 차이를 보이고 있다.
적정 군집수는 상대적으로 감소하는 총 군집 내 오차를 가지고 결정하였으며, 세 군집분석 모두 적정 군집수가 5로 나타났다. 적정 군집수 5를 토대로 각 군집분석별에 대한 그룹별 표본수와 교통특성을 분석한 결과, Ward법과 K-means법은 그룹3, 4을 제외하고는 전반적으로 근소한 값을 나타냈으며, 그룹3, 4에서는 4개의 설명변수에 대한 변동계수를 토대로 분석한 결과, Ward법보다는 K-means법이 산포의 정도가 더 양호한 것으로 나타났다. 반면에 K-SOM은 전체적으로 산포의 정도가 양호하지 않는 것으로 나타났다.
또한 군집수 5~9사이에서는 Ward법과 K-means법의 군집 성능이 불규칙한 패턴을 보임에 따라 어떠한 통계적 군집분석이 더 우수한지는 보다 세밀한 결과분석이 필요한 것으로 분석되었다. 적정 군집수는 상대적으로 감소하는 총 군집 내 오차를 가지고 결정하였으며, 세 군집분석 모두 적정 군집수가 5로 나타났다. 적정 군집수 5를 토대로 각 군집분석별에 대한 그룹별 표본수와 교통특성을 분석한 결과, Ward법과 K-means법은 그룹3, 4을 제외하고는 전반적으로 근소한 값을 나타냈으며, 그룹3, 4에서는 4개의 설명변수에 대한 변동계수를 토대로 분석한 결과, Ward법보다는 K-means법이 산포의 정도가 더 양호한 것으로 나타났다.
주말 계수는 국민의 소득수준 향상에 따른 여가시간 증가와 주5일제 근무로 인한 관광수요의 증가 등을 반영하는 설명변수로서 주말교통량이 상대적으로 많은 관광부도로의 성격을 파악하는데 이용된다. 주중과 주말 교통량의 변공이 심한 교통 특성을 분류할 때에는 Ward법보다는 K-means법이 보다 우수한 것으로 나타났다. 특히 두 군집분석간의 표본수가 상이 하게 나타난 그룹3, 4에서 차이를 보이고 있다.
통계적 군집분석의 경우, 군집수 5 이하에서는 K-means법이 가장 우수하게 나타났으며, 군집수 6~9사이에는 불규칙한 패턴을 보이고, 군집수가 14이상에서는 K-SOM이 가장 우수하게 나타났다. 즉, 군집수가 작은 경우에는 K-means법이 우수하고, 군집수가 큰 경우에는 K-SOM이 우수한 것으로 나타났다. 특히, 군집수가 14 이상에서는 K-SOM이 더 우수한 것으로 나타났다.
표 4를 보면, Ward법, K-means법과 K-SOM의 군집 우수성이 군집수에 따라 다르게 나타났다. 통계적 군집분석의 경우, 군집수 5 이하에서는 K-means법이 가장 우수하게 나타났으며, 군집수 6~9사이에는 불규칙한 패턴을 보이고, 군집수가 14이상에서는 K-SOM이 가장 우수하게 나타났다. 즉, 군집수가 작은 경우에는 K-means법이 우수하고, 군집수가 큰 경우에는 K-SOM이 우수한 것으로 나타났다.
또한, 군집수가 6인 경우에는 세 군집방법의 TWGE 차이가 가장 작은 것으로 나타났으며, 이 경우에는 Ward법이 근소한 차이로 우수하게 나타났다. 특히, 군집수 5~9사이에는 Ward법과 K-means법이 근소한 값을 나타내며 군집의 성능이 불규칙하게 나타났다. 이러한 군집의 불규칙한 결과패턴은 그림 2에서 보다 명확히 알 수 있다.
하여 분석하여 보면, 비지도학습법(unsupervised learning rule)을 이용한 자율 신경회로망인 K-SOM은 군집수가 적은 경우에는 비효율적인 결과를 도출하는 것으로 나타났다. 또한, 계층적(hierarchical) 군집분석인 Ward법과 비계층적(non-hierarchical) 군집분석인 K-means법은 유사한 결과패턴을 보이지만 그룹3, 4에서 다소 상이한 결과가 나타나는 것으로 분석되었다.
후속연구
본 연구는 도로특성분류의 개념을 근거로 다양한 교통특성을 반영하는 설명변수를 통해 변수들간의 유사성(similarity) 정도를 측정하여 동질한 도로구간을 그룹핑하는 군집화(clustering) 과정과 적정 군집수를 도출하여 군집기법의 성능 평가를 중점적으로 분석하고자 한다. 도로특성분류를 위한 군집기법은 통계적인 기법과 Kohonen self-organizing maps를 적용하였으며, 군집의 속성을 분석하고 예측하는 분류화(classification) 과정에 기초적인 자료로 사용될 것으로 기대된다.
이는 기 구축된 교통관리센터에 대한 객관적인 운영평가를 위한 기초가 되며, 교통관리센터의 질적인 진화와 부가가치 창출로 인한 첨단교통체계 효과를 극대화할 수 있을 것으로 판단된다. 따라서, 다양한 검지체계에서 수집되는 교통패턴을 토대로 동질한 도로구간으로 그룹핑하여 도로특성분류를 하면 교통혼잡관리(traffic congestion management), 포장설계(pavement design), 대기오염평가(air quality estimation) 등 교통정책 전반에 대한 의사결정을 판단하는데 합리적인 평가방법 및 기준으로 활용될 것으로 기대된다.
적정 군집수 산정이 시사하는 것은 도로특성분류에서 어떠한 군집기법을 적용하는냐에 따라 적정 군집수가 다르게 도출될 수 있으며, 군집에 속한 교통특성도 다르다는 것이다. 따라서, 본 연구에서 제시한 도로특성분류의 2단계과정인 군집화(clustering)는 교통특성에 따른 도로분류나 도로 유형별 통행실태분석 등에 직접적인 영향을 끼치기 때문에 다양한 군집기법의 면밀한 비교분석이 선행되어야 할 것으로 사료되며, 이는 본 연구목적과 부합하는 부분이다.
또한, 상시조사가 아닌 수시 조사의 경우, 본 연구에서 선정한 설명변수를 모두 사용할 수 없기 때문에 상대적으로 다양한 통행특성을 반영하는데 제약이 있다. 따라서, 수시조사지점의 도로특성분류를 위한 설명변수 개발 및 군집분석 방법론도 지속적으로 연구되어야 할 것이다.
따라서, 통계적 방법 중에서 병합적 계층 군집분석의 8가지 방법(Average linkage, Centroid method, Single method, Median method, EML, Flexible-beta method, McQuitty's similarity analysis, Ward's minimum-variance method)과 비계층적인 군집분석인 Kmeans method에 대해 보다 다양한 평가지표(R-square 통계량, pseudo-F 통계량, cubic clustering criterion 등)를 통한 세밀한 분석이 필요할 것으로 판단된다.
또한, 교통특성을 고려한 도로분류는 통행발생요소, 통행분포요소, 토지이용요소 등에 따라 변화될 수 있기 때문에 전문가의 이성적인 판단과 이론적인 분석을 병행하는 방법을 모색해보는 것도 필요할 것으로 판단된다.
또한, 도로특성분류에 대한 군집 최적화 문제는 NP-Hard에 해당하기 때문에 최적해(global solution)에 가까운 값을 찾는 것으로, 근사 알고리즘(approximation algorithm)이나 발견적 알고리즘(heuristic algorithm)인 유전자 알고리즘, 퍼지이론 등을 이용한 분석도 추가적으로 수행할 필요가 있다. 이러한 군집기법은 도로특성분류에 대한 최적의 군집방법론과 적정 군집 수를 도출할 수 있을 것으로 판단된다.
이러한 연구결과는 최적 군집방법 론을 제시하는데 있어 보다 일반적이고 보편적인 지침을 제공할 수 있을 것으로 판단된다. 또한, 상시조사가 아닌 수시 조사의 경우, 본 연구에서 선정한 설명변수를 모두 사용할 수 없기 때문에 상대적으로 다양한 통행특성을 반영하는데 제약이 있다. 따라서, 수시조사지점의 도로특성분류를 위한 설명변수 개발 및 군집분석 방법론도 지속적으로 연구되어야 할 것이다.
본 연구에서는 일반국도의 상시조사 자료를 토대로 분석하였으나, 고속도로, 국가지원지방도, 지방도 증에 대한 연구도 병행이 되어야 할 것이다. 이러한 연구결과는 최적 군집방법 론을 제시하는데 있어 보다 일반적이고 보편적인 지침을 제공할 수 있을 것으로 판단된다.
예를 들면, 첨단교통체계 사업으로 인해 서울특별시를 비롯한 각 지자체별 교통관리센터의 활성화 운영방안으로서, 실시간 및 과거이력자료를 토대로 한 보다 체계적이고 과학적인 교통정보분석, 교통관리 전략 전반에 대한 총괄적인 모니터링, 교통시설의 지속적인 유지관리 등에 효율적으로 적용할 수 있다. 이는 기 구축된 교통관리센터에 대한 객관적인 운영평가를 위한 기초가 되며, 교통관리센터의 질적인 진화와 부가가치 창출로 인한 첨단교통체계 효과를 극대화할 수 있을 것으로 판단된다. 따라서, 다양한 검지체계에서 수집되는 교통패턴을 토대로 동질한 도로구간으로 그룹핑하여 도로특성분류를 하면 교통혼잡관리(traffic congestion management), 포장설계(pavement design), 대기오염평가(air quality estimation) 등 교통정책 전반에 대한 의사결정을 판단하는데 합리적인 평가방법 및 기준으로 활용될 것으로 기대된다.
본 연구에서는 일반국도의 상시조사 자료를 토대로 분석하였으나, 고속도로, 국가지원지방도, 지방도 증에 대한 연구도 병행이 되어야 할 것이다. 이러한 연구결과는 최적 군집방법 론을 제시하는데 있어 보다 일반적이고 보편적인 지침을 제공할 수 있을 것으로 판단된다. 또한, 상시조사가 아닌 수시 조사의 경우, 본 연구에서 선정한 설명변수를 모두 사용할 수 없기 때문에 상대적으로 다양한 통행특성을 반영하는데 제약이 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
도로기능분류 자료는 무엇에 이용하게 되는가?
도로기능분류(highway functional classification)는 도로 위계구조에 따른 도로등급 설정, 도로등급별 세부시설기준 정립, 종합적인 투자사업 우선순위수립, 도로망 체계의 균형적인 정비 및 도로사업의 효율적 투자방안 마련 등을 위한 목적으로 시행하고 있다. 즉, 상위계획단계에서 교통 및 도로시설 투자계획 수립에 중요한 자료로 이용하게 된다. 하지만, 건설교통부(1999), FHWA(1989, 2001)에서는 통행단계요소, 통행특성요소, 토지이용요소 등이 시간대별, 요일별, 계절별, 연도별, 이용차량별 교통패턴과 직결되기 때문에 다양한 교통특성 패턴을 고려할 수 있는 보다 다양하고 합리적인 평가항목 및 기준이 필요하다고 제시하고 있다.
교통자료 전처리는 어떤 과정을 의미하는가?
교통자료 전처리는 해당 도로지점 및 구간에 대해 다양한 검지체계에서 수집되는 교통량(시간대별, 요일별, 월별, 계절별 등), 속도 및 통행시간, 점유율, 차두거리(시간), 이용차량 구성 등의 다양한 교통특성자료의 신뢰성을 검증하고, 이를 토대로 통행특성과 패턴을 파악하기 위해 적정 설명변수 선정 및 도출하는 과정을 의미한다.
도로기능분류의 목적은?
도로기능분류(highway functional classification)는 도로 위계구조에 따른 도로등급 설정, 도로등급별 세부시설기준 정립, 종합적인 투자사업 우선순위수립, 도로망 체계의 균형적인 정비 및 도로사업의 효율적 투자방안 마련 등을 위한 목적으로 시행하고 있다. 즉, 상위계획단계에서 교통 및 도로시설 투자계획 수립에 중요한 자료로 이용하게 된다.
참고문헌 (21)
강원의(2001) 일반국도의 수행기능분석에 의한 적정 설계기준 연구, 대한교통학회지, 대한교통학회, 제19권 제1호, pp. 53-61.
Tabachnik, B.G. and Fidell, L.S. (1996), Using multivariate statistics, New York: HarperCollins.
Traffic Monitoring Guide, Office of Highway Policy Information (2001) Federal Highway Administration, U.S. Department of Transportation, Washington D.C.
Washington State Department of Transportation (2002) Guidelines for amending urban boundaries and functional classification, Planning and Capital Program Management.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.