교통사고 데이터와 GIS를 이용한 보행자사고 개선구역 선정 : 서울시를 대상으로 A Selection of High Pedestrian Accident Zones Using Traffic Accident Data and GIS: A Case Study of Seoul원문보기
양종현
(Dept. of Civil & Environmental Engineering, Seoul National Univ.)
,
김정옥
(Institute of Construction and Environmental Engineering, Seoul National Univ.)
,
유기윤
(Dept. of Civil & Environment Engineering, Seoul National Univ.)
본 연구에서는 보행자사고 개선구역 선정을 위한 객관적 기준 마련을 위해 서울시의 2009년~2013년 보행자사고 54,208건에 대해서 Getis-ord Gi*와 커널 밀도를 결합하여 보행자사고 개선구역을 선정하였다. Getis-ord Gi*를 통해 보행자사고 발생 지점의 공간적 분포를 고려하여 보행자사고 핫스팟이 군집된 보행자사고 개선구역을 선정할 수 있었고 값을 통해 선정된 구역 간의 우선순위를 판별할 수 있었다. 그리고 보행자사고 개선구역 내부에 대해 커널밀도추정을 시행함으로써 사고 발생 지점의 미시적인 분포를 파악하고 사고 발생에 중대한 영향을 미치는 핫스팟을 식별할 수 있었다. 또한, 핫스팟에서 높은 밀도 레벨을 가지는 부분을 확인함으로써 핫스팟 내부를 분석할 수 있었다.
본 연구에서는 보행자사고 개선구역 선정을 위한 객관적 기준 마련을 위해 서울시의 2009년~2013년 보행자사고 54,208건에 대해서 Getis-ord Gi*와 커널 밀도를 결합하여 보행자사고 개선구역을 선정하였다. Getis-ord Gi*를 통해 보행자사고 발생 지점의 공간적 분포를 고려하여 보행자사고 핫스팟이 군집된 보행자사고 개선구역을 선정할 수 있었고 값을 통해 선정된 구역 간의 우선순위를 판별할 수 있었다. 그리고 보행자사고 개선구역 내부에 대해 커널밀도추정을 시행함으로써 사고 발생 지점의 미시적인 분포를 파악하고 사고 발생에 중대한 영향을 미치는 핫스팟을 식별할 수 있었다. 또한, 핫스팟에서 높은 밀도 레벨을 가지는 부분을 확인함으로써 핫스팟 내부를 분석할 수 있었다.
To establish objective criteria for high pedestrian accident zones, we combined Getis-ord Gi* and Kernel Density Estimation to select high pedestrian accident zones for 54,208 pedestrian accidents in Seoul from 2009 to 2013. By applying Getis-ord Gi* and considering spatial patterns where pedestrian...
To establish objective criteria for high pedestrian accident zones, we combined Getis-ord Gi* and Kernel Density Estimation to select high pedestrian accident zones for 54,208 pedestrian accidents in Seoul from 2009 to 2013. By applying Getis-ord Gi* and considering spatial patterns where pedestrian accident hot spots were clustered, this study identified high pedestrian accident zones. The research examined the microscopic distribution of accidents in high pedestrian accident zones, identified the critical hot spots through Kernel Density Estimation, and analyzed the inner distribution of hot spots by identifying the areas with high density levels.
To establish objective criteria for high pedestrian accident zones, we combined Getis-ord Gi* and Kernel Density Estimation to select high pedestrian accident zones for 54,208 pedestrian accidents in Seoul from 2009 to 2013. By applying Getis-ord Gi* and considering spatial patterns where pedestrian accident hot spots were clustered, this study identified high pedestrian accident zones. The research examined the microscopic distribution of accidents in high pedestrian accident zones, identified the critical hot spots through Kernel Density Estimation, and analyzed the inner distribution of hot spots by identifying the areas with high density levels.
본 논문은 KDE와 Getis-ord Gi*를 결합하여 보행자사고 개선이 필요한 구역(이하 보행자사고 개선구역)을 선정하는 방법론을 제시한다. 구체적 연구목적은 다음과 같다.
이 연구는 보행자사고 개선구역을 선정하고 개선구역 내 사고의 미시적인 공간 분포를 분석하는 것을 목적으로 한다. 연구흐름은 Fig.
가설 설정
KDE에서 거리는 유클리디언 거리 또는 네트워크 거리로 계산할 수 있다. 네트워크 거리는 도로를 1D로 가정하며, 유클리디언 거리는 도로를 2D로 가정한다(Xie and Yan, 2008). 도로를 선으로 가정할 수 있을 정도로 거시적으로 분석할 때에는 네트워크 거리가 적합하다.
이것은 Tobler(1970)의 지리학 제 1법칙을 제대로 반영하지 못하며, 고정 거리 내에 있는 모든 피처가 같은 영향을 준다고 가정하므로 비현실적이다. 따라서 거리가 증가함에 따라 인접한 보행자사고가 미치는 영향이 감소한다고 가정하여 CSR로 역거리를 이용하였다.
제안 방법
첫째, Getis-ord Gi*를 통해 보행자사고 발생 지점의 공간적 분포를 고려하여 보행자사고 핫스팟이 군집된 보행자사고 개선구역을 선정하였다. 단순히 값이 큰 격자만 관심구역에 포함시키지 않고 그 주변 격자까지 관심구역에 포함시킴으로써 높은 값을 가진 피처가 군집되어 있는 구역, 이른바 핫스팟이 군집되어 있는 구역을 찾는다는 Getis-ord Gi*의 목적과 부합하게 개선구역을 선정하였다. 또한 값을 통해 선정된 구역 간의 우선순위를 판별할 수 있었다.
첫째, 보행자사고 발생 지점의 공간적 분포를 고려하여 보행자사고 핫스팟이 군집된 보행자사고 개선구역을 선정하며, 선정된 구역간의 우선순위를 판별한다. 둘째, 지정된 보행자사고 개선구역 내부에 속한 사고의 미시적인 분포를 분석함으로써 사고발생에 중대한 영향을 미치는 지점을 판단한다.
본 연구는 KDE와 Getis-ord Gi*를 결합함으로써 다음의 두 가지를 만족하는 보행자사고 개선구역을 선정하는 방법론을 제시하였다. 첫째, Getis-ord Gi*를 통해 보행자사고 발생 지점의 공간적 분포를 고려하여 보행자사고 핫스팟이 군집된 보행자사고 개선구역을 선정하였다.
본 연구에서는 Getis-ord Gi*를 통해 설정한 보행자사고 개선구역에 대해 KDE를 시행하여 존을 세부적으로 분류하였다. 또한 KDE를 통해 얻은 밀도 값을 Jenks Natural Breaks를 시행하여 9개의 계급으로 나누었다.
본 연구는 KDE와 Getis-ord Gi*를 결합함으로써 다음의 두 가지를 만족하는 보행자사고 개선구역을 선정하는 방법론을 제시하였다. 첫째, Getis-ord Gi*를 통해 보행자사고 발생 지점의 공간적 분포를 고려하여 보행자사고 핫스팟이 군집된 보행자사고 개선구역을 선정하였다. 단순히 값이 큰 격자만 관심구역에 포함시키지 않고 그 주변 격자까지 관심구역에 포함시킴으로써 높은 값을 가진 피처가 군집되어 있는 구역, 이른바 핫스팟이 군집되어 있는 구역을 찾는다는 Getis-ord Gi*의 목적과 부합하게 개선구역을 선정하였다.
구체적 연구목적은 다음과 같다. 첫째, 보행자사고 발생 지점의 공간적 분포를 고려하여 보행자사고 핫스팟이 군집된 보행자사고 개선구역을 선정하며, 선정된 구역간의 우선순위를 판별한다. 둘째, 지정된 보행자사고 개선구역 내부에 속한 사고의 미시적인 분포를 분석함으로써 사고발생에 중대한 영향을 미치는 지점을 판단한다.
이처럼 많은 연구들이 KDE를 사용하여 보행자사고 핫스팟을 선정하였다. 하지만 보행자사고 핫스팟을 객관적인 방법으로 선정하지 않고 연구자가 KDE의 결과인 밀도도를 통해 주관적으로 선정하였다. 또한, 보행자사고의 공간적인 분포를 고려하지 않아 단순히 사고가 많이 발생한 지점만 찾았으며 보행자사고 핫스팟이 군집된 구역을 찾지 못하였다.
대상 데이터
본 연구에서는 교통사고분석시스템1)과 공공데이터포털2)에서 취득한 2009~2013년도 서울시 보행사고데이터(54,208건)를 이용한다. 데이터는 사고발생지점, 사고일, 사고요일, 사고시군구, 사고구분, 사망, 중상, 경상, 부상, 사고유형 등으로 이루어져 있다. 다음으로 서울시 수치지도를 일정 크기의 격자로 나눈 후 앞서 작성한 포인트 데이터 셋과 공간결합(spatial join)을 통해 개별 격자에 보행자사고를 포함하고 보행자사고 발생수가 0인 격자들은 제거한다.
1단계는 분석을 위한 데이터 구축 단계로 우선 엑셀로 저장된 서울시 보행자사고 데이터의 개별 사고를 포인트로 변환한다. 본 연구에서는 교통사고분석시스템1)과 공공데이터포털2)에서 취득한 2009~2013년도 서울시 보행사고데이터(54,208건)를 이용한다. 데이터는 사고발생지점, 사고일, 사고요일, 사고시군구, 사고구분, 사망, 중상, 경상, 부상, 사고유형 등으로 이루어져 있다.
데이터처리
본 연구에서는 모든 보행자 사고에 1을 부여한 경우와 Jo et al.(2014)의 사고마다 인명피해 심각도를 가중치로 부여한 2가지 경우에 대해 KDE를 시행하고 그 결과를 비교하였다. 모든 보행자 사고에 1을 부여한 경우 사고별 인적피해수준의 심각도를 고려하지 않게 되며, 인명피해 심각도를 통해 이를 고려할 수 있다.
Getis-ord Gi*;를 실행한 결과 값인 의 크기순으로 Grid 1, 2, 3, 4, 5를 정하였다(Table 1). 이를 통해 통계적으로 유의미한 보행자사고 개선구역을 선정하였으며 값을 통해 보행자사고 개선구역 간 우선순위를 판별하였다. 또한, 핫스팟이 군집되어 있는 보행자사고 개선구역을 선정하기 위해 Grid 1, 2, 3, 4, 5뿐만 아니라 주변 격자들까지 포함하여 Zone 1, 2, 3, 4, 5를 선정하였다.
이론/모형
연구흐름은 Fig. 1과 같으며, ArcGIS 10.3을 사용하여 연구를 진행하였다.
커널 함수는 다양한 형태가 있지만 커널 함수 형태 선택은 결과에 큰 영향을 미치지 않는다(Silverman, 1986). 본 연구에서는 가장 광범위하게 쓰이는 형태 중 하나인 사차함수(quartic function)를 사용하였다(Schabenberger and Gotway, 2005). KDE에서 거리는 유클리디언 거리 또는 네트워크 거리로 계산할 수 있다.
본 연구에서는 보행자사고 발생 지점의 공간적 분포를 고려하기 위해 Getis-ord Gi*를 시행하였다. 값이 크다는 것은 해당하는 피처 i의 속성 값이 클 뿐만 아니라, 주변 피처들의 속성 값도 크다는 것을 의미하므로(Rankavat and Tiwari, 2013) 일정한 기준에 따라 값이 큰 피처뿐만 아니라, 그 주변의 피처들도 관심 지역에 포함하였다 .
하지만, 이 경우 사고의 심각도를 고려하지 않게 된다. 연구자의 의도에 따라 교통안전공단에서 개발한 사고별 인명피해 심각도의 합과 같은 다른 분석 필드에 대해 Getis-ord Gi*를 시행할 수 있다. 본 연구에서는 보행자사고 개선구역 내 미시적인 사고 분포를 확인하기 위해 설정된 존에 KDE를 적용하였다.
성능/효과
또한 값을 통해 선정된 구역 간의 우선순위를 판별할 수 있었다. 둘째, KDE를 통해 지정된 보행자사고 개선구역 내부의 사고 발생 지점의 미시적인 분포를 파악하여 사고 발생에 중대한 영향을 미치는 핫스팟들을 식별할 수 있었다. 또한, 핫스팟에서 높은 밀도 레벨을 가지는 부분을 확인함으로써 핫스팟 내부를 분석할 수 있었다.
단순히 값이 큰 격자만 관심구역에 포함시키지 않고 그 주변 격자까지 관심구역에 포함시킴으로써 높은 값을 가진 피처가 군집되어 있는 구역, 이른바 핫스팟이 군집되어 있는 구역을 찾는다는 Getis-ord Gi*의 목적과 부합하게 개선구역을 선정하였다. 또한 값을 통해 선정된 구역 간의 우선순위를 판별할 수 있었다. 둘째, KDE를 통해 지정된 보행자사고 개선구역 내부의 사고 발생 지점의 미시적인 분포를 파악하여 사고 발생에 중대한 영향을 미치는 핫스팟들을 식별할 수 있었다.
후속연구
본 연구에서는 사고 수에 대해 Getis-ord Gi*를 시행하였으나 연구자의 의도에 따라 사고 수가 아닌 사고별 인명피해 심각도의 합이나 심각도 지수 또는, 사망자 수 등 여러 가지 필드에 대해 본 연구에서 제시한 방법론을 시행할 수 있으므로 응용가능성이 클 것으로 기대된다.
이번 연구에서는 사고의 공간적인 분포 외에 여러 가지 사회경제적 변수들을 고려하지 않았다. 향후 연구에서 보행자사고 개선구역을 선정할 때 다른 사회경제적 변수들을 고려하여 더욱 현실의 상황을 반영한 개선구역 선정 방안을 제시할 필요가 있을 것이다.
참고문헌 (24)
Anderson, T.K. (2009), Kernel density estimation and k-means clustering to profile road accident hotspots, Accident Analysis and Prevention, Vol. 41, No. 3, pp. 359-364.
Bailey, T.C. and Gatrell, A.C. (1995), Interactive Spatial Data Analysis, Longman, Essex, UK.
Blazquez, C.A. and Celis, M.S. (2013), A spatial and temporal analysis of child pedestrian crashes in Santiago, Chile, Accident Analysis and Prevention, Vol. 50, pp. 304-311.
Flahaut, B., Mouchart, M., Martin, E.S., and Thomas, I. (2003), The local spatial autocorrelation and the kernel method for identifying black zones, Accident Analysis and Prevention, Vol. 35, No. 6, pp. 991-1004.
Jang, M., Jang, J., Joo, S., and So, K. (2012), Evaluations of pedestrian environment improvement plan and its performance, Transportation Technology and Policy, Vol. 9, No. 2, pp. 77-85. (in Korean)
Jang, K., Park. S.H., Kang, S., Song, K.H., Kang, S., and Chung, S. (2013), Evaluation of pedestrian safety: pedestrian crash hot spots and risk factors for injury severity, Transportation Research Record: Journal of the Transportation Research Board, Vol. 2393, pp. 104-116.
Jo, J., Park, W., and Kim, M. (2014), Development and application of traffic safety forecast index based on weather informations, Transportation Technology and Policy, Vol 11, No. 2, pp. 62-71. (in Korean)
Khan, G., Qin, X., and Noyce, D. (2008), Spatial analysis of weather crash patterns, Journal of Transportation Engineering, Vol. 134, No. 5, pp. 191-202.
Kingham, S., Sabel, C.E., and Bartie, P. (2011), The impact of the school run on road traffic accidents: a spatio-temporal analysis, Journal of Transport Geography, Vol. 19, No. 4, pp. 705-711.
Kuo, P., Zeng, X., and Lord, D. (2011), Guidelines for choosing hot-spot analysis tools based on data characteristics, network restrictions, and time distributions, Proceedings of the 91st Annual Meeting of the Transportation Research Board, Transportation Research Board, 22-26 January, Washington, D.C., USA. pp. 1-21.
Loo, B.P.Y., Yao, S., and Wu, J. (2011), Spatial point analysis of road crashes in shanghai: a GIS-based network kernel density method, Proceedings of 19th International Conference on Geoinformatics, IEEE, 24-26 June, Shanghai, China, pp. 1-6.
Manepalli, U.R.R., Bham, H.G., and Kandada, S. (2011), Evaluation of hotspots identification using kernel density estimation (K) and Getis-ord (Gi*) on I-630, Proceedings of the 3rd International Conference on Road Safety and Simulation, Transportation Research Board, 14-16 September, Indianapolis, USA, pp.1-17.
O'Sullivan, D. and Unwin, D.J. (2002), Geographic Information Analysis, John Wiley & Sons Inc., Hoboken, N.J.
Park, J. and Han, M. (2014), A study on the implementation of walking environment projects by analyzing characteristics of pedestrian accidents by local government types, Journal of Korean Society of Transportation, Vol. 32, No. 6, pp. 615-627. (in Korean with English abstract)
Plug, C., Xia, J., and Caulfield, C. (2011), Spatial and temporal visualisation techniques for crash analysis, Accident Analysis and Prevention, Vol. 43, No. 6, pp. 1937-1946.
Prasannakumar, V., Vijith, H., Charutha, R., and Geetha, N. (2011), Spatio-temporal clustering of road accidents: GIS based analysis and assessment, Procedia Social and Behavioral Sciences, Vol. 21, pp. 317-325.
Pulugurtha, S.S., Krishnakumar, V.K., and Nambisan, S.S. (2007), New methods to identify and rank high pedestrian crash zones, Accident Analysis and Prevention, Vol. 39, No. 4, pp. 800-811.
Rankavat, S. and Tiwari, G. (2013), Pedestrian accident analysis in Delhi using GIS, Journal of the Eastern Asia Society for Transportation Studies, Vol. 10, pp. 1446-1457.
Schabenberger, O. and Gotway, C.A. (2005), Statistical Methods for Spatial Data Analysis, Chapman & Hall/CRC, Boca Raton, Florida.
Silverman, B.W. (1986), Probability Density Estimation for Statistics and Data Analysis, Chapman and Hall, New York, N.Y.
Tobler, W.R. (1970), A computer movie simulating urban growth in the Detroit region, Economic Geography, Vol. 46, pp. 234-240.
Truong, L.T. and Somenahalli, S.V.C. (2011), Using GIS to identify pedestrian-vehicle crash hot spots and unsafe bus stops, Journal of Public Transportation, Vol. 14, No. 1, pp. 99-114.
Vemulapalli, S.S. (2015), GIS-Based Spatial and Temporal Analysis of Aging-Involved Crashes in Florida, Master's thesis, Florida State University, Florida, USA, 126p.
Xie, Z. and Yan, J. (2008), Kernel density estimation of traffic accidents in a network space, Computers, Environment, and Urban Systems, Vol. 32, No. 5, pp. 396-406.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.