[학위논문]간선도로의 도로 및 교통 특성에 따른 교통사고수 산정과 사고 절감 편익 분석 연구 Accidents on Main Rural Highways Related to Road and Traffic Characteristics, and Analysis of Road User Benefits원문보기
기존의 도로 교통사고 관련 연구는 도로의 단일 설계요소에 대한 영향 등 도로의 미시적 특성을 주로 다루고 있어 설계 이전 계획 단계에서는 관련 연구를 활용하는데 한계가 존재한다. 계획 단계에 해당하는 타당성조사에서도 도로 교통사고에 의한 편익을 산정함에 있어 도로 교통사고에 대한 관련 연구 결과를 활용하지 못하고 국가 통계를 기반으로 한 사상자수 원단위를 활용하고 있다. 이로 인해 도로의 교통량 및 기하구조 변화나 도로의 통행속도 등 행태 변화에 따른 교통사고 발생확률 변화를 반영하지 못하는 한계가 있다. 특히 교통량과 교통사고 간의 관계를 U자형으로 규명하고 있는 기존 연구와 달리 노출도와 교통사고 사상자 간의 관계를 단순 선형으로 가정하여 도로유형·차로수별 사상자수 원단위를 단일 값으로 적용하고 있다. 본 연구에서는 계획 단계에서 활용할 수 있는 도로 기하구조, 통행속도, 교통량 자료 등 거시적 지표를 활용하여 교통사고 사상자수에 미치는 영향을 파악하고 이를 기반으로 타당성조사의 1억대-km당 사상자수 원단위를 개선하고자 한다. 본 연구에서는 도로 교통사고에 영향을 미치는 거시적 지표로 도로유형, 차로수, 제한속도, 노선 굴곡도, 구조물 연장비율 등 도로 기하구조 요인, 연평균 일교통량, 시간별 교통량 ...
기존의 도로 교통사고 관련 연구는 도로의 단일 설계요소에 대한 영향 등 도로의 미시적 특성을 주로 다루고 있어 설계 이전 계획 단계에서는 관련 연구를 활용하는데 한계가 존재한다. 계획 단계에 해당하는 타당성조사에서도 도로 교통사고에 의한 편익을 산정함에 있어 도로 교통사고에 대한 관련 연구 결과를 활용하지 못하고 국가 통계를 기반으로 한 사상자수 원단위를 활용하고 있다. 이로 인해 도로의 교통량 및 기하구조 변화나 도로의 통행속도 등 행태 변화에 따른 교통사고 발생확률 변화를 반영하지 못하는 한계가 있다. 특히 교통량과 교통사고 간의 관계를 U자형으로 규명하고 있는 기존 연구와 달리 노출도와 교통사고 사상자 간의 관계를 단순 선형으로 가정하여 도로유형·차로수별 사상자수 원단위를 단일 값으로 적용하고 있다. 본 연구에서는 계획 단계에서 활용할 수 있는 도로 기하구조, 통행속도, 교통량 자료 등 거시적 지표를 활용하여 교통사고 사상자수에 미치는 영향을 파악하고 이를 기반으로 타당성조사의 1억대-km당 사상자수 원단위를 개선하고자 한다. 본 연구에서는 도로 교통사고에 영향을 미치는 거시적 지표로 도로유형, 차로수, 제한속도, 노선 굴곡도, 구조물 연장비율 등 도로 기하구조 요인, 연평균 일교통량, 시간별 교통량 편차, 승용차 교통량 비율 등 교통량 요인, 평균 통행속도, 제한속도와 통행속도의 차이, 시간별 통행속도 편차 등 통행속도 요인으로 설정하였다. 자료 수집의 시간적 범위인 2016년~2018년을 대상으로 고속도로 143개(1,132km), 일반국도 164개(1,324km), 지방도 133개(1,215km)에 대한 자료를 수집하였다. 기존 연구에서는 일반적으로 모수적 추정 방법을 활용하였으며, 이 방식은 직관적이고 해석이 쉽다는 장점이 있으나, 자료간의 관계를 선형으로 가정함에 따라 예측 성능이 저하될 우려가 있다. 또한 교통량과 교통사고 간의 관계가 비선형임을 제시하는 연구도 존재한다. 아울러 본 연구에서 수집한 자료는 불완전한 패널자료이며, 변수 간의 모든 관계를 파악하는데 한계가 존재한다. 따라서 본 연구에서는 비모수·비선형 분석을 수행하고자 하였으며, 이 때 머신의 반복연산 기능을 활용하고자 머신러닝 기법을 활용하였다. 분석 방법론으로는 다양한 머신러닝 기법 중 불완전한 패널자료의 혼합효과를 제어할 수 있으며, 예측성능이 뛰어난 것으로 평가받는 XGboosting 기법을 활용하였다. 비모수·비선형 모형을 구축한 결과 기존 회귀모형이나 교통사고 분석에 주로 활용되는 음이항 및 일반화 포아송 모형에 비해 예측성능이 크게 향상되는 것으로 나타났다. 특히 사망자수 모형에서는 일반화 포아송모형의 예측성능이 낮게 나오는 것으로 보아 교통사고 사망 관련 분석에서 특정 분포를 가정하지 않는 비모수·비선형 분석이 적합하다는 사실을 밝혀냈다. 각기 구축한 부상자수와 사망자수 모형에서 가장 큰 영향력을 가지는 요인은 연평균 일교통량으로 나타났으며, 교통량 수준과 사상자수의 관계가 비선형 형태인 것으로 나타났다. 부상자수 모형에서는 교통량에 대한 영향이 대부분인 것과 달리 사망자수 모형의 경우 교통량 특성 외에도 도로 기하구조 요인의 영향이 크게 산정되었으며, 사망자 발생은 임의성이 큰 것으로 나타났다. 또한 사상자수와 교통량의 관계가 비선형이며, 부상자의 경우 교통량이 증가함에 따라 부상자 발생 확률이 증가하다 감소하는 형태를 보이는 반면, 사망자의 경우 교통량 증가에 따라 지속적으로 사망자 발생 확률이 감소하는 형태를 보이는 것으로 분석되었다. 다음으로 본 연구에서는 구축된 모형을 토대로 새로운 사상자수 원단위를 산정하였다. 이 때 타당성조사 단계에서 활용할 수 있도록 도로유형, 차로수, 연평균 일교통량을 중심으로 원단위 체계를 개편하고자 하였으며, 모형 구축 결과를 해석하여 산출된 연평균 일교통량 임계점을 기준으로 원단위를 달리 제시하였다. 본 연구의 사상자수 원단위를 활용하여 타당성조사 방식에 적용하여 사고비용을 산정한 결과 기존 원단위에 비해 통계치에 근접하게 산정되어 기존 방식에 비해 현실적인 방식임을 확인하였다. 본 연구에서 제시한 도로 교통사고 사상자수 원단위는 향후 수집 자료의 시간적·공간적 확대 및 강건성 검증이 필요하며, 타당성조사 활용을 위해 다양한 검증·실증 분석이 수반되어야 할 것이다. 다만, 다양한 요인의 영향을 고려하여 사상자수 원단위를 재정립해 더 현실적인 분석을 가능케 했다는 점, 교통량 수준에 따른 부상자와 사망자의 변화 추이가 상이하다는 것을 밝혀낸 점, 그리고 도로 교통사고 분석에 있어 머신러닝 기법의 활용이 교통사고 분석의 예측 성능을 향상시킬 수 있다는 것을 밝혀냈다는 점에서 본 연구의 의의가 있다.
기존의 도로 교통사고 관련 연구는 도로의 단일 설계요소에 대한 영향 등 도로의 미시적 특성을 주로 다루고 있어 설계 이전 계획 단계에서는 관련 연구를 활용하는데 한계가 존재한다. 계획 단계에 해당하는 타당성조사에서도 도로 교통사고에 의한 편익을 산정함에 있어 도로 교통사고에 대한 관련 연구 결과를 활용하지 못하고 국가 통계를 기반으로 한 사상자수 원단위를 활용하고 있다. 이로 인해 도로의 교통량 및 기하구조 변화나 도로의 통행속도 등 행태 변화에 따른 교통사고 발생확률 변화를 반영하지 못하는 한계가 있다. 특히 교통량과 교통사고 간의 관계를 U자형으로 규명하고 있는 기존 연구와 달리 노출도와 교통사고 사상자 간의 관계를 단순 선형으로 가정하여 도로유형·차로수별 사상자수 원단위를 단일 값으로 적용하고 있다. 본 연구에서는 계획 단계에서 활용할 수 있는 도로 기하구조, 통행속도, 교통량 자료 등 거시적 지표를 활용하여 교통사고 사상자수에 미치는 영향을 파악하고 이를 기반으로 타당성조사의 1억대-km당 사상자수 원단위를 개선하고자 한다. 본 연구에서는 도로 교통사고에 영향을 미치는 거시적 지표로 도로유형, 차로수, 제한속도, 노선 굴곡도, 구조물 연장비율 등 도로 기하구조 요인, 연평균 일교통량, 시간별 교통량 편차, 승용차 교통량 비율 등 교통량 요인, 평균 통행속도, 제한속도와 통행속도의 차이, 시간별 통행속도 편차 등 통행속도 요인으로 설정하였다. 자료 수집의 시간적 범위인 2016년~2018년을 대상으로 고속도로 143개(1,132km), 일반국도 164개(1,324km), 지방도 133개(1,215km)에 대한 자료를 수집하였다. 기존 연구에서는 일반적으로 모수적 추정 방법을 활용하였으며, 이 방식은 직관적이고 해석이 쉽다는 장점이 있으나, 자료간의 관계를 선형으로 가정함에 따라 예측 성능이 저하될 우려가 있다. 또한 교통량과 교통사고 간의 관계가 비선형임을 제시하는 연구도 존재한다. 아울러 본 연구에서 수집한 자료는 불완전한 패널자료이며, 변수 간의 모든 관계를 파악하는데 한계가 존재한다. 따라서 본 연구에서는 비모수·비선형 분석을 수행하고자 하였으며, 이 때 머신의 반복연산 기능을 활용하고자 머신러닝 기법을 활용하였다. 분석 방법론으로는 다양한 머신러닝 기법 중 불완전한 패널자료의 혼합효과를 제어할 수 있으며, 예측성능이 뛰어난 것으로 평가받는 XGboosting 기법을 활용하였다. 비모수·비선형 모형을 구축한 결과 기존 회귀모형이나 교통사고 분석에 주로 활용되는 음이항 및 일반화 포아송 모형에 비해 예측성능이 크게 향상되는 것으로 나타났다. 특히 사망자수 모형에서는 일반화 포아송모형의 예측성능이 낮게 나오는 것으로 보아 교통사고 사망 관련 분석에서 특정 분포를 가정하지 않는 비모수·비선형 분석이 적합하다는 사실을 밝혀냈다. 각기 구축한 부상자수와 사망자수 모형에서 가장 큰 영향력을 가지는 요인은 연평균 일교통량으로 나타났으며, 교통량 수준과 사상자수의 관계가 비선형 형태인 것으로 나타났다. 부상자수 모형에서는 교통량에 대한 영향이 대부분인 것과 달리 사망자수 모형의 경우 교통량 특성 외에도 도로 기하구조 요인의 영향이 크게 산정되었으며, 사망자 발생은 임의성이 큰 것으로 나타났다. 또한 사상자수와 교통량의 관계가 비선형이며, 부상자의 경우 교통량이 증가함에 따라 부상자 발생 확률이 증가하다 감소하는 형태를 보이는 반면, 사망자의 경우 교통량 증가에 따라 지속적으로 사망자 발생 확률이 감소하는 형태를 보이는 것으로 분석되었다. 다음으로 본 연구에서는 구축된 모형을 토대로 새로운 사상자수 원단위를 산정하였다. 이 때 타당성조사 단계에서 활용할 수 있도록 도로유형, 차로수, 연평균 일교통량을 중심으로 원단위 체계를 개편하고자 하였으며, 모형 구축 결과를 해석하여 산출된 연평균 일교통량 임계점을 기준으로 원단위를 달리 제시하였다. 본 연구의 사상자수 원단위를 활용하여 타당성조사 방식에 적용하여 사고비용을 산정한 결과 기존 원단위에 비해 통계치에 근접하게 산정되어 기존 방식에 비해 현실적인 방식임을 확인하였다. 본 연구에서 제시한 도로 교통사고 사상자수 원단위는 향후 수집 자료의 시간적·공간적 확대 및 강건성 검증이 필요하며, 타당성조사 활용을 위해 다양한 검증·실증 분석이 수반되어야 할 것이다. 다만, 다양한 요인의 영향을 고려하여 사상자수 원단위를 재정립해 더 현실적인 분석을 가능케 했다는 점, 교통량 수준에 따른 부상자와 사망자의 변화 추이가 상이하다는 것을 밝혀낸 점, 그리고 도로 교통사고 분석에 있어 머신러닝 기법의 활용이 교통사고 분석의 예측 성능을 향상시킬 수 있다는 것을 밝혀냈다는 점에서 본 연구의 의의가 있다.
This dissertation aims to provide a theoretical and technical understanding of road accident modeling approaches that can be adopted to the project evaluation of road infrastructure, which is also known as Preliminary Feasibility Studies (PFS). In particular, this dissertation can fill the technical...
This dissertation aims to provide a theoretical and technical understanding of road accident modeling approaches that can be adopted to the project evaluation of road infrastructure, which is also known as Preliminary Feasibility Studies (PFS). In particular, this dissertation can fill the technical knowledge gaps in estimating the unit of casualties (i.e., casualties per 100 million-km) while using data including macroscopic characteristics—e.g., road geometry, traffic speed, and traffic volume data—that are generally accessible during the process of PFS. Previous modeling efforts about road traffic accident have been successfully applied to many studies—although most modeling applications at the time of this writing have dominantly incorporated factors that represent microscopic patterns and characteristics affecting road traffic accidents—e.g., (Horizontal or Vertical Alignment and Curvature at single station). The project evaluation (i.e., PFS) that are conducted during the planning stage cannot utilize the results and findings from the previous modeling studies, since the microscopic characteristics are generally not available at the time of planning. Instead, the PFS and other feasibility studies use a single unit value that are measured by the national statistics with the predetermined assumptions—e.g., linear relationship between traffic volume and accident. In particular, unlike previous studies that identify the relationship between traffic volume and traffic accidents in U-shape form, the relationship between exposure and traffic accident casualties is assumed to be linear, and the number of casualties by road type and lane is simply applied as a single unit value. Put differently, the microscopic factors caused by behavioral patterns and variations in traffic accidents—such as traffic volume, geometric design elements, travel speed, etc., cannot be considered during the economic analysis (i.e., estimating monetary social benefits). This simplified application can lead to biased estimation of benefits and possibly cause the biased decision-making. Parametric modeling approaches have been dominantly used in many existing studies since they are relatively more easily interpretable and intuitive based on the strong algorithmic assumptions—e.g., the linear relationship between independent and dependent variables. Despite the advantages of interpretability and applicability, the predetermined assumptions for the parametric approaches can lead to biased and misleading predictions, which may also lead to poor prediction performances. Moreover, the relationship between traffic volume and traffic accidents is generally nonlinear reveal in many previous studies. Over the past decade, the application of nonparametric approaches such as machine learning (ML) has proven to be successful in many real-world applications. Despite the high predictive performances of ML, the acknowledged criticism about many ML techniques is their lack of interpretability (a.k.a., blackbox estimator). In this sense, this dissertation aims to not only investigate the capability of ML in modeling traffic accidents, but also provide the ways to interpret ML models. In particular, this dissertation can fill the technical knowledge gaps in applying ML techniques to the field of transportation and other urban-related topics. In particular, XGboost techniques, ML combined with rule-based methods, are used to understand and predict road traffic accidents, which have comparative advantages in dealing with incomplete panel datasets that may lead to detrimental effects (e.g., heterogeneity). The data used in this dissertation include road geometry factors such as road type, number of lanes, speed limit, line curvature, structure extension ratio, average traffic rate, average traffic rate, difference in traffic speed, and time-to-hour traffic speed were established. Data were collected from three different road segments in three consecutive years, including 143 express highways(1,132 km), 164 national roads(1,324 km) and 133 rural roads(1,215 km) from 2016 to 2018. As a result of establishing a nonparametric and non-linear model, the predictive performance is significantly improved compared to the negative binomial and generalized Poisson models, which are mainly used for existing regression models or traffic accident analysis. In particular, the predictive performance of the generalized Poisson model is relatively poor in predicting fatal accidents (e.g., death events) that ML models. It is mainly due to the fact that ML models do not assume any probability distributions in estimating models. The most determinant factors affecting traffic accidents in both injured and fatal cases were turned out to be the average daily traffic per year (AADT). Moreover, the relationship between traffic level and casualties was non-linear. In contrast to the majority of the effects on traffic in the injured number model, the effects of road geometry factors in addition to the traffic volume characteristics were largely calculated, and the occurrence of deaths was found to be highly arbitrary. It was also analyzed that the relationship between casualties and traffic volume is nonlinear, and the probability of injury increases and decreases as traffic increases, while the probability of death decreases continuously as traffic increases. In future studies, this dissertation calculated a new casualty unit based on the estimated model. At this time, the original unit system was intended to be reorganized based on road type, number of lanes, and average daily traffic per year for use in the feasibility study phase, and different units were presented based on the average daily traffic threshold calculated by interpreting the results of the model construction. The accident cost was calculated using the number of casualties unit in this study to be close to the statistics compared to the existing unit, confirming that it is more realistic than the existing method. The road traffic accident casualties unit presented in this study needs to be verified for the temporal and spatial expansion and robustness of future collection data, and various verification and demonstration analyses should be accompanied to utilize the feasibility study. However, this study is significant in that it has found that the effects of various factors can improve the predictive performance of traffic accident analysis by re-establishing casualty units for more realistic analysis, finding that changes in injuries and deaths vary depending on traffic volume levels, and using ML techniques in road traffic accident analysis.
This dissertation aims to provide a theoretical and technical understanding of road accident modeling approaches that can be adopted to the project evaluation of road infrastructure, which is also known as Preliminary Feasibility Studies (PFS). In particular, this dissertation can fill the technical knowledge gaps in estimating the unit of casualties (i.e., casualties per 100 million-km) while using data including macroscopic characteristics—e.g., road geometry, traffic speed, and traffic volume data—that are generally accessible during the process of PFS. Previous modeling efforts about road traffic accident have been successfully applied to many studies—although most modeling applications at the time of this writing have dominantly incorporated factors that represent microscopic patterns and characteristics affecting road traffic accidents—e.g., (Horizontal or Vertical Alignment and Curvature at single station). The project evaluation (i.e., PFS) that are conducted during the planning stage cannot utilize the results and findings from the previous modeling studies, since the microscopic characteristics are generally not available at the time of planning. Instead, the PFS and other feasibility studies use a single unit value that are measured by the national statistics with the predetermined assumptions—e.g., linear relationship between traffic volume and accident. In particular, unlike previous studies that identify the relationship between traffic volume and traffic accidents in U-shape form, the relationship between exposure and traffic accident casualties is assumed to be linear, and the number of casualties by road type and lane is simply applied as a single unit value. Put differently, the microscopic factors caused by behavioral patterns and variations in traffic accidents—such as traffic volume, geometric design elements, travel speed, etc., cannot be considered during the economic analysis (i.e., estimating monetary social benefits). This simplified application can lead to biased estimation of benefits and possibly cause the biased decision-making. Parametric modeling approaches have been dominantly used in many existing studies since they are relatively more easily interpretable and intuitive based on the strong algorithmic assumptions—e.g., the linear relationship between independent and dependent variables. Despite the advantages of interpretability and applicability, the predetermined assumptions for the parametric approaches can lead to biased and misleading predictions, which may also lead to poor prediction performances. Moreover, the relationship between traffic volume and traffic accidents is generally nonlinear reveal in many previous studies. Over the past decade, the application of nonparametric approaches such as machine learning (ML) has proven to be successful in many real-world applications. Despite the high predictive performances of ML, the acknowledged criticism about many ML techniques is their lack of interpretability (a.k.a., blackbox estimator). In this sense, this dissertation aims to not only investigate the capability of ML in modeling traffic accidents, but also provide the ways to interpret ML models. In particular, this dissertation can fill the technical knowledge gaps in applying ML techniques to the field of transportation and other urban-related topics. In particular, XGboost techniques, ML combined with rule-based methods, are used to understand and predict road traffic accidents, which have comparative advantages in dealing with incomplete panel datasets that may lead to detrimental effects (e.g., heterogeneity). The data used in this dissertation include road geometry factors such as road type, number of lanes, speed limit, line curvature, structure extension ratio, average traffic rate, average traffic rate, difference in traffic speed, and time-to-hour traffic speed were established. Data were collected from three different road segments in three consecutive years, including 143 express highways(1,132 km), 164 national roads(1,324 km) and 133 rural roads(1,215 km) from 2016 to 2018. As a result of establishing a nonparametric and non-linear model, the predictive performance is significantly improved compared to the negative binomial and generalized Poisson models, which are mainly used for existing regression models or traffic accident analysis. In particular, the predictive performance of the generalized Poisson model is relatively poor in predicting fatal accidents (e.g., death events) that ML models. It is mainly due to the fact that ML models do not assume any probability distributions in estimating models. The most determinant factors affecting traffic accidents in both injured and fatal cases were turned out to be the average daily traffic per year (AADT). Moreover, the relationship between traffic level and casualties was non-linear. In contrast to the majority of the effects on traffic in the injured number model, the effects of road geometry factors in addition to the traffic volume characteristics were largely calculated, and the occurrence of deaths was found to be highly arbitrary. It was also analyzed that the relationship between casualties and traffic volume is nonlinear, and the probability of injury increases and decreases as traffic increases, while the probability of death decreases continuously as traffic increases. In future studies, this dissertation calculated a new casualty unit based on the estimated model. At this time, the original unit system was intended to be reorganized based on road type, number of lanes, and average daily traffic per year for use in the feasibility study phase, and different units were presented based on the average daily traffic threshold calculated by interpreting the results of the model construction. The accident cost was calculated using the number of casualties unit in this study to be close to the statistics compared to the existing unit, confirming that it is more realistic than the existing method. The road traffic accident casualties unit presented in this study needs to be verified for the temporal and spatial expansion and robustness of future collection data, and various verification and demonstration analyses should be accompanied to utilize the feasibility study. However, this study is significant in that it has found that the effects of various factors can improve the predictive performance of traffic accident analysis by re-establishing casualty units for more realistic analysis, finding that changes in injuries and deaths vary depending on traffic volume levels, and using ML techniques in road traffic accident analysis.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.