본 연구에서는 고속도로에서 발생하는 졸음사고가 운전자의 연속주행에 따른 피로도에 따라 사고 경향이 나타날 것이라 가정하고 고속도로의 졸음사고와 연속주행시간 간의 관계를 머신러닝 알고리즘을 구축하여 고속도로의 졸음사고 발생 위험구간을 선정 방법론을 개발하였다. 머신러닝 기반 분석 방법론은 종속변수의 범주 개수가 두 개인 경우, 즉 이항형 문제일 때 일반적으로 사용되는 통계학 모형인 ...
본 연구에서는 고속도로에서 발생하는 졸음사고가 운전자의 연속주행에 따른 피로도에 따라 사고 경향이 나타날 것이라 가정하고 고속도로의 졸음사고와 연속주행시간 간의 관계를 머신러닝 알고리즘을 구축하여 고속도로의 졸음사고 발생 위험구간을 선정 방법론을 개발하였다. 머신러닝 기반 분석 방법론은 종속변수의 범주 개수가 두 개인 경우, 즉 이항형 문제일 때 일반적으로 사용되는 통계학 모형인 로지스틱 회귀분석 모형 알고리즘을 구축하여 분석을 시행하였다. 따라서 졸음사고에 가장 영향을 미칠 것이라 생각되는 피로도를 졸음사고 발생 위험 구간 선정에 사용하려 했지만 잠재변수의 성격을 가지고 있는 피로도는 관측하거나 측정하기 어려운 지표이기 때문에 피로도와 밀접한 연속주행시간을 사용하기로 하였다. 각 구간별 연속주행시간을 산출하기 위하여 2017년 6월부터 2018년 5월까지 1년(각 월에서 7일씩 총 84일)간의 T-map 네비게이션 데이터를 수집하였다. 또한 졸음사고에 영향을 미칠 것이라 판단한 굴곡도, 교통량, 평균속도, 지체도, 콘존길이, 연속주행시간 지수(FSI), CVaR1%를 독립변수로 사용하여 머신러닝 기반의 로지스틱 회귀분석을 진행하였으며 종속변수인 졸음사고 발생 위험구간을 선정하는 방법을 사고이력 기반, 사고이력 및 연속주행시간 기반, 연속주행시간 기반으로 분류해 총 3가지 기준을 사용하였다. 이때, FSI와 CVaR1%는 네비게이션 데이터가 수집되어야만 산출할 수 있는 변수이므로 추후 다른 지역이나 다른 시간범위에 적용하기 어려워 활용성이 낮다는 점을 보완하기 위하여 연속주행시간 지수(FSI) 및 CVaR1%을 포함한 7개의 독립변수와 제외한 5개의 독립변수로 구분하여 총 6개의 모형을 구축하여 예측력을 비교하였다. 분석 결과 모든 모형에서 5개의 변수만 사용한 모형보다 7개의 변수를 사용한 모형이 더 높은 적중률을 보였으며 종속변수로 사고이력과 연속주행시간 기반으로 선정한 위험구간을 사용하고 7개의 변수를 모두 독립변수로 사용한 모형의 적중률이 가장 높게 나타났다. 졸음사고는 연속주행시간 이외에 피로, 산소부족, 음주/약물, 도로환경 등 다양한 요인에 의해 발생하며 이러한 요인은 인적 요인이므로 졸음사고 예측에 반영하기 어려울 것이라 예상된다. 그러나 동일한 신체적 조건과 상황이라도 도로 선형이나 교통류 상황에 의해 졸음사고 발생 가능성은 달라지므로 이러한 요인들을 반영한 졸음사고 위험구간 선정 모형의 연구가 수행되어야 할 것으로 판단된다.
본 연구에서는 고속도로에서 발생하는 졸음사고가 운전자의 연속주행에 따른 피로도에 따라 사고 경향이 나타날 것이라 가정하고 고속도로의 졸음사고와 연속주행시간 간의 관계를 머신러닝 알고리즘을 구축하여 고속도로의 졸음사고 발생 위험구간을 선정 방법론을 개발하였다. 머신러닝 기반 분석 방법론은 종속변수의 범주 개수가 두 개인 경우, 즉 이항형 문제일 때 일반적으로 사용되는 통계학 모형인 로지스틱 회귀분석 모형 알고리즘을 구축하여 분석을 시행하였다. 따라서 졸음사고에 가장 영향을 미칠 것이라 생각되는 피로도를 졸음사고 발생 위험 구간 선정에 사용하려 했지만 잠재변수의 성격을 가지고 있는 피로도는 관측하거나 측정하기 어려운 지표이기 때문에 피로도와 밀접한 연속주행시간을 사용하기로 하였다. 각 구간별 연속주행시간을 산출하기 위하여 2017년 6월부터 2018년 5월까지 1년(각 월에서 7일씩 총 84일)간의 T-map 네비게이션 데이터를 수집하였다. 또한 졸음사고에 영향을 미칠 것이라 판단한 굴곡도, 교통량, 평균속도, 지체도, 콘존길이, 연속주행시간 지수(FSI), CVaR1%를 독립변수로 사용하여 머신러닝 기반의 로지스틱 회귀분석을 진행하였으며 종속변수인 졸음사고 발생 위험구간을 선정하는 방법을 사고이력 기반, 사고이력 및 연속주행시간 기반, 연속주행시간 기반으로 분류해 총 3가지 기준을 사용하였다. 이때, FSI와 CVaR1%는 네비게이션 데이터가 수집되어야만 산출할 수 있는 변수이므로 추후 다른 지역이나 다른 시간범위에 적용하기 어려워 활용성이 낮다는 점을 보완하기 위하여 연속주행시간 지수(FSI) 및 CVaR1%을 포함한 7개의 독립변수와 제외한 5개의 독립변수로 구분하여 총 6개의 모형을 구축하여 예측력을 비교하였다. 분석 결과 모든 모형에서 5개의 변수만 사용한 모형보다 7개의 변수를 사용한 모형이 더 높은 적중률을 보였으며 종속변수로 사고이력과 연속주행시간 기반으로 선정한 위험구간을 사용하고 7개의 변수를 모두 독립변수로 사용한 모형의 적중률이 가장 높게 나타났다. 졸음사고는 연속주행시간 이외에 피로, 산소부족, 음주/약물, 도로환경 등 다양한 요인에 의해 발생하며 이러한 요인은 인적 요인이므로 졸음사고 예측에 반영하기 어려울 것이라 예상된다. 그러나 동일한 신체적 조건과 상황이라도 도로 선형이나 교통류 상황에 의해 졸음사고 발생 가능성은 달라지므로 이러한 요인들을 반영한 졸음사고 위험구간 선정 모형의 연구가 수행되어야 할 것으로 판단된다.
The present study assumes that the drowsy driving accidents on highways would have a certain pattern associated with the driver’s fatigue degree caused by their continuous driving. Therefore we established the machine learning algorithm to study the relationship between drowsy driving on highways an...
The present study assumes that the drowsy driving accidents on highways would have a certain pattern associated with the driver’s fatigue degree caused by their continuous driving. Therefore we established the machine learning algorithm to study the relationship between drowsy driving on highways and continuous driving time, thus developed the selection methodology of highway sections with higher risk of drowsy driving. Logistic regression model algorithm was performed for the analysis methodology based on machine learning, as it is the statistic model generally used for two dependent variables, or binomial distribution. Fatigue is regarded to have the greatest impact in drowsy driving accidents , but its degree is the factor of latent variable and too complex to be observed or measured. Therefore continuous driving time which was closely associated with the fatigue degree was used in the present study. One-year data of T-map navigation were collected from June of 2017 to May of 2018, seven days of each months and 84 days in total, in order to calculate the continuous driving time of each sections. Logistic regression analysis based on machine learning was performed with independent variables which accounted for drowsy driving accidents, including degree of sinuosity, traffic flow, average speed, degree of delay, length of conezones, FSI, and CVaR1%. Three categories based on the following were used for selecting high risk sections as dependent variables; accident history, continuous driving time, and both. In particular, FSI and CVaR1% required navigation data to be computed therefore were disadvantageous to be applied to other regions or time period in further studies. Accordingly, predictive powers were compared between the six models established, with all the seven independent variables including FSI and CVaR1% and the those without these two factors. As a result, compared with the model with five factors, the model with seven factors demonstrated higher accuracy rate in every models. The highest accuracy rate was observed in the model with seven factors as independent variables with high risk section selected upon the accident history and continuous driving time as dependent variables. In addition to continuous driving time, drowsy driving accidents occur as a result of various factors such as fatigue, lack of oxygen, alcohol or drugs, or road circumstances. Because of their human factor features, they are seldom anticipated to be reflected in predicting drowsy driving accidents. Nevertheless, despite of equal physical condition and circumstances, incidence of drowsy driving accidents may change due to road alignments or traffic flow. Hence it is essential to study the selection model of high risk for drowsy driving accidents concerning for all these factors.
The present study assumes that the drowsy driving accidents on highways would have a certain pattern associated with the driver’s fatigue degree caused by their continuous driving. Therefore we established the machine learning algorithm to study the relationship between drowsy driving on highways and continuous driving time, thus developed the selection methodology of highway sections with higher risk of drowsy driving. Logistic regression model algorithm was performed for the analysis methodology based on machine learning, as it is the statistic model generally used for two dependent variables, or binomial distribution. Fatigue is regarded to have the greatest impact in drowsy driving accidents , but its degree is the factor of latent variable and too complex to be observed or measured. Therefore continuous driving time which was closely associated with the fatigue degree was used in the present study. One-year data of T-map navigation were collected from June of 2017 to May of 2018, seven days of each months and 84 days in total, in order to calculate the continuous driving time of each sections. Logistic regression analysis based on machine learning was performed with independent variables which accounted for drowsy driving accidents, including degree of sinuosity, traffic flow, average speed, degree of delay, length of conezones, FSI, and CVaR1%. Three categories based on the following were used for selecting high risk sections as dependent variables; accident history, continuous driving time, and both. In particular, FSI and CVaR1% required navigation data to be computed therefore were disadvantageous to be applied to other regions or time period in further studies. Accordingly, predictive powers were compared between the six models established, with all the seven independent variables including FSI and CVaR1% and the those without these two factors. As a result, compared with the model with five factors, the model with seven factors demonstrated higher accuracy rate in every models. The highest accuracy rate was observed in the model with seven factors as independent variables with high risk section selected upon the accident history and continuous driving time as dependent variables. In addition to continuous driving time, drowsy driving accidents occur as a result of various factors such as fatigue, lack of oxygen, alcohol or drugs, or road circumstances. Because of their human factor features, they are seldom anticipated to be reflected in predicting drowsy driving accidents. Nevertheless, despite of equal physical condition and circumstances, incidence of drowsy driving accidents may change due to road alignments or traffic flow. Hence it is essential to study the selection model of high risk for drowsy driving accidents concerning for all these factors.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.