로지스틱회귀분석 모델을 활용한 도시철도 사상사고 사고예측모형 개발에 대한 연구 Study on Accident Prediction Models in Urban Railway Casualty Accidents Using Logistic Regression Analysis Model원문보기
본 연구는 사고심각도 분류 및 예측을 위한 철도사고조사 통계기법에 관한 연구이다. 그동안의 선형 회귀분석은 사고 심각도 분석에 어려움이 있었으나 로지스틱회귀분석은 이를 보완할 수 있었다. 데이터마이닝 기법인 로지스틱회귀분석을 활용, 서울지하철(5~8호선) 역사 내 전도사고 중 에스컬레이터 전도사고 발생에 영향을 주는 사고예측 모형 변수는 사고자 연령, 음주여부, 사고 당시상황 및 행동, 핸드레일 잡음 여부였다. 분석의 정확도는 76.7%로 설명되었고 분석방법 결과에 따르면 정확도와 유의수준 측에서 로지스틱회귀분석 방법이 도시철도 사상사고 예측모형을 개발하는데 유용한 데이터마이닝 기법으로 판단된다.
본 연구는 사고심각도 분류 및 예측을 위한 철도사고조사 통계기법에 관한 연구이다. 그동안의 선형 회귀분석은 사고 심각도 분석에 어려움이 있었으나 로지스틱회귀분석은 이를 보완할 수 있었다. 데이터마이닝 기법인 로지스틱회귀분석을 활용, 서울지하철(5~8호선) 역사 내 전도사고 중 에스컬레이터 전도사고 발생에 영향을 주는 사고예측 모형 변수는 사고자 연령, 음주여부, 사고 당시상황 및 행동, 핸드레일 잡음 여부였다. 분석의 정확도는 76.7%로 설명되었고 분석방법 결과에 따르면 정확도와 유의수준 측에서 로지스틱회귀분석 방법이 도시철도 사상사고 예측모형을 개발하는데 유용한 데이터마이닝 기법으로 판단된다.
This study is a railway accident investigation statistic study with the purpose of prediction and classification of accident severity. Linear regression models have some difficulties in classifying accident severity, but a logistic regression model can be used to overcome the weaknesses of linear re...
This study is a railway accident investigation statistic study with the purpose of prediction and classification of accident severity. Linear regression models have some difficulties in classifying accident severity, but a logistic regression model can be used to overcome the weaknesses of linear regression models. The logistic regression model is applied to escalator (E/S) accidents in all stations on 5~8 lines of the Seoul Metro, using data mining techniques such as logistic regression analysis. The forecasting variables of E/S accidents in urban railway stations are considered, such as passenger age, drinking, overall situation, behavior, and handrail grip. In the overall accuracy analysis, the logistic regression accuracy is explained 76.7%. According to the results of this analysis, it has been confirmed that the accuracy and the level of significance of the logistic regression analysis make it a useful data mining technique to establish an accident severity prediction model for urban railway casualty accidents.
This study is a railway accident investigation statistic study with the purpose of prediction and classification of accident severity. Linear regression models have some difficulties in classifying accident severity, but a logistic regression model can be used to overcome the weaknesses of linear regression models. The logistic regression model is applied to escalator (E/S) accidents in all stations on 5~8 lines of the Seoul Metro, using data mining techniques such as logistic regression analysis. The forecasting variables of E/S accidents in urban railway stations are considered, such as passenger age, drinking, overall situation, behavior, and handrail grip. In the overall accuracy analysis, the logistic regression accuracy is explained 76.7%. According to the results of this analysis, it has been confirmed that the accuracy and the level of significance of the logistic regression analysis make it a useful data mining technique to establish an accident severity prediction model for urban railway casualty accidents.
본 연구에서는 서울도시철도(지하철) 역사 내 대합실, 승강장 등 철도시설 중 에스컬레이터 이용 여객의 전도사고(Falling Accident)에 영향을 주는 주요 사고유발 요인으로 한정하였고 크게 인적요인(사고자특성), 역사 환경 및 기하구조 요인, 사고자 행동 요인으로 구분하여 사고유발 요인을 독립변수로, 사고결과인 심각도 수준을 종속변수로 구분하여 각 독립변수 간 요인들이 종속변수인 사고 심각도에 어떤 인과관계 및 영향을 주는지 분석함으로써 사고감소 및 예방을 위한 효과적인 대책 마련을 제시하는데 연구목적이 있다.
제안 방법
본 연구에서는 데이터마이닝 기법 중 로지스틱회귀분석 모델을 통해 철도사상사고 중 에스컬레이터 전도사고에 영향을 주는 변수를 선택하여 사고예측 모형을 제시하였고, 통계 검증을 수행하여 신뢰성 및 정확성을 검증하였다.
본 연구에서는 에스컬레이터 전도사고와 관련 있다고 예측된 다양한 독립변수를 사용하여 전도사고 예측모형을 개발하는 것으로써 여러 독립변수를 사용하고자 로지스틱회귀분석 후 유의성 있는 변수들을 추출하였다.
대상 데이터
따라서 도시철도(지하철) 역사 내 발생빈도가 가장 많은 에스컬레이터 전도사고를 대상으로 로지스틱회귀분석을 통한 사고모형 개발과 정확도를 분석하여, 기존 선행 연구 방법보다 정확도가 높고 고차원적 데이터 분석 방법을 연구하는 것은 철도사고 조사 분야에서 매우 큰 의미가 있다.
에스컬레이터 전도사고의 사고예측모형을 개발하기 위해 Table 2과 같이 2014~2016년 3년간 서울교통공사 5~8호선 157개 역사내 에스컬레이터 전도사고 중 자체 사고조사 데이터를 대상으로, 이중 사고 원인이 불명, 기타 등 분석이 명확하지 않은 자료는 제거하였고 분석 가능한 사례만 표본추출(sampling)하여 전도사고와 관련이 있다고 판단한 14개 독립변수 항목을 선별하여 모형추적에 적합한 자료를 구축하였다.
데이터처리
각 철도사고조사 데이터는 회귀분석 프로그램인 SPSS 21.0 Software를 이용하여 분석하였으며, 기초통계를 통해 조사대상의 사고현황을 파악하였고 관련 독립변수 14개를 모두 넣고 회귀분석을 한 후 유의하지 않다고 나온 변수는 제거하면서 최종 모형을 구축하였다. 사고 심각도는 3년간 사망사고가 2건으로 매우 적어 중상, 출혈 등의 사례를 심각사고로, 그 외 통증 호소 후 귀가 등의 사례는 경미사고로 구분하였다.
이론/모형
로지스틱 회귀분석은 독립변수와 이분형 종속변수 간의 관계를 분석하는데 있어서 다른 회귀분석 방법에 비해 매우 유연하게 사용할 수 있어 본 연구에서는 로지스틱회귀분석(로짓 분석:logit analysis이라고도 함)을 사용하였다.
성능/효과
둘째, 시간, 날씨, 환승역, 승강장형태, 곡선승강장, 이용객의 소지품 소유 유무 등 환경 및 기하학 구조 등 기타 요인변수는 사고 심각도에 크게 유의하지 않은 것으로 분석되었다. 이는 철도운영자 측에서도 안전장치 확충 등 사고 방지를 위해 노력해야겠지만 이용자 부주의와 비정상적 이용행태에 따라 발생하는 1차적인 안전사고 발생방지를 위해 무엇보다도 이용객들을 대상으로 각종 매체를 활용한 안전교육 등 사고예방을 위한 홍보 및 안내방송을 보다 강화할 필요가 있다고 판단된다.
첫째, 65세 이상 노년층이 하행 방향 에스컬레이터에 음주 상태에서 핸드레일을 잡지 않고 걷거나 뛰는 행동으로 이용하는 경우 등 인적, 사고자 행동요인이 전도사고 심각도에 가장 높은 영향을 주는 것으로 나타났다. 이는 고령화 인구의 도시철도(지하철) 이용률 증가에 따라 편의시설 이용 시 본인 부주의로 인한 안전사고가 높다는 것을 의미한다.
후속연구
이는 철도운영자 측에서도 안전장치 확충 등 사고 방지를 위해 노력해야겠지만 이용자 부주의와 비정상적 이용행태에 따라 발생하는 1차적인 안전사고 발생방지를 위해 무엇보다도 이용객들을 대상으로 각종 매체를 활용한 안전교육 등 사고예방을 위한 홍보 및 안내방송을 보다 강화할 필요가 있다고 판단된다. 본 연구의 목적은 사고예측 모형 개발이었으나, 향후 사고 심각도에 영향을 미칠 수 있는 밝혀지지 않은 독립변수들을 지속적으로 보완, 발굴하여 보다 완벽하고 체계적인 모형 구축을 위한 연구가 수행되길 기대한다. 데이터마이닝 기법은 수집된 데이터의 크기, 형태, 가설설정 등 여러 조건들에 따라 데이터 분석방법이 달라지기 때문에 해당 사례에 적합한 기법을 선택해야 한다.
데이터마이닝 기법은 수집된 데이터의 크기, 형태, 가설설정 등 여러 조건들에 따라 데이터 분석방법이 달라지기 때문에 해당 사례에 적합한 기법을 선택해야 한다. 따라서 향후 본 연구 방법을 기초로 로지스트회귀분석 외 의사결정나무 모델 및 신경망 모형 분석, 구조방정식 모델 등 추가 데이터마이닝 분석방법을 활용하여 승강장에서 발생하는 열차 출입문 및 승강장 안전문 끼임 사고, 계단전도사고 등 사고예측 모형 분석은 물론, 더 나아가 시스템 고장예측, 시스템 잔존 수명평가 예측 등 향후 유사 연구에 데이터마이닝 기법을 적용함으로써 좀 더 신뢰성 있고 유의성 높은 모형개발이 될 수 있으리라 기대한다.
질의응답
핵심어
질문
논문에서 추출한 답변
잠재적 철도사상사고는 무엇에 의해 노출되는가?
8%대로 가장 높은 비율을 차지하고 있고[1], 최근 서울메트로와 서울도시철도공사가 통합된 서울교통공사 일일 이용객은 약 800만명을 넘고 있으며 교통 정체 및 혼잡이 심해질수록 도시철도 이용수요는 증가될 전망이다. 도시철도를 이용하려면 역사 시설물을 가장 먼저 접하게 되는데 이동 과정에서 승객은 계단, 엘리베이터, 에스컬레이터 등 편의시설과 승강장안전문과 같은 안전시설에 의해 잠재적 철도사상사고에 노출된다.
로지스틱 회귀분석 모델을 통해 사고예측 모형을 개발할 때 어떤 요인을 한정하였는가?
본 연구에서는 서울도시철도(지하철) 역사 내 대합실, 승강장 등 철도시설 중 에스컬레이터 이용 여객의 전도사고(Falling Accident)에 영향을 주는 주요 사고유발 요인으로 한정하였고 크게 인적요인(사고자특성), 역사 환경 및 기하구조 요인, 사고자 행동 요인으로 구분하여 사고유발 요인을 독립변수로, 사고결과인 심각도 수준을 종속변수로 구분하여 각 독립변수 간 요인들이 종속변수인 사고 심각도에 어떤 인과관계 및 영향을 주는지 분석함으로써 사고감소 및 예방을 위한 효과적인 대책 마련을 제시하는데 연구목적이 있다.
서울시 도시철도 수송은 어떤 상황인가?
서울시 도시철도 수송 분담률은 2013년 기준 타 교통수단 대비 약38.8%대로 가장 높은 비율을 차지하고 있고[1], 최근 서울메트로와 서울도시철도공사가 통합된 서울교통공사 일일 이용객은 약 800만명을 넘고 있으며 교통 정체 및 혼잡이 심해질수록 도시철도 이용수요는 증가될 전망이다. 도시철도를 이용하려면 역사 시설물을 가장 먼저 접하게 되는데 이동 과정에서 승객은 계단, 엘리베이터, 에스컬레이터 등 편의시설과 승강장안전문과 같은 안전시설에 의해 잠재적 철도사상사고에 노출된다.
참고문헌 (12)
www.seoul.go.kr (Accessed 29 June 2015)
T.H. Kim (2015) Accident risk by subject and line, SMRT, The report of risk analysis Seoul Metro 5-8 line.
C.W. Park, J.B. Wang, M.S. Kim, D,B. Choi et al. (2009) Development of risk assessment model for railway casualty accidents, Journal of Korean Society For Railway, 12(2), pp.190-198
J.P. Lee (2009) A Study on the passenger's accidents in the subway, MS Thesis, University of Seoul
S.G. Kim, I.H. Park, J.K. Oh, Y.K. Kim et al. (2014) A Factor analysis of urban railway casualty accidents and establishment of preventive response systems, Journal of Korean Society Of Civil Engineers, 34(3), pp.1017-1022
S.K. Kang (1995) Developing an accidents prediction model for railroad - highway grade crossings, Journal of Korea Transportation Research Society, 13(2), pp.43-58
J.H. Park, S.K, Kim (2012) Development an accidents forecasting models in freeway using multiple linear regression analysis, The Journal of The Korea Institute of Intelligent Transport Systems, 11(6), pp.145-154
H.S. Park, B.S. Son, H.J. Kim (2007) Development of accident prediction models for freeway interchange ramps, Journal of the Korean Society of Road Engineers, 25(3), pp.123-135
C. V. Zegeer, J. Hummer, D. Reinfurt, L. Herf and W. Hunter (1986) Safety effects of cross-section design for two-lane roads, Federal Highway Administration, FHWA-RD-87-008
※ AI-Helper는 부적절한 답변을 할 수 있습니다.