해양사고 감소를 위해 다양한 연구들이 수행되어 왔다. 그에 비해 준해양사고에 대한 연구는 미미한 수준에 그치고 있다. 준해양사고는 건수가 많은 대신 내용이 정성적이기 때문에 분석하기에는 현실적인 어려움이 있었다. 하지만 해양사고 감소를 위해서는 준해양사고의 정량적인 분석이 필요하다. 이번 논문의 목적은 준해양사고 경향을 예측하고 해양사고를 감소시키기 위해 빅데이터 기법을 적용하여 준해양사고 데이터를 정량적으로 분석하는 것이다. 이를 위해 10,000여건의 준해양사고 보고서를 전처리 작업을 통해 통일된 양식으로 정리하였다. 전처리된 데이터에 대해서 1차적으로, 텍스트마이닝 기법을 적용하여 항해 중 준해양사고 발생원인에 대한 주요 키워드를 도출하였다. 주요 키워드에 대해 2차로 시계열 및 클러스터 분석을 통해 발생할 수 있는 준해양사고 상황에 대한 경향 예측을 도출하였다. 이번 연구에서는 정성적 자료인 준해양사고 보고서를 빅데이터 기법을 활용하여 정량화된 데이터로 전환할 수 있고, 이를 통해 통계적 분석이 가능함을 확인하였다. 또한 빅데이터 기법을 통해 차 후 발생할 수 있는 준해양사고에 대한 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다.
해양사고 감소를 위해 다양한 연구들이 수행되어 왔다. 그에 비해 준해양사고에 대한 연구는 미미한 수준에 그치고 있다. 준해양사고는 건수가 많은 대신 내용이 정성적이기 때문에 분석하기에는 현실적인 어려움이 있었다. 하지만 해양사고 감소를 위해서는 준해양사고의 정량적인 분석이 필요하다. 이번 논문의 목적은 준해양사고 경향을 예측하고 해양사고를 감소시키기 위해 빅데이터 기법을 적용하여 준해양사고 데이터를 정량적으로 분석하는 것이다. 이를 위해 10,000여건의 준해양사고 보고서를 전처리 작업을 통해 통일된 양식으로 정리하였다. 전처리된 데이터에 대해서 1차적으로, 텍스트마이닝 기법을 적용하여 항해 중 준해양사고 발생원인에 대한 주요 키워드를 도출하였다. 주요 키워드에 대해 2차로 시계열 및 클러스터 분석을 통해 발생할 수 있는 준해양사고 상황에 대한 경향 예측을 도출하였다. 이번 연구에서는 정성적 자료인 준해양사고 보고서를 빅데이터 기법을 활용하여 정량화된 데이터로 전환할 수 있고, 이를 통해 통계적 분석이 가능함을 확인하였다. 또한 빅데이터 기법을 통해 차 후 발생할 수 있는 준해양사고에 대한 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다.
Various studies have been conducted to reduce marine accidents. However, research on marine incidents is only marginal. There are many reports of marine incidents, but the main content of existing studies has been qualitative, which makes quantitative analysis difficult. However, quantitative analys...
Various studies have been conducted to reduce marine accidents. However, research on marine incidents is only marginal. There are many reports of marine incidents, but the main content of existing studies has been qualitative, which makes quantitative analysis difficult. However, quantitative analysis of marine accidents is necessary to reduce marine incidents. The purpose of this paper is to analyze marine incident data quantitatively by applying big data techniques to predict marine incident trends and reduce marine accident. To accomplish this, about 10,000 marine incident reports were prepared in a unified format through pre-processing. Using this preprocessed data, we first derived major keywords for the Marine incidents at sea using text mining techniques. Secondly, time series and cluster analysis were applied to major keywords. Trends for possible marine incidents were predicted. The results confirmed that it is possible to use quantified data and statistical analysis to address this topic. Also, we have confirmed that it is possible to provide information on preventive measures by grasping objective tendencies for marine incidents that may occur in the future through big data techniques.
Various studies have been conducted to reduce marine accidents. However, research on marine incidents is only marginal. There are many reports of marine incidents, but the main content of existing studies has been qualitative, which makes quantitative analysis difficult. However, quantitative analysis of marine accidents is necessary to reduce marine incidents. The purpose of this paper is to analyze marine incident data quantitatively by applying big data techniques to predict marine incident trends and reduce marine accident. To accomplish this, about 10,000 marine incident reports were prepared in a unified format through pre-processing. Using this preprocessed data, we first derived major keywords for the Marine incidents at sea using text mining techniques. Secondly, time series and cluster analysis were applied to major keywords. Trends for possible marine incidents were predicted. The results confirmed that it is possible to use quantified data and statistical analysis to address this topic. Also, we have confirmed that it is possible to provide information on preventive measures by grasping objective tendencies for marine incidents that may occur in the future through big data techniques.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이번 연구를 통해 비정형화 및 텍스트 위주로 되어 있는 준해양사고 데이터를 활용하여 기존과 같이 단순한 전문가들의 의견이 반영된 교훈도출을 넘어선 정량적인 값을 도출하고자 노력하였다. 이를 위하여 현재 전 산업 분야에서 많이 이용되는 빅데이터 분석기법을 활용하였고, 항해 중 준해양사고의 발생원인에 대하여 분석해 보았다.
제안 방법
이 분석법을 활용하여 수집된 준해양사고 데이터를 분석하였고, 그 결과를 바탕으로 준해양사고 데이터를 정량적으로 분석할 수 있는 표준화된 모델링을 개발하였다. 또한 이를 적용하여 항해 중 준해양사고가 발생하는 원인을 분석하였다.
본 연구에서는 준해양사고 데이터의 특징을 분석하고, 이를 고려하여 텍스트 마이닝이라는 빅데이터 분석기법을 적용하였다. 이 분석법을 활용하여 수집된 준해양사고 데이터를 분석하였고, 그 결과를 바탕으로 준해양사고 데이터를 정량적으로 분석할 수 있는 표준화된 모델링을 개발하였다. 또한 이를 적용하여 항해 중 준해양사고가 발생하는 원인을 분석하였다.
이번 연구를 통해 비정형화 및 텍스트 위주로 되어 있는 준해양사고 데이터를 활용하여 기존과 같이 단순한 전문가들의 의견이 반영된 교훈도출을 넘어선 정량적인 값을 도출하고자 노력하였다. 이를 위하여 현재 전 산업 분야에서 많이 이용되는 빅데이터 분석기법을 활용하였고, 항해 중 준해양사고의 발생원인에 대하여 분석해 보았다.
대상 데이터
준해양사고제도발전협의회에 소속되어 있는 회원에게 준 해양사고 자료를 요청하였으며 그 중 10개 선사로부터 2015년에서 2017년 2분기까지의 준해양사고 데이터 10,000여건을 회신하여 Fig. 1과 같은 과정으로 분석하였다.
데이터처리
1차 분석을 통해 도출된 키워드를 전문가 검증을 통해 의미 없는 데이터를 제거하여, 발생 빈도 상위 10건에 대하여 2차 분석을 진행하였다. 2차 분석은 시계열 및 클러스트 분석을 활용하였고, 특정 기간별 중요 키워드 파악, 단어간의 군집관계 파악 등을 통해 전문가가 사고예방을 위한 보조수단으로 활용할 수 있도록 하였다.
이론/모형
코딩작업을 통해 전체 자료를 내용은 변경하지 않고 Table 1과 같이 동일한 양식에 정리하였고, Table 2와 같이 선종, 사고종류 등의 정형화된 데이터와 일시, 사고원인 등의 비정형화된 데이터로 구분하였다. 본 연구에서는 비정형화된 데이터에 대하여 텍스트 마이닝이라는 기법을 활용하여 1차 분석하였다.
본 연구에서는 준해양사고 데이터의 특징을 분석하고, 이를 고려하여 텍스트 마이닝이라는 빅데이터 분석기법을 적용하였다. 이 분석법을 활용하여 수집된 준해양사고 데이터를 분석하였고, 그 결과를 바탕으로 준해양사고 데이터를 정량적으로 분석할 수 있는 표준화된 모델링을 개발하였다.
날짜, 시간, 장소, 위치 등은 정형화된 데이터이고, 사고 개요, 발생 원인, 예방 대책 등은 비정형화된 데이터이다. 이 중 사고예방에 대한 핵심 내용은 비정형화된 데이터이므로, 이에 대하여 빅데이터 분석 기법으로 텍스트 마이닝을 적용하였다.
성능/효과
결과적으로 준해양사고 자료에 대해 빅데이터 분석기술을 활용하여 정량화된 데이터로 전환할 수 있고, 이를 통해 통계적 분석이 가능함을 확인할 수 있었다. 나아가 차 후 발생할 수 있는 준해양사고의 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다.
결과적으로 준해양사고 자료에 대해 빅데이터 분석기술을 활용하여 정량화된 데이터로 전환할 수 있고, 이를 통해 통계적 분석이 가능함을 확인할 수 있었다. 나아가 차 후 발생할 수 있는 준해양사고의 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다. 더불어 준해양사고 데이터를 대상으로 새로운 분석기술을 적용한 시도가 처음이라는 점과 이를 통해 일부 사고 예방에 대한 결과를 도출한 점은 의미 있는 것으로 판단된다.
후속연구
(5) BEHAVIOR, DEFECTIVE, MAINTENANCE, HORSEPLAY 키워드의 경우 2015년~2016년까지 비슷한 분포율을 보이다가 2017년에 들어 급증과 급감을 보이고 있으므로 추가적인 분석이 필요하다.
마지막으로 이번 연구는 항해 중 준해양사고 발생원인으로 연구의 범위를 제한하였으나 좀 더 많은 자료를 수집하여 정박중, 묘박중, 사건 개요, 예방 대책 등 다양한 관점에서 빅데이터 분석 기법을 적용할 필요가 있으며, 더불어 분석된 준해양사고와 실제 해양사고와의 관계를 비교 검증할 수 있다면 더욱 의미 있는 연구가 되리라 사료된다.
아쉬운 점은 연구에 사용된 준해양사고 데이터가 2년 6개월의 짧은 기간에 10개 선사로부터 수집된 한정된 데이터라는 점과 이로 인한 데이터의 객관성에 대한 한계이다. 또한 빅데이터라 부르기에는 데이터의 양이 충분하지 못했고, 현재의 빅데이터 분석기술의 제약으로 분석의 과정 사이사이에 관련내용을 잘 이해하는 전문가 집단의 수동적인 개입이 불가피하다는 점이다.
또한 빅데이터라 부르기에는 데이터의 양이 충분하지 못했고, 현재의 빅데이터 분석기술의 제약으로 분석의 과정 사이사이에 관련내용을 잘 이해하는 전문가 집단의 수동적인 개입이 불가피하다는 점이다. 이러한 부족한 부분은 장기간의 걸쳐 빅데이터를 구성하고, 분석과정 중에 나타나는 오류와 사람의 개입에 대한 부분을 축적된 데이터를 바탕으로 자동화한다면 충분히 개선 가능하리라 사료된다.
질의응답
핵심어
질문
논문에서 추출한 답변
클러스트 분석이란?
클러스트 분석은 비슷한 특성을 가진 개체를 합쳐가면서 최종적으로 유사 특성의 그룹을 발견하는 방법이다(Jo, 2011).
해양사고 감소를 위해 필요한 것은?
준해양사고는 건수가 많은 대신 내용이 정성적이기 때문에 분석하기에는 현실적인 어려움이 있었다. 하지만 해양사고 감소를 위해서는 준해양사고의 정량적인 분석이 필요하다. 이번 논문의 목적은 준해양사고 경향을 예측하고 해양사고를 감소시키기 위해 빅데이터 기법을 적용하여 준해양사고 데이터를 정량적으로 분석하는 것이다.
준해양사고에 대한 연구가 미미한 수준에 그친 이유는?
그에 비해 준해양사고에 대한 연구는 미미한 수준에 그치고 있다. 준해양사고는 건수가 많은 대신 내용이 정성적이기 때문에 분석하기에는 현실적인 어려움이 있었다. 하지만 해양사고 감소를 위해서는 준해양사고의 정량적인 분석이 필요하다.
참고문헌 (11)
Cho, S. G., J. H. Cho and S. B. Kim(2015), Discovering Meaningful Trends in the Inaugural Addresses of United States Presidents Via Text Mining, Journal of the Korean Institute of Industrial Engineers, Vol. 41, No. 5, pp. 453-460.
Doug, L.(2001), 3D Data Management: Controlling Data Volume, Velocity, and Variety, META Group Applecation Delivery Strategies, File. 949, pp. 1-3.
Jo, S. W.(2011), Technology of big data age, KT Advanced Institute of Technology, pp. 4-5.
Kim, D. J. and S. Y. Yun(2013), Big Data Utilization for Monitoring Territorial Policy Responses and Predicting Policy Demand, Korea Research Institute for Human Settlements, pp. 28-29.
Kim, M. J.(2014a), Heinrich's Law, Miraebook Publishing Co, p. 16.
Kim, M. G.(2014b), A Study on Analysis and Prediction of Demand of Electric cars using Time-series Analysis, Graduate School Kumoh National Institute of Technology, p. 23.
Lim, C. H.(2010), A Study on the Introduction of IMO Casualty Investigation Code and Marine Safety Investigation System in Korea, The Journal of Korean Society on Marine Environment & Safety, Vol. 16, No. 1, pp. 57-63.
NAIC(2018), Act on the Investigation and Inquiry into Marine Accidents, Article 31-2.
Rho, B. S., M. K. Jang, S. W. Jeon and S. Y. Kang(2017), A study on Development of Near Accident Big Data Construction and Analysis Method, The Journal of the Korean Society of Marine Environment & Safety, Presented at 2017 Autumn Conference of KOSOMES, p. 122.
Ryu, J. G., T. I. Kim and T. Y. Ha(2014), Ocean & Fisheries for big data utilization plan, Korea Maritime Institute, pp. 37-38.
The Gartner Group(2012), Gartner's 2012 Hype Cycle for Emerging Technologies, https://www.gartner.com/newsroom/id/ 2124315.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.