[논문]빅데이터 기법을 활용한 항해 중 준해양사고 발생원인 분석에 관한 연구

강석용; 김기선; 김홍범; 노범석

doi:10.7837/kosomes.2018.24.4.408

초록
AI-Helper

해양사고 감소를 위해 다양한 연구들이 수행되어 왔다. 그에 비해 준해양사고에 대한 연구는 미미한 수준에 그치고 있다. 준해양사고는 건수가 많은 대신 내용이 정성적이기 때문에 분석하기에는 현실적인 어려움이 있었다. 하지만 해양사고 감소를 위해서는 준해양사고의 정량적인 분석이 필요하다. 이번 논문의 목적은 준해양사고 경향을 예측하고 해양사고를 감소시키기 위해 빅데이터 기법을 적용하여 준해양사고 데이터를 정량적으로 분석하는 것이다. 이를 위해 10,000여건의 준해양사고 보고서를 전처리 작업을 통해 통일된 양식으로 정리하였다. 전처리된 데이터에 대해서 1차적으로, 텍스트마이닝 기법을 적용하여 항해 중 준해양사고 발생원인에 대한 주요 키워드를 도출하였다. 주요 키워드에 대해 2차로 시계열 및 클러스터 분석을 통해 발생할 수 있는 준해양사고 상황에 대한 경향 예측을 도출하였다. 이번 연구에서는 정성적 자료인 준해양사고 보고서를 빅데이터 기법을 활용하여 정량화된 데이터로 전환할 수 있고, 이를 통해 통계적 분석이 가능함을 확인하였다. 또한 빅데이터 기법을 통해 차 후 발생할 수 있는 준해양사고에 대한 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다.

Abstract ▼ AI-Helper

Various studies have been conducted to reduce marine accidents. However, research on marine incidents is only marginal. There are many reports of marine incidents, but the main content of existing studies has been qualitative, which makes quantitative analysis difficult. However, quantitative analys...

Various studies have been conducted to reduce marine accidents. However, research on marine incidents is only marginal. There are many reports of marine incidents, but the main content of existing studies has been qualitative, which makes quantitative analysis difficult. However, quantitative analysis of marine accidents is necessary to reduce marine incidents. The purpose of this paper is to analyze marine incident data quantitatively by applying big data techniques to predict marine incident trends and reduce marine accident. To accomplish this, about 10,000 marine incident reports were prepared in a unified format through pre-processing. Using this preprocessed data, we first derived major keywords for the Marine incidents at sea using text mining techniques. Secondly, time series and cluster analysis were applied to major keywords. Trends for possible marine incidents were predicted. The results confirmed that it is possible to use quantified data and statistical analysis to address this topic. Also, we have confirmed that it is possible to provide information on preventive measures by grasping objective tendencies for marine incidents that may occur in the future through big data techniques.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

이번 연구를 통해 비정형화 및 텍스트 위주로 되어 있는 준해양사고 데이터를 활용하여 기존과 같이 단순한 전문가들의 의견이 반영된 교훈도출을 넘어선 정량적인 값을 도출하고자 노력하였다. 이를 위하여 현재 전 산업 분야에서 많이 이용되는 빅데이터 분석기법을 활용하였고, 항해 중 준해양사고의 발생원인에 대하여 분석해 보았다.

제안 방법

이 분석법을 활용하여 수집된 준해양사고 데이터를 분석하였고, 그 결과를 바탕으로 준해양사고 데이터를 정량적으로 분석할 수 있는 표준화된 모델링을 개발하였다. 또한 이를 적용하여 항해 중 준해양사고가 발생하는 원인을 분석하였다.
본 연구에서는 준해양사고 데이터의 특징을 분석하고, 이를 고려하여 텍스트 마이닝이라는 빅데이터 분석기법을 적용하였다. 이 분석법을 활용하여 수집된 준해양사고 데이터를 분석하였고, 그 결과를 바탕으로 준해양사고 데이터를 정량적으로 분석할 수 있는 표준화된 모델링을 개발하였다. 또한 이를 적용하여 항해 중 준해양사고가 발생하는 원인을 분석하였다.
이번 연구를 통해 비정형화 및 텍스트 위주로 되어 있는 준해양사고 데이터를 활용하여 기존과 같이 단순한 전문가들의 의견이 반영된 교훈도출을 넘어선 정량적인 값을 도출하고자 노력하였다. 이를 위하여 현재 전 산업 분야에서 많이 이용되는 빅데이터 분석기법을 활용하였고, 항해 중 준해양사고의 발생원인에 대하여 분석해 보았다.

대상 데이터

준해양사고제도발전협의회에 소속되어 있는 회원에게 준 해양사고 자료를 요청하였으며 그 중 10개 선사로부터 2015년에서 2017년 2분기까지의 준해양사고 데이터 10,000여건을 회신하여 Fig. 1과 같은 과정으로 분석하였다.

데이터처리

1차 분석을 통해 도출된 키워드를 전문가 검증을 통해 의미 없는 데이터를 제거하여, 발생 빈도 상위 10건에 대하여 2차 분석을 진행하였다. 2차 분석은 시계열 및 클러스트 분석을 활용하였고, 특정 기간별 중요 키워드 파악, 단어간의 군집관계 파악 등을 통해 전문가가 사고예방을 위한 보조수단으로 활용할 수 있도록 하였다.

이론/모형

코딩작업을 통해 전체 자료를 내용은 변경하지 않고 Table 1과 같이 동일한 양식에 정리하였고, Table 2와 같이 선종, 사고종류 등의 정형화된 데이터와 일시, 사고원인 등의 비정형화된 데이터로 구분하였다. 본 연구에서는 비정형화된 데이터에 대하여 텍스트 마이닝이라는 기법을 활용하여 1차 분석하였다.
본 연구에서는 준해양사고 데이터의 특징을 분석하고, 이를 고려하여 텍스트 마이닝이라는 빅데이터 분석기법을 적용하였다. 이 분석법을 활용하여 수집된 준해양사고 데이터를 분석하였고, 그 결과를 바탕으로 준해양사고 데이터를 정량적으로 분석할 수 있는 표준화된 모델링을 개발하였다.
날짜, 시간, 장소, 위치 등은 정형화된 데이터이고, 사고 개요, 발생 원인, 예방 대책 등은 비정형화된 데이터이다. 이 중 사고예방에 대한 핵심 내용은 비정형화된 데이터이므로, 이에 대하여 빅데이터 분석 기법으로 텍스트 마이닝을 적용하였다.

성능/효과

결과적으로 준해양사고 자료에 대해 빅데이터 분석기술을 활용하여 정량화된 데이터로 전환할 수 있고, 이를 통해 통계적 분석이 가능함을 확인할 수 있었다. 나아가 차 후 발생할 수 있는 준해양사고의 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다.
결과적으로 준해양사고 자료에 대해 빅데이터 분석기술을 활용하여 정량화된 데이터로 전환할 수 있고, 이를 통해 통계적 분석이 가능함을 확인할 수 있었다. 나아가 차 후 발생할 수 있는 준해양사고의 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다. 더불어 준해양사고 데이터를 대상으로 새로운 분석기술을 적용한 시도가 처음이라는 점과 이를 통해 일부 사고 예방에 대한 결과를 도출한 점은 의미 있는 것으로 판단된다.

후속연구

(5) BEHAVIOR, DEFECTIVE, MAINTENANCE, HORSEPLAY 키워드의 경우 2015년~2016년까지 비슷한 분포율을 보이다가 2017년에 들어 급증과 급감을 보이고 있으므로 추가적인 분석이 필요하다.
마지막으로 이번 연구는 항해 중 준해양사고 발생원인으로 연구의 범위를 제한하였으나 좀 더 많은 자료를 수집하여 정박중, 묘박중, 사건 개요, 예방 대책 등 다양한 관점에서 빅데이터 분석 기법을 적용할 필요가 있으며, 더불어 분석된 준해양사고와 실제 해양사고와의 관계를 비교 검증할 수 있다면 더욱 의미 있는 연구가 되리라 사료된다.
아쉬운 점은 연구에 사용된 준해양사고 데이터가 2년 6개월의 짧은 기간에 10개 선사로부터 수집된 한정된 데이터라는 점과 이로 인한 데이터의 객관성에 대한 한계이다. 또한 빅데이터라 부르기에는 데이터의 양이 충분하지 못했고, 현재의 빅데이터 분석기술의 제약으로 분석의 과정 사이사이에 관련내용을 잘 이해하는 전문가 집단의 수동적인 개입이 불가피하다는 점이다.
또한 빅데이터라 부르기에는 데이터의 양이 충분하지 못했고, 현재의 빅데이터 분석기술의 제약으로 분석의 과정 사이사이에 관련내용을 잘 이해하는 전문가 집단의 수동적인 개입이 불가피하다는 점이다. 이러한 부족한 부분은 장기간의 걸쳐 빅데이터를 구성하고, 분석과정 중에 나타나는 오류와 사람의 개입에 대한 부분을 축적된 데이터를 바탕으로 자동화한다면 충분히 개선 가능하리라 사료된다.

질의응답

핵심어	질문	논문에서 추출한 답변
	클러스트 분석이란?	클러스트 분석은 비슷한 특성을 가진 개체를 합쳐가면서 최종적으로 유사 특성의 그룹을 발견하는 방법이다(Jo, 2011).
	해양사고 감소를 위해 필요한 것은?	준해양사고는 건수가 많은 대신 내용이 정성적이기 때문에 분석하기에는 현실적인 어려움이 있었다. 하지만 해양사고 감소를 위해서는 준해양사고의 정량적인 분석이 필요하다. 이번 논문의 목적은 준해양사고 경향을 예측하고 해양사고를 감소시키기 위해 빅데이터 기법을 적용하여 준해양사고 데이터를 정량적으로 분석하는 것이다.
	준해양사고에 대한 연구가 미미한 수준에 그친 이유는?	그에 비해 준해양사고에 대한 연구는 미미한 수준에 그치고 있다. 준해양사고는 건수가 많은 대신 내용이 정성적이기 때문에 분석하기에는 현실적인 어려움이 있었다. 하지만 해양사고 감소를 위해서는 준해양사고의 정량적인 분석이 필요하다.

참고문헌 (11)

Cho, S. G., J. H. Cho and S. B. Kim(2015), Discovering Meaningful Trends in the Inaugural Addresses of United States Presidents Via Text Mining, Journal of the Korean Institute of Industrial Engineers, Vol. 41, No. 5, pp. 453-460.

원문보기 상세보기
Doug, L.(2001), 3D Data Management: Controlling Data Volume, Velocity, and Variety, META Group Applecation Delivery Strategies, File. 949, pp. 1-3.
Jo, S. W.(2011), Technology of big data age, KT Advanced Institute of Technology, pp. 4-5.
Kim, D. J. and S. Y. Yun(2013), Big Data Utilization for Monitoring Territorial Policy Responses and Predicting Policy Demand, Korea Research Institute for Human Settlements, pp. 28-29.
Kim, M. J.(2014a), Heinrich's Law, Miraebook Publishing Co, p. 16.
Kim, M. G.(2014b), A Study on Analysis and Prediction of Demand of Electric cars using Time-series Analysis, Graduate School Kumoh National Institute of Technology, p. 23.
Lim, C. H.(2010), A Study on the Introduction of IMO Casualty Investigation Code and Marine Safety Investigation System in Korea, The Journal of Korean Society on Marine Environment & Safety, Vol. 16, No. 1, pp. 57-63.
NAIC(2018), Act on the Investigation and Inquiry into Marine Accidents, Article 31-2.
Rho, B. S., M. K. Jang, S. W. Jeon and S. Y. Kang(2017), A study on Development of Near Accident Big Data Construction and Analysis Method, The Journal of the Korean Society of Marine Environment & Safety, Presented at 2017 Autumn Conference of KOSOMES, p. 122.
Ryu, J. G., T. I. Kim and T. Y. Ha(2014), Ocean & Fisheries for big data utilization plan, Korea Maritime Institute, pp. 37-38.
The Gartner Group(2012), Gartner's 2012 Hype Cycle for Emerging Technologies, https://www.gartner.com/newsroom/id/ 2124315.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

빅데이터 기법을 활용한 항해 중 준해양사고 발생원인 분석에 관한 연구
An Analysis of Causes of Marine Incidents at sea Using Big Data Technique 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (11)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

연관된 기능

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

빅데이터 기법을 활용한 항해 중 준해양사고 발생원인 분석에 관한 연구 An Analysis of Causes of Marine Incidents at sea Using Big Data Technique 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (11)

이 논문을 인용한 문헌

저자의 다른 논문 :

강석용 (12) 김기선 (5) 김홍범 (5) 노범석 (14)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

연관된 기능

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

빅데이터 기법을 활용한 항해 중 준해양사고 발생원인 분석에 관한 연구
An Analysis of Causes of Marine Incidents at sea Using Big Data Technique 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper