$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

텍스트 마이닝 기법을 활용한 ECDIS 사고보고서 분석
Text Mining Analysis Technique on ECDIS Accident Report 원문보기

海洋環境安全學會誌 = Journal of the Korean society of marine environment & safety, v.25 no.4, 2019년, pp.405 - 412  

이정석 (한국해양대학교 대학원) ,  이보경 (한국해양대학교 선박운항과) ,  조익순 (한국해양대학교 선박운항과)

초록
AI-Helper 아이콘AI-Helper

SOLAS에서는 국제 항해에 종사하는 총톤수 500톤 이상의 선박에 대하여 2018년 7월 1일 이후 도래하는 최초 검사까지 ECDIS를 설치해야 한다고 규정하고 있다. 새로운 주요 항해 장비로 ECDIS가 탑재되면서 ECDIS 사용에 관련한 다양한 사고가 발생하고 있다. MAIB, BSU, BEAmer, DMAIB, DSB에서 발행한 12가지의 사고보고서에는 항해사의 운용 미숙과 ECDS 시스템의 사고 원인으로 분석하였고, 사고 원인과 관련된 단어들을 정량적으로 분석하기 위해 R-프로그램을 사용하여 텍스트를 분석하였다. 도출 빈도에 따른 단어의 중요도를 나타내기 위해 텍스트 마이닝 기법인 단어 구름, 단어 연관성, 단어 가중치의 방법을 사용하였다. 단어 구름은 사용된 단어들의 빈도수를 구름 형태로 나타내는 방법으로써 N-gram 모델을 적용하였다. N-gram 모델 중 Uni-gram 분석 결과 ECDIS 단어, Bi-gram 분석 결과는 Safety Contour 단어의 사용 빈도가 가장 많았다. Bi-gram 분석을 기반으로 사고 원인 단어를 항해사와 ECDIS 시스템으로 구분하고, 연관된 단어들을 단어 연관성으로 나타내었다. 마지막으로 항해사와 ECDIS 시스템에 연관된 단어들을 단어 말뭉치로 구성한 후 단어 가중치를 적용하여 연도별 말뭉치 빈도 변화를 분석하였다. 추세선 그래프로 말뭉치 변화 경향을 분석한 결과, 항해사 말뭉치는 최근으로 올수록 감소하였으며 반대로 ECDIS 시스템 말뭉치는 점점 증가함을 나타내었다.

Abstract AI-Helper 아이콘AI-Helper

SOLAS requires that ECDIS be installed on ships of more than 500 gross tonnage engaged in international navigation until the first inspection arriving after July 1, 2018. Several accidents related to the use of ECDIS have occurred with its installation as a new major navigation instrument. The 12 in...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • Bi-gram을 통하여 시각적으로 도출된 합성어가 실제 선박에서 사용되는 단어인지 검증하기 위해 ECDIS 관련 서적에서 합성어를 검열하는 작업을 수행하였다(Cho et al., 2017). Fig.
  • 또한 동의어 중단수와 복수형인 ‘chart’와 ‘charts’는 실제 의미가 같으나 중복될 경우 의미 있는 결과가 나오지 않으므로 ‘chart’로 일치시키는 작업을 수행하였다.
  • 이 연구는 12가지의 ECDIS 사고 보고서를 텍스트 마이닝 기법을 통해 단어 구름, 단어 연관성, 단어 가중치를 이용하여 ECDIS 사고 원인에 대한 경향 변화를 나타내었다.
  • 또한 Uni-gram의 분석 결과에서 볼 수 없었던 직급을 나타내는 일등항해사(chief officer)를 비롯하여 항해 계획(passage plan), ECDIS에서 설정하는 안전 수심(safety depth), 종이 해도(paper chart) 등 여러 합성어가 도출됨을 알 수 있다. 이와 같이 2개 단어가 해사용어에서 사용되는 합성어로써 나타나는 결과를 바탕으로 항해사와 ECDIS 시스템의 용어와 함께 사용되는 단어를 찾고자 한다.
  • 하지만 연구에 사용된 12개의 ECDIS와 관련된 사고 보고서에는 대부분 항해사의 운용 미숙으로 분석되었다. 이와 반대로 일부 보고서에서만 ECDIS 시스템의 문제로 분석하고 있어 사고 원인에 대한 분석 경향 변화를 정량적으로 파악하기 위해 텍스트 마이닝 기법을 적용한 텍스트 분석 연구를 하였다.
  • 전처리 과정은 다양한 비정형 데이터를 정형화 데이터로 변환 시킨 후 분석에 의미 있는 결과를 나타낼 수 있도록 정제하는 과정이다. 전처리 과정은 TM Package가 제공하는 대문자를 소문자로 변환(tolower), 숫자 제거(removeNumbers), 구두점 제거(removePunctuation), 띄어쓰기 제거(stripWhitespace), 불용어 제거(stopwords)를 거쳐 순수한 단어를 도출하였다.
  • Bi-gram 모델의 분석 결과로부터 해사용어에서 사용되는 단어들이 도출됨을 확인하였다. 하지만 본 연구에서 진행하고자 하는 항해사의 관련 단어와 ECDIS 시스템 관련 단어들과의 연관된 단어 표본을 증가시키기 위해 단어 연관성 분석을 수행하였다. 단어 연관성 분석을 통하여 특정 한 단어와 다른 단어들이 어떠한 상관계수를 갖는지는 R-프로그램의 TM Package를 이용하여 분석이 가능하다.

대상 데이터

  • 검색 키워드는 각 홈페이지에서 ‘Serious Accident of ECDIS’로 설정하였으며, 2008년부터 2017년까지 어선을 제외한 국제항해에 종사하는 선박을 대상으로 검색하였다.
  • 본 연구에서 사용된 보고서는 국가별 해양 사고를 조사하는 기관의 홈페이지에서 추출하였다. 수집 자료 출처로는 MAIB (Marine Accident Investigation Branch-영국), BSU(Bundesstelle für Seeunfalluntersuchung-독일), BEAmer(The French marine casualties investigation board-프랑스), DMAIB(Danish Maritime Accident Investigation Board-덴마크), DSB(Dutch Safety Board-네덜란드)이다.
  • 수집 자료 출처로는 MAIB (Marine Accident Investigation Branch-영국), BSU(Bundesstelle für Seeunfalluntersuchung-독일), BEAmer(The French marine casualties investigation board-프랑스), DMAIB(Danish Maritime Accident Investigation Board-덴마크), DSB(Dutch Safety Board-네덜란드)이다.
  • 더불어 다양한 항해정보제공을 위해 만들어진 ECDIS는 결국 항해사가 운용하기 때문 에 제조업체와 전자해도의 배급처는 운용자에게 사용에 친숙한 기능과 쉬운 ECDIS 인터페이스로 제공할 필요성이 있다. 이번 연구에서는 사용된 보고서는 12개로 한정된 데이터였으며, 일부 ECDIS 전문 용어는 전문가의 자문, 지식이 필요한 한계점이 있었다.

데이터처리

  • 하지만 본 연구에서 진행하고자 하는 항해사의 관련 단어와 ECDIS 시스템 관련 단어들과의 연관된 단어 표본을 증가시키기 위해 단어 연관성 분석을 수행하였다. 단어 연관성 분석을 통하여 특정 한 단어와 다른 단어들이 어떠한 상관계수를 갖는지는 R-프로그램의 TM Package를 이용하여 분석이 가능하다. Landis and Koch(1977)의 연구에 따르면 Cohen’s kappa 상관계수는 0.

이론/모형

  • Bi-gram 모델은 Uni-gram과 동일한 분석방법을 이용하였으며 N-gram 모델에서 2개의 단어로 절단하여 나타내며 빈도수 20회 이상, 상위 50개 합성어를 Bi-gram 모델로 분석한 결과는 Fig. 3, Fig. 4와 같다.
  • Uni-gram 모델을 기반으로 한 사고 보고서 키워드는 ‘ECDIS’ 단어와 관련 있다는 것을 파악할 수 있으나, 도출된 단어들이 사고원인으로는 알 수 없다. 따라서 1개 단어가 아닌 2개 단어가 결합된 합성어를 찾기 위해 Bi-gram 모델을 이용하고자 한다.
  • 통합 개발 환경으로 더 편리한 인터페이스를 제공하는 장점이 있는 R-Studio를 사용하였다. 텍스트 마이닝분석은 TM Package(Version 0.7-6, Kurt Hornik)를 주로 사용하였으며 분석 내용을 대상으로 시각화하기 위해 Wordcloud (Version 2.6, Ian Fellows), RColorBrewer(Version 1.1-2, Erich Neuwirth)을 사용하여 나타내었다.
  • , 2018). 통합 개발 환경으로 더 편리한 인터페이스를 제공하는 장점이 있는 R-Studio를 사용하였다. 텍스트 마이닝분석은 TM Package(Version 0.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
ECDIS란? ECDIS(Electronic Chart Display and Information System)란GPS, RADAR, AIS 등 다양한 항해장비와 연동되면서 선박의실시간 위치 및 항해와 관련된 부가정보를 전자해도 상에 표시하고 항해사가 항로를 계획 및 감시하는 중요한 항해 수단 중 하나이다(IMO, 1974). 2009년 IMO MSC.
사고보고서의 텍스트 분석 시 단어 중요도를 도출하기 위해 사용한 방법은 무엇인가? MAIB, BSU, BEAmer, DMAIB, DSB에서 발행한 12가지의 사고보고서에는 항해사의 운용 미숙과 ECDS 시스템의 사고 원인으로 분석하였고, 사고 원인과 관련된 단어들을 정량적으로 분석하기 위해 R-프로그램을 사용하여 텍스트를 분석하였다. 도출 빈도에 따른 단어의 중요도를 나타내기 위해 텍스트 마이닝 기법인 단어 구름, 단어 연관성, 단어 가중치의 방법을 사용하였다. 단어 구름은 사용된 단어들의 빈도수를 구름 형태로 나타내는 방법으로써 N-gram 모델을 적용하였다.
텍스트 마이닝 기법이 활용되는 분야는? 특히 전자 문서의 작성과 배포로 텍스트 데이터들은 시간이 지날수록 기하급수적으로 증가하고 있다. 이러한 방대한 양의 텍스트를 분석하기 위해 텍스트 마이닝 기법이 산업공학, 건축, 특허 등 다양한 분야에서활발하게 이용되고 있으며 해양사고 예방 및 교육 등에 활용하기 위한 해운회사의 준사고 분석에도 사용되고 있다 (Kang et al., 2018).
질의응답 정보가 도움이 되었나요?

참고문헌 (24)

  1. BEAmer (2010), Stranding of the chemical tanker vessel SICHEM OSPREY on 10 February 2010 on Clipperton Island, pp. 1-30. 

  2. BSU (2009), Grounding of the LT CORTESIA on 2 January 2008 on the Varne Bank in the English Channel, Investigation Report 01/08, pp. 1-53. 

  3. BSU (2011), Grounding of the MV BELUGA REVOLUTION off ENUS(Tench) Island in the South Seas on 30 April 2010, Investigation Report 174/10, pp. 1-30. 

  4. Cho, I. S. , D. H. Kim and B. K. Lee (2017), Understanding and operating ECDIS for navigators, KeNiT PRESS, pp. 1-365. 

  5. Christoper, D. M. , P. Raghava and H. Schutze (2008), Introduction to information retrieval, Cambridge University Press 2008, pp. 100-123. 

  6. DMAIB (2013), Marine Accident Report March 2013, VEGA SAGITTARIUS Grounding on 16 August 2012, pp. 1-17. 

  7. DSB (2017), DUTCH SAFETY BOARD, Digital navigation old skills in new technology Lessons from the grounding of the Nova Cura, pp. 1-41. 

  8. IMO (1974) . International Convention for the Safety Life at Sea. 

  9. IMO (2009) . Report of the Maritime Safety Committee on its Eighty-Sixth Session, Maritime Safety Committee, 86th session, Agenda item 5, Annex 2.9~2.11. 

  10. Jurafsky, D. and J. H. Martin (2018), Speech and Language Processing, N-gram Language Models, Chapter 3, pp. 2-9. 

  11. Kang, S. Y. , K. S. Kim, H. B. Kim and B. S. Rho (2018), An Analysis of Causes of Marine Incidents at sea Using Big Data Technique, Journal of the Korean Society of Marine Environment & Safety, Vol. 24, No. 4, pp. 408-414. 

  12. Landis, J. R. and G. G. Koch (1977), An application of hierarchical kappa-type statistics in the assessment of majority agreement among multiple observers, Biometrics33(2), pp. 363-374. 

  13. Lee, B. K. , D. H. Kim, S. D. Lee and I. S. Cho (2016), A Study on Advanced Seafarers’ Training for Improving Abilities of Officers in Charge of a Navigational Watch who Handle Navigational Equipment : To Focus on the ECDIS, Journal of Fisheries and Marine Sciences Education, Vol. 28, No. 2, pp. 332-333. 

  14. Lee, B. K. (2018), Usability Test and Investigation of Improvements of the ECDIS, Journal of the Korean Society of Marine Environment & Safety, Vol. 24, No. 2, pp. 146-156. 

  15. Lee, G. S. , H. Y. Cho and J. R. Han (2018), Text Mining Analysis on the Research Field of the Coastal and Ocean Engineering Based on the SCOPUS Bibliographic Information, Journal of Korean Society of Coastal and Ocean Engineers 30(1), pp. 19~28. 

  16. MAIB (2008), Report on the investigation of the grounding of CFL Performer Haisborough Sand North Sea 12 May 2008, pp. 1-28. 

  17. MAIB (2009), Report on the investigation into the grounding of Pride of Canterbury “The Downs”-off Deal, Kent 31 January 2008, pp. 1-22. 

  18. MAIB (2012), Grounding of CSL THAME in the Sound of Mull 9 August 2011, pp. 1-8. 

  19. MAIB (2014), Report on the investigation of the grounding of Ovit in the Dover Strait on 18 September 2013, pp. 1-94. 

  20. MAIB (2015), Report on the investigation of the grounding and flooding of the ro-ro ferry Commodore Clipper in the approaches to St Peter Port, Guernsey on 14 July 2014, pp. 1-68. 

  21. MAIB (2016), Report on the investigation of the grounding of the cruise ship Hamburg in the Sound of Mull, Scotland 11 May 2015, pp. 1-56. 

  22. MAIB (2017), Report on the investigation of the grounding Muros Haisborough Sand North Sea 3 December 2016, pp. 1-33. 

  23. Oh, S. J. , C. J Hwang, B. K. Kim, H. Y. Jung and H. Y. Chung (2001), A Study on Pseudo N-gram Language Models for Speech Recognition, Journal of the institute of signal processing and systems, Vol. 2, No. 3, pp. 16-23. 

  24. Song, J. Y. (2017), The comparative study on the performance of n-gram by change of the number of words based on characteristic of Korean language, The Graduate School of Ewha Womans University, pp. 13-18. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로