주제어(key word, KW)는 해양사고의 주요한 원인을 간단하게 표현하기 위한 단어들의 집합으로 해양안전심판원의 심판관들이 작성한다. KW는 심판관들의 서로 다른 주관적인 견해 때문에 일관성 유지가 어렵고, KW의 수가 너무 많은 문제점이 있다. 이러한 문제를 해결하기 위해서는 최적화된 최소의 공통단어(common word, CW)를 이용한 체계적인 KW 구축 프레임이 필요하다. 본 연구의 목적은 체계적인 KW 구축 프레임 개발에 필요한 CW을 도출하는데 있다. 이러한 목적을 달성하기 위하여 본 연구에서는 파레토(Pareto) 분포함수와 파레토 지수를 이용한 최적의 최소 CW 도출방법을 제안하였다. 총 2,642개의 KW을 수집한 후, 수집한 KW의 세부 단어와 이들의 빈도를 갖는 데이터 세트에서 총 56개의 특징적인 CW를 식별하였다. 56개의 특징적인 CW를 이용한 단어 축소실험을 통해서 평균 58.5%의 축소율을 획득하였고, 축소율에 따라서 추정한 CW는 파레토 차트로 검증하였다. 이를 통해서 체계적인 KW 구축 프레임 개발이 가능할 것으로 기대된다.
주제어(key word, KW)는 해양사고의 주요한 원인을 간단하게 표현하기 위한 단어들의 집합으로 해양안전심판원의 심판관들이 작성한다. KW는 심판관들의 서로 다른 주관적인 견해 때문에 일관성 유지가 어렵고, KW의 수가 너무 많은 문제점이 있다. 이러한 문제를 해결하기 위해서는 최적화된 최소의 공통단어(common word, CW)를 이용한 체계적인 KW 구축 프레임이 필요하다. 본 연구의 목적은 체계적인 KW 구축 프레임 개발에 필요한 CW을 도출하는데 있다. 이러한 목적을 달성하기 위하여 본 연구에서는 파레토(Pareto) 분포함수와 파레토 지수를 이용한 최적의 최소 CW 도출방법을 제안하였다. 총 2,642개의 KW을 수집한 후, 수집한 KW의 세부 단어와 이들의 빈도를 갖는 데이터 세트에서 총 56개의 특징적인 CW를 식별하였다. 56개의 특징적인 CW를 이용한 단어 축소실험을 통해서 평균 58.5%의 축소율을 획득하였고, 축소율에 따라서 추정한 CW는 파레토 차트로 검증하였다. 이를 통해서 체계적인 KW 구축 프레임 개발이 가능할 것으로 기대된다.
The key word (KW) is a set of words to clearly express the important causations of marine accidents; they are determined by a judge in a Korean maritime safety tribunal. The selection of KW currently has two main issues: one is maintaining consistency due to the different subjective opinion of each ...
The key word (KW) is a set of words to clearly express the important causations of marine accidents; they are determined by a judge in a Korean maritime safety tribunal. The selection of KW currently has two main issues: one is maintaining consistency due to the different subjective opinion of each judge, and the second is the large number of KW currently in use. To overcome the issues, the systematic framework used to construct KW's needs to be optimized with a minimal number of KW's being derived from a set of Common Words (CW). The purpose of this study is to identify a set of CW to develop the systematic KW construction frame. To fulfill the purpose, the word reduction method to find minimum number of CW is proposed using P areto distribution function and Pareto index. A total of 2,642 KW were compiled and 56 baseline CW were identified in the data sets. These CW, along with their frequency of use across all KW, are reported. Through the word reduction experiments, an average reduction rate of 58.5% was obtained. The estimated CW according to the reduction rates was verified using the Pareto chart. Through this analysis, the development of a systematic KW construction frame is expected to be possible.
The key word (KW) is a set of words to clearly express the important causations of marine accidents; they are determined by a judge in a Korean maritime safety tribunal. The selection of KW currently has two main issues: one is maintaining consistency due to the different subjective opinion of each judge, and the second is the large number of KW currently in use. To overcome the issues, the systematic framework used to construct KW's needs to be optimized with a minimal number of KW's being derived from a set of Common Words (CW). The purpose of this study is to identify a set of CW to develop the systematic KW construction frame. To fulfill the purpose, the word reduction method to find minimum number of CW is proposed using P areto distribution function and Pareto index. A total of 2,642 KW were compiled and 56 baseline CW were identified in the data sets. These CW, along with their frequency of use across all KW, are reported. Through the word reduction experiments, an average reduction rate of 58.5% was obtained. The estimated CW according to the reduction rates was verified using the Pareto chart. Through this analysis, the development of a systematic KW construction frame is expected to be possible.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 주제어를 체계적으로 작성하는데 가장 중요한 사고종류별 공통된 단어를 최적의 최소 단어로 축소하여 도출하였다. 해양안전심판원의 정보포털에서 아홉 가지 사고종류에 대한 2,642개의 주제어를 획득한 후, 공통단어 56개를 도출해서 사고종류별 최적의 최소 단어를 추정하였다.
본 연구의 목적은 체계적인 주제어 구축 프레임에 가장 중요한 원인분류단어를 최적의 최소 단어로 축소하기 위한 기법을 개발하여 최소의 단어를 도출하기 위한 것이다.
제안 방법
그래서 본 연구에서는 기존에 해심에서 사용하고 있는 방대한 주제어 데이터를 이용하여 E의 원인에 해당하는 최적의 종속변수를 식별하였다.
여기서, 첫 번째와 두 번째 단어는 선박에서 일반적으로 사용하는 단어들이 나타나는데 반하여, 세 번째 단어는 심판관들의 주관적인 견해가 반영된 방대한 종류의 단어가 등장한다. 그래서 본 연구에서는 방대한 종류의 세 번째 단어를 원인 분류 단어로 선정하였다.
파레토(Pareto) 법칙은 「20%(q)의 인구가 80%(p)의 수입을 갖고 있다」는 것으로, p+q=1 규칙으로 불린다(Wikipedia, 2016). 본 연구에서는 20%에 해당 단어가 전체단어의 80%를 설명할 수 있는 최소의 단어 수를 구하기 위하여 파레토 함수를 적용하였다.
셋째, 파레토 법칙을 이용하여 방대한 단어를 최적의 최소 단어로 축소할 수 있는 기법을 제안하였다. 제안한 기법은 단어로 구성된 데이터뿐만 아니라 다양하고 방대한 해양사고 데이터의 차원을 축소하는 경우에도 적용 가능할 것으로 고려된다.
연구 방법은 다음과 같다. 우선, 해양안전심판원의 정보포털에서 아홉 가지 사고종류에 대한 2,642개의 주제어를 획득한 후, 원인분류단어의 식별에 활용하기 위한 56개의 공통단어를 도출하였다. 그리고 파레토(Pareto) 법칙(Atmour et al.
해양안전심판원의 정보포털에서 아홉 가지 사고종류에 대한 2,642개의 주제어를 획득한 후, 공통단어 56개를 도출해서 사고종류별 최적의 최소 단어를 추정하였다. 추정한 최소 단어는 파레토 차트(Pareto chart)를 이용하여 유효성을 입증하고, 축소율을 이용하여 축소 효율을 평가하였다. 연구결과를 요약하면 다음과 같다.
본 연구에서는 주제어를 체계적으로 작성하는데 가장 중요한 사고종류별 공통된 단어를 최적의 최소 단어로 축소하여 도출하였다. 해양안전심판원의 정보포털에서 아홉 가지 사고종류에 대한 2,642개의 주제어를 획득한 후, 공통단어 56개를 도출해서 사고종류별 최적의 최소 단어를 추정하였다. 추정한 최소 단어는 파레토 차트(Pareto chart)를 이용하여 유효성을 입증하고, 축소율을 이용하여 축소 효율을 평가하였다.
대상 데이터
해심의 정보포털(KMST, 2015)에서 아홉 가지 사고종류(충돌, 좌초, 접촉, 전복, 화재/폭발, 침몰, 기관고장, 인명사상, 여객사상)에 대한 KW 총 2,982개를 수집한 후, 중복되거나 KW로 부적절한 것 등을 제외하고 총 2,642개의 KW을 선정하였다. 선정한 KW는 액셀파일(Excel file)에 다음과 같은 형태로 분류하였다(Yim et al.
이론/모형
우선, 해양안전심판원의 정보포털에서 아홉 가지 사고종류에 대한 2,642개의 주제어를 획득한 후, 원인분류단어의 식별에 활용하기 위한 56개의 공통단어를 도출하였다. 그리고 파레토(Pareto) 법칙(Atmour et al., 2014; Finkelstein et al., 2006)에 의거한 파레토 분포함수와 파레토 지수를 이용하여 사고종류별 최적의 최소 원인분류단어를 추정하였다.
성능/효과
둘째, 축소율의 최대는 64.7%, 최소는 45.5%로 나타났고, 아홉 가지 사고종류 전체에 대해서는 57.1%로 나타났으며, 평균 축소율은 58.5%로 나타났다. 따라서 평균적으로 공통단어의 58.
5%로 나타났다. 따라서 평균적으로 공통단어의 58.5%만 이용하더라도 사고의 80% 이상을 설명할 수 있는 최소 단어를 추정할 수 있었다. 이를 통해서 체계적인 주제어 구축 프레임 개발에 필요한 최소의 단어를 획득하였다.
이상의 결과를 예로 설명하면, k=1(충돌사고)의 경우 해당하는 단어의 수 NCWk=34이고, 설계조건을 만족하는 단어의 수 Nqk=6인데, 평가결과 설계조건을 만족하지 못하였다. 그래서 추정한 결과 \(\hat{Nq}_k=12\)가 최적 단어의 수로 나타났고, 그 결과 \(\hat\alpha_k \le \bar\alpha\)의 조건을 만족하였다.
첫째, 추정한 최소 단어의 수와 파레토 차트로 분석한 최소 단어의 수가 일치하여 추정한 단어가 유효함을 확인하였다.
총 56개의 CW가 도출되었는데, m=1의 소홀의 CWm가 ℵm=287로 가장 크고, m=56의 폭발의 CWm가 ℵm=7로 가장 작게 나타났다.
후속연구
2에 점선의 원과 선으로 표시한 예는, 「항해(A에서 3번) 중, 안개(B에서 3번)가 발생하고 당직(C에서 6번) 근무(D에서 5번) 소홀(E-1에서 5번)로 충돌(F에서 1번)이 발생한 사고」의 경우를 나타낸 것으로, 그림과 같이 해당하는 단어를 선택하면 자동으로 KW가 당직근무소홀로 작성됨을 나타낸다. 이와 같은 방법을 적용하면, 심판관 모두가 일관된 방법으로 KW을 작성할 수 있을 뿐만 아니라 변수의 조합을 이용하여 통계기반의 해양사고 원인도 분석할 수 있을 것으로 고려된다.
셋째, 파레토 법칙을 이용하여 방대한 단어를 최적의 최소 단어로 축소할 수 있는 기법을 제안하였다. 제안한 기법은 단어로 구성된 데이터뿐만 아니라 다양하고 방대한 해양사고 데이터의 차원을 축소하는 경우에도 적용 가능할 것으로 고려된다.
추후, 본 연구에서 축소한 단어를 이용하여 주제어를 체계적으로 작성할 수 있는 프레임을 구축할 예정이다.
그리고 본 논문 저자 등에 의해서 2008년부터 2016년까지 10년간의 재결요약서를 통하여 총 1,311개의 주제어를 2차로 정비한 바 있다(KMST, 2016). 한편, 이러한 2차 정비를 통해서, 선정한 주제어 수가 너무 많고, 시간경과에 따른 주제어 갱신 등이 필요하기 때문에 향후 주제어 축소를 위한 프레임(frame) 개발이 필요한 것으로 나타났다.
질의응답
핵심어
질문
논문에서 추출한 답변
해양사고에서 주제어란?
주제어(key word, KW)는 해양사고의 주요한 원인을 간단하게 표현하기 위한 단어들의 집합으로 해양안전심판원의 심판관들이 작성한다. KW는 심판관들의 서로 다른 주관적인 견해 때문에 일관성 유지가 어렵고, KW의 수가 너무 많은 문제점이 있다.
해양안전심판원이 해양사고를 조사, 분석하는데 근거가 되는 법률은?
해양안전심판원(이하, 해심)에서는 IMO Res. MSC.255(84) (IMO, 1997)에 근거한 「해양사고의 조사 및 심판에 관한 법률 제11690호)」(MOF, 2013)에 의거하여 해양사고를 조사 및 분석하고 있다. 조사 및 분석 결과는 다양한 해양사고 통계 자료(KMST, 2014)와 재결서 및 재결요약서 그리고 해양사고 종류별 주제어 등의 형태로 해양사고조사심판정보포털(이하, 정보포털)(KMST, 2015)에 제공하고 있다.
해양사고의 주제어가 가지는 문제점은?
주제어(key word, KW)는 해양사고의 주요한 원인을 간단하게 표현하기 위한 단어들의 집합으로 해양안전심판원의 심판관들이 작성한다. KW는 심판관들의 서로 다른 주관적인 견해 때문에 일관성 유지가 어렵고, KW의 수가 너무 많은 문제점이 있다. 이러한 문제를 해결하기 위해서는 최적화된 최소의 공통단어(common word, CW)를 이용한 체계적인 KW 구축 프레임이 필요하다.
참고문헌 (20)
Armour Philip, Burkhauser R. V. and Larrimore Jeff(2014), "Using the Pareto distribution to improve estimates of topcoded earnings", white paper, NBER WORKING PAPER SERIES, Working Paper 19846, pp. 1-18, http://www.nber.org/papers/w19846.
Brynjolfsson Erik, Hu Yu and Simester Duncan(2007), "Goodbye Pareto Principle, Hello Long Tail: The Effect of Search Costs on the Concentration of Product Sales", white paper, version November 2007, pp. 1-39, http://ebusiness.mit.edu/research/papers/2007.11_Brynjolfsson_Hu_Simester_Goodbye%20Pareto%20Principle_276.pdf.
Cho S. S., Jang E. J. and Yim, J. B.(2015), "Research on the Numerical Data Construction for Marine Accidents," Proc. of Spring Seminar 2015, Korean Institute of Navigation and Port Research, pp. 193-195
Fialova Alena, Jureckova Jana and Picek Jan(2004), "Estimating Pareto tail index based on sample means", REVSTAT - Statistical Journal, Vol. 2, No. 1, pp. 75-100.
Finkelstein M., Tucker G. H. and Veeh J. A.(2006), "Pareto tail index estimation revised," North American Actuarial Journal, Vol. 10, No. 1, pp. 1-10.
IMO(1997), CODE FOR THE INVESTIGATION OF MARINE CASUALTIES AND INCIDENTS, Resolution A.849(20) adopted on 27 November 1997, Appendix : Guidelines to assist investigators in the implementation of the Code.
Jang E. J., Kang Y. M. and Yim J. B.(2016), "On the Analysis of Key Word in Korea Maritime Safety Tribunal to Prevent Human Error in Maritime Accidents", KAOSTS Joint Seminar 2016, Program book of Journal of Korean Navigation and Port Research, pp. 196-198.
KMST(2003), "Machinery damaged accident for fishing ship No. 77 Dong-Myeong HO", Accident Analysis Report by Eastern KMST, No. 2003-001
KMST(2007), "Final report 2007 for the analysis of judged prejudication of Korea Maritime Safety Tribunal", pp. 1-366.
KMST(2014), 2014 Statistical Annual Report to Maritime Causalities (2008-2014 combined), Korea Maritime Safety Tribunal, pp. 1-118.
KMST(2015), Web site for the Investigation and Judgement Information Portal of Maritime Causalities, http://data.kmst.go.kr/kmst/verdict/verdictAbstract/selectVerdictAbstract.do.
KMST(2016), "Final report 2016 for the analysis of judged prejudication of Korea Maritime Safety Tribunal", Pub. reg. number 11-1192251-000012-01, pp. 1-57.
MOF(2013), Law for the Investigation and Judgement of Maritime Causalities, No. 11690
Rytgaard M.(1990), "Estimation in the Pareto distribution", Astin Bulletin, Vol. 20, No. 2, pp. 201-216.
Sousa D. B. and Michailidis George(2004), "A Diagnostic Plot for Estimating the Tail Index of a Distribution", Journal of Computational and Graphical Statistics, Vol. 13, No. 4, pp. 1-22.
Vilar-Zanon L. Jose and Lozano-Colomer Cristina(2007), "On Pareto conjugate priors and their application to large claims reinsurance premium calculation," Astin Bulletin, Vol. 37, No. 2, pp. 405-428.
Yim, J. B.(2009a), Development of Quantitative Risk Assessment Methodology for the Maritime Transportation Accident of Merchant Ship, Journal of Korean Navigation and Port Research, Vol. 33, No. 1, pp. 9-19
Yim, J. B.(2009b), Implementation Techniques for the Seafarer's Human Error Assessment Model in a Merchant Ship: Practical Application to a Ship Management Company, Journal of Korean Navigation and Port Research, Vol. 33, No. 3, pp. 181-191
Yim J. B., Yang W. J. and Kim H. T.(2014), Maritime Accident Analysis - Maritime Accident Analysis and Prevention in the View Point of Ship Operation, Jeilkihok, Mokpo, pp. 1-391.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.