국민의 해양안전문화 수준을 객관적으로 측정하고 해양안전문화 확산을 위한 자료로 활용하고자 2018년에 해양안전문화지수를 개발하였다. 안전문화지수를 산출하는 방법은 안전문화에 영향을 줄 만한 이슈를 포함해야 하고 현 실태를 측정할 수 있는 문항으로 구성되어야 한다. 또한, 사회적·경제적 변화에 따라 지속적인 검증과 보완이 요구된다. 해양 전문가에 의해 설계된 설문 문항이 국민의 관심사와 요구를 잘 반영하고 있는지 확인하기 위해 915명의 해양안전 관련 제안 내용을 분석하였다. 비정형 데이터인 해양안전 제안 내용을 분석하기 위해 텍스트 마이닝 기법을 활용하였으며, 네트워크 분석과 토픽 모델링을 수행하였다. 해양안전 제안을 분석한 결과 '교육', '홍보', '안전수칙', '의식', '전문 인력', '시스템'에 관한 내용이 주를 이루었다. 해양안전 제안 사항이 2019년 설문 문항에 반영되도록 18개의 문항을 수정·보완하였고, 설문 문항의 신뢰도를 분석한 결과 내적 일관성은 0.895로 높게 평가되었으며 전년 대비 향상되었다. 해양 관련 전문가뿐만 아니라 국민의 요구사항까지 반영한 개선된 설문 문항으로 해양안전문화지수를 도출함으로써 해양안전문화 확산을 위한 정책 수립에 더 기여할 것으로 기대된다.
국민의 해양안전문화 수준을 객관적으로 측정하고 해양안전문화 확산을 위한 자료로 활용하고자 2018년에 해양안전문화지수를 개발하였다. 안전문화지수를 산출하는 방법은 안전문화에 영향을 줄 만한 이슈를 포함해야 하고 현 실태를 측정할 수 있는 문항으로 구성되어야 한다. 또한, 사회적·경제적 변화에 따라 지속적인 검증과 보완이 요구된다. 해양 전문가에 의해 설계된 설문 문항이 국민의 관심사와 요구를 잘 반영하고 있는지 확인하기 위해 915명의 해양안전 관련 제안 내용을 분석하였다. 비정형 데이터인 해양안전 제안 내용을 분석하기 위해 텍스트 마이닝 기법을 활용하였으며, 네트워크 분석과 토픽 모델링을 수행하였다. 해양안전 제안을 분석한 결과 '교육', '홍보', '안전수칙', '의식', '전문 인력', '시스템'에 관한 내용이 주를 이루었다. 해양안전 제안 사항이 2019년 설문 문항에 반영되도록 18개의 문항을 수정·보완하였고, 설문 문항의 신뢰도를 분석한 결과 내적 일관성은 0.895로 높게 평가되었으며 전년 대비 향상되었다. 해양 관련 전문가뿐만 아니라 국민의 요구사항까지 반영한 개선된 설문 문항으로 해양안전문화지수를 도출함으로써 해양안전문화 확산을 위한 정책 수립에 더 기여할 것으로 기대된다.
The Marine Safety Culture Index (MSCI) was developed in the year 2018 for objectively assessing the public safety culture levels and for incorporating it as data to spread knowledge regarding the marine safety culture. The method for calculating the safety culture index should include issues that ma...
The Marine Safety Culture Index (MSCI) was developed in the year 2018 for objectively assessing the public safety culture levels and for incorporating it as data to spread knowledge regarding the marine safety culture. The method for calculating the safety culture index should include issues that may affect the safety culture and should consist of appropriate attributes for estimating the current status. In addition, continuous verification and supplementation are required for addressing social and economic changes. In this study, to determine whether the questionnaire designed by marine experts reflects the people's interests and needs, we analyzed 915 marine safety proposals. Text mining was employed for analyzing the unstructured data of the marine safety proposals, and network analysis and topic modeling were subsequently performed. Analysis of the marine safety proposals was centered on attributes such as education, public relations, safety rules, awareness, skilled workers, and systems. Eighteen questions were modified and supplemented for reflecting the marine safety proposals, and reliability of the revised questions was analyzed. Furthermore, compared to the previous year, the questionnaire's internal consistency was improved upon and was rated at a high value of 0.895. It is expected that by employing the derived marine safety culture index and incorporating the improved questionnaire that reflects the requirements of marine experts and the people, the improved questionnaire will contribute to the establishment of policies for spreading knowledge regarding the marine safety culture.
The Marine Safety Culture Index (MSCI) was developed in the year 2018 for objectively assessing the public safety culture levels and for incorporating it as data to spread knowledge regarding the marine safety culture. The method for calculating the safety culture index should include issues that may affect the safety culture and should consist of appropriate attributes for estimating the current status. In addition, continuous verification and supplementation are required for addressing social and economic changes. In this study, to determine whether the questionnaire designed by marine experts reflects the people's interests and needs, we analyzed 915 marine safety proposals. Text mining was employed for analyzing the unstructured data of the marine safety proposals, and network analysis and topic modeling were subsequently performed. Analysis of the marine safety proposals was centered on attributes such as education, public relations, safety rules, awareness, skilled workers, and systems. Eighteen questions were modified and supplemented for reflecting the marine safety proposals, and reliability of the revised questions was analyzed. Furthermore, compared to the previous year, the questionnaire's internal consistency was improved upon and was rated at a high value of 0.895. It is expected that by employing the derived marine safety culture index and incorporating the improved questionnaire that reflects the requirements of marine experts and the people, the improved questionnaire will contribute to the establishment of policies for spreading knowledge regarding the marine safety culture.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 해양 전문가에 의해 설계된 해양안전문화지수 도출을 위한 설문 문항이 국민의 관심사와 요구를 포함하고 있는지 확인하기 위해 2018년 실시된 설문조사의 해양안전 관련 제안 내용을 분석하였다. 해양안전 제안 내용은 자유 기술한 비정형 데이터이므로 텍스트 마이닝(Text Mining) 기법을 활용하여 분석하였으며, 그 결과를 향후 해양안전문화지수 도출을 위한 설문 문항 개선에 활용하고자 한다.
본 연구에서는 해양안전문화지수 도출을 위한 설문조사의 설문 문항이 국민의 해양안전 관련 경험과 인식을 측정하는데 적정한지 확인하기 위해 2018년 설문조사를 통해 수집한 915명의 해양안전 제안 내용을 텍스트 마이닝 기법을 활용하여 분석하였다. TF-IDF 가중치를 적용한 키워드의 동시 출현 네트워크를 분석하고, 토픽 모델링으로 주제를 분류하였다.
이에 현재의 안전문화 수준을 객관적으로 평가하여 안전문화 선진화를 위한 노력을 유도하고자 문화지수를 개발하여 활용하고 있다. 국내에서는 지자체 교통문화 수준을 객관적으로 평가하여 교통안전에 대한 자율적 경쟁을 도모하고 교통안전 정책의 기초 자료로 활용하고자 교통문화지수를 개발하였으며, 현장 조사와 사고 통계를 기반으로 2008년부터 매년 발표하고 있다(MOLIT, 2019).
본 연구에서는 해양 전문가에 의해 설계된 해양안전문화지수 도출을 위한 설문 문항이 국민의 관심사와 요구를 포함하고 있는지 확인하기 위해 2018년 실시된 설문조사의 해양안전 관련 제안 내용을 분석하였다. 해양안전 제안 내용은 자유 기술한 비정형 데이터이므로 텍스트 마이닝(Text Mining) 기법을 활용하여 분석하였으며, 그 결과를 향후 해양안전문화지수 도출을 위한 설문 문항 개선에 활용하고자 한다.
제안 방법
‘교육’, ‘홍보’, ‘의식’ 등 텍스트 마이닝 기법을 활용해 분석한 해양안전 제안 내용을 18개의 설문 문항에 반영시켰으며, 수정·보완한 설문 문항은 2019년 해양안전문화지수를 도출하는 데 활용되었다.
2018년에 설계한 설문 문항은 해양 전문가의 시각만 반영된 것이므로 해양안전에 대한 다양한 시각과 요구사항이 반영될 수 있도록 텍스트 마이닝 기법을 이용해 분석한 해양안전 제안 내용 결과를 반영하여 Table 3과 같이 설문 문항을 수정·보완하였다.
Part 1은 해양 관련 경험 여부를 ‘예/아니요’로 조사하고, Part 2 ~5까지는 해양 안전수칙 준수, 해양안전 의식, 해양 안전문화 실태, 해양에 대한 관심 정도를 5점 척도로 조사한다.
본 연구에서는 해양안전문화지수 도출을 위한 설문조사의 설문 문항이 국민의 해양안전 관련 경험과 인식을 측정하는데 적정한지 확인하기 위해 2018년 설문조사를 통해 수집한 915명의 해양안전 제안 내용을 텍스트 마이닝 기법을 활용하여 분석하였다. TF-IDF 가중치를 적용한 키워드의 동시 출현 네트워크를 분석하고, 토픽 모델링으로 주제를 분류하였다.
특정 주제를 다루는 경우 해당 주제와 관련된 단어는 자주 등장할 것이므로 단어의 출현 빈도가 단어의 중요도를 판가름하는 절대적인 기준이 될 수 없다. 따라서 출현 빈도가 높다 할지라도 모든 문서에 흔히 등장하는 경우 낮은 가중치를 부여하는 TF-IDF(Term frequency-Inverse Document frequency)를 확인하였다. TF-IDF는 다량의 문서에서 이슈를 추출하거나 포털 검색어와 연관 검색어의 노출 순위를 결정하는 알고리즘에도 활용된다.
안전수칙을 잘 모르거나 지키지 않아 문제가 되기 때문에 안전수칙을 잘 지킬 수 있게 유도하는 교육, 홍보, 제재와 같은 방법이 제안되었다. 따라서 해양 안전수칙과 관련하여 어느 분야가 취약한지 확인할 수 있도록 선박 및 수상레저기구, 수영으로 구분하여 안전수칙 준수 여부를 조사하던 기존 문항에 낚시를 추가하였다.
텍스트 분석이 가능한 형태로 변환하기 위해 데이터 전처리를 수행하고, 동시 출현 단어의 네트워크 분석(Network Analysis)을 통해 키워드의 관계를 살펴보았다. 비구조화된 텍스트로부터 의미 있는 주제를 추출하는 확률 모델 알고리즘인 토픽 모델링(Topic Modeling) 기법을 적용하여 해양안전에 대한 제안 주제를 분류하였다. 해양안전에 대한 요구사항이 해양안전문화지수 도출을 위한 설문 문항에 반영되도록 수정·보완하고, 설문조사 결과로 설문 문항 간 신뢰도 분석을 통해 측정 도구로써 유의미한 가치가 있는지 확인하였다.
설문조사로 수집한 해양안전에 대한 제안 내용은 텍스트 형태의 비정형 데이터이므로 Fig. 1과 같이 텍스트 마이닝 기법을 활용하여 분석하였다. 텍스트 마이닝이란 Feldman과 Dagan에 의해 텍스트 데이터베이스 기반의 지식 발견이라는 개념으로 처음 언급되었으며, 자연어 처리 기술을 바탕으로 기존에 알려지지 않은 유용한 패턴과 지식을 발견하기 위해 기계적 알고리즘으로 텍스트로부터 정보를 자동으로 추출하는 프로세스를 의미한다(Feldman and Dagan, 1995; Hotho et al.
안전요원, 해양경찰, 구조대 등 해양 관련 전문 인력과 함께 해양안전 인프라를 확충해야 한다는 제안에 따라 ‘신속하고 효율적인 구조 시스템 보유 여부’와 ‘해양안전문화 확산을 위한 인력, 시설 등 인프라의 적정성’에 대한 문항을 Part 4(해양안전 문화 실태)에 추가하였다.
설문 응답자가 자유 기술한 비정형 데이터를 텍스트 분석이 가능한 형태로 변환하기 위해서는 전처리가 필요하다. 우선 띄어쓰기와 맞춤법을 수정하고, 숫자와 특수문자를 제거하였다. 텍스트를 형태소 단위로 분석한 후 명사, 형용사, 동사를 추출하였다.
하나의 단어만으로는 전체적인 의미 파악이 쉽지 않고 단어의 순서에 따라 의미가 변화할 수 있다. 이를 구분하기 위해 TF-IDF 가중치를 적용한 TDM(Term-Document Matrix)을 만들고 상위 50개 키워드로 동시출현행렬을 생성하였다.
전처리 과정을 거친 해양안전에 대한 제안을 LDA 알고리즘으로 토픽 모델링을 수행하였다. LDA 모델의 파라미터 추정을 위해 Gibbs Sampling 방식을 사용하였으며, 모델을 평가하는 지표로 Perplexity 값을 기반으로 최적의 토픽 수를 결정하였다(Grun and Hornik, 2011; Griffiths and Steyvers, 2004).
해양안전 제안 내용을 텍스트 마이닝 기법으로 분석하기 위해 오픈 소스 프로그램인 R의 KoNLP, wordcloud2, tm, qgraph, topicmodels 등의 패키지를 활용하였다. 텍스트 분석이 가능한 형태로 변환하기 위해 데이터 전처리를 수행하고, 동시 출현 단어의 네트워크 분석(Network Analysis)을 통해 키워드의 관계를 살펴보았다. 비구조화된 텍스트로부터 의미 있는 주제를 추출하는 확률 모델 알고리즘인 토픽 모델링(Topic Modeling) 기법을 적용하여 해양안전에 대한 제안 주제를 분류하였다.
우선 띄어쓰기와 맞춤법을 수정하고, 숫자와 특수문자를 제거하였다. 텍스트를 형태소 단위로 분석한 후 명사, 형용사, 동사를 추출하였다. 형태소 분석이란 하나의 문장을 분해 가능한 최소한의 단위로 분리하고 분석하는 것을 말하는 것으로써 자연어 처리에서 형태소 분석은 어휘 사전을 기반으로 입력 문자를 분석하는 것이다(Hotho et al.
해양안전 관련 교육 대상자를 확대하고 교육을 지속해야한다는 제안에 따라 교육 대상자를 성인, 미성년자 및 선박 또는 수상레저기구 이용자로 구분하였다. 또한 ‘해양안전 관련 행사 또는 교육에 참여한 경험’을 묻는 문항을 행사와 교육으로 각각 분리하고, 각 경험을 최근 5년 이내로 한정하였다.
해양안전과 관련하여 모른다는 의견이 다수이고, 해양안전문화를 확산하기 위해 적극적인 홍보가 필요하다는 제안에 따라 ‘해양안전 관련 공익광고, 캠페인과 같은 홍보’와 ‘해양안전 관련 행사’가 충분히 제공되고 있는지를 조사하는 항목을 추가하였다.
해양안전에 대한 요구사항이 해양안전문화지수 도출을 위한 설문 문항에 반영되도록 수정·보완하고, 설문조사 결과로 설문 문항 간 신뢰도 분석을 통해 측정 도구로써 유의미한 가치가 있는지 확인하였다.
대상 데이터
’, ‘잘 모름’과 같이 해양안전에 대한 제안과 관련이 적은 내용을 제외한 915명의 의견을 분석 대상으로 하였다.
2019년 설문조사는 일반인의 경우 1,000명을 대상으로 성별, 연령별, 지역별로 표본 할당하여 온라인으로 진행하였으며, 해양종사자의 경우 601명을 대상으로 해운선사, 해양경찰, 해양대학 등 해양 관련 관계기관의 협조를 받아 진행하였다.
또한 ‘해양안전 관련 행사 또는 교육에 참여한 경험’을 묻는 문항을 행사와 교육으로 각각 분리하고, 각 경험을 최근 5년 이내로 한정하였다.
2018년 해양안전문화지수를 도출하기 위한 설문조사에서 해양안전에 대한 제안을 자유롭게 기술하도록 한 바 있다. 설문조사는 성별, 연령별, 지역별 표본 할당한 일반 국민 1,000명과 해운선사, 관계기관 등 해양종사자 561명을 대상으로 하였다. 전체 응답자 1,561명 중 ‘안전이 중요하다.
‘해양안전’, ‘필요’와 같이 질문에 포함되어 있어 자주 사용될 것으로 예상되는 단어와 단독으로는 의미 추정이 쉽지 않은 1음절의 단어를 분석에서 제외하고, ‘하계’, ‘여름철’과 같은 동의어를 하나의 단어로 통일하였다. 이처럼 전처리 과정을 거친 분석 대상 단어는 총 1,387개이다.
본 연구에서는 한국정보화진흥원에서 제작한 NIADic을 형태소 사전으로 사용하였고, 해사 용어는 사용자 사전에 등록하여 분석을 진행하였다. 형태소 분석을 통해 추출한 명사, 형용사, 동사는 총 2,230개이다.
데이터처리
측정하고자 하는 사항이 응답자로부터 일관되고 정확한 답변을 얻을 수 있는지, 즉 측정 도구로써 유의미한 가치가 있는지 확인하기 위해 신뢰도 분석을 하였다. 신뢰도 측정 시 가장 많이 사용하는 방법인 내적 일관성에 의한 척도의 신뢰성 평가를 위해 크론바흐(Cronbach)의 알파 계수를 확인하였다. 항목 간의 상관관계가 높을수록 내적 일관성이 높다고 평가하는 것으로 크론바흐의 알파 계수 값이 1에 가까울수록 신뢰도가 높다.
측정하고자 하는 사항이 응답자로부터 일관되고 정확한 답변을 얻을 수 있는지, 즉 측정 도구로써 유의미한 가치가 있는지 확인하기 위해 신뢰도 분석을 하였다. 신뢰도 측정 시 가장 많이 사용하는 방법인 내적 일관성에 의한 척도의 신뢰성 평가를 위해 크론바흐(Cronbach)의 알파 계수를 확인하였다.
이론/모형
전처리 과정을 거친 해양안전에 대한 제안을 LDA 알고리즘으로 토픽 모델링을 수행하였다. LDA 모델의 파라미터 추정을 위해 Gibbs Sampling 방식을 사용하였으며, 모델을 평가하는 지표로 Perplexity 값을 기반으로 최적의 토픽 수를 결정하였다(Grun and Hornik, 2011; Griffiths and Steyvers, 2004).
, 2005). 본 연구에서는 한국정보화진흥원에서 제작한 NIADic을 형태소 사전으로 사용하였고, 해사 용어는 사용자 사전에 등록하여 분석을 진행하였다. 형태소 분석을 통해 추출한 명사, 형용사, 동사는 총 2,230개이다.
해양안전 제안 내용을 텍스트 마이닝 기법으로 분석하기 위해 오픈 소스 프로그램인 R의 KoNLP, wordcloud2, tm, qgraph, topicmodels 등의 패키지를 활용하였다. 텍스트 분석이 가능한 형태로 변환하기 위해 데이터 전처리를 수행하고, 동시 출현 단어의 네트워크 분석(Network Analysis)을 통해 키워드의 관계를 살펴보았다.
성능/효과
‘교육’, ‘홍보’, ‘의식’ 등 텍스트 마이닝 기법을 활용해 분석한 해양안전 제안 내용을 18개의 설문 문항에 반영시켰으며, 수정·보완한 설문 문항은 2019년 해양안전문화지수를 도출하는 데 활용되었다. 그 결과 설문 문항의 내적 일관성을 나타내는 척도인 크론바흐의 알파 계수는 2019년 설문조사에서 0.895로 2018년 설문조사 0.888보다 0.007만큼 향상된 값으로 나타나 설문조사를 통해 도출하고 있는 해양안전문화지수의 신뢰성 향상에도 기여할 것으로 판단된다.
수정·보완한 설문 문항의 내적 일관성은 Part 5를 제외하고 모두 향상된 것으로 평가되었다.
후속연구
해양안전문화지수는 해양안전에 대한 국민의 경험과 인식을 객관적으로 측정하기 위한 지표로써 해양안전문화 확산을 위한 정책 자료로 활용될 수 있을 것으로 판단된다. 해양안전문화를 단기간에 확산시키기는 쉽지 않겠지만 해양안전문화지수의 대상자별, 영역별 비교를 통해 취약점을 확인하고 이를 개선해 나간다면 해양안전문화를 정착해 나가는 데 도움이 될 것으로 기대한다.
해양안전문화지수는 해양안전에 대한 국민의 경험과 인식을 객관적으로 측정하기 위한 지표로써 해양안전문화 확산을 위한 정책 자료로 활용될 수 있을 것으로 판단된다. 해양안전문화를 단기간에 확산시키기는 쉽지 않겠지만 해양안전문화지수의 대상자별, 영역별 비교를 통해 취약점을 확인하고 이를 개선해 나간다면 해양안전문화를 정착해 나가는 데 도움이 될 것으로 기대한다.
참고문헌 (19)
AAA foundation for Traffic Safety(2019), 2018 Traffic Safety Culture Index, http://www.aaafoundation.org/ (Accessed Nov. 2019).
Blei, D. M.(2012), Probabilistic Topic Models, Communications of the ACM, Vol. 55, pp. 77-84.
Grun, B. and K. Hornik(2011), Topic models: An R Package for Fitting Topic Models, Journal of Statistical Software, Vol. 40, No. 13, pp. 1-30.
Hotho, A., A. Nurnberger, and G. Paass(2005), A Brief Survey of Text Mining, LDV Forum - GLDV Journal for Computational Linguistics and Language Technology, Vol. 20, pp. 19-62.
IAM RoadSmart(2016), Measuring attitudes to driving safety & behaviour_The IAM RoadSmart Safety Culture Index, IAM Safety Culture Report, pp. 2-3.
Kang, S. Y., K. S. Kim, and B. S. Rho(2018), An Analysis of Causes of Marine Incidents at sea Using Big Data Thchnique, Journal of the Korean Society of Marine Environment & safety, Vol. 24, No. 4, pp. 408-414.
Kim, S. H., Y. J. Lee, J. Y. Shin, and K. Y. Park(2010), Text ming for Economic Analysis, Bank of Korea, Vol. 2019-18, p. 10.
Kim, Y. M.(2013), Study on Improving Safety Cultures by Analysing Behavior Characteristics of Korean Seafarers, Journal of the Korean Society of Marine Environment & safety, Vol. 19, No. 5, pp. 503-510.
KOSHA(2019), Korea Occupational Safety & Health Agency, Concept of safety culture, http://www.kosha.or.kr/ (Accessed Dec. 2019).
Lee, J. S., B. K. Lee, and I. S. Cho(2019), Text Mining Anaysis Technique on ECDIS Accident Report, Journal of the Korean Society of Marine Environment & safety, Vol. 25, No. 4, pp. 405-412.
MOLIT(2019), Ministry of Land, Infrastructure and Transport, Transport Culture Index, http://www.molit.go.kr/ (Accessed Dec. 2019).
Paek, Y. J., C. H. Jung, and D. G. Yoon(2018), The Development of Marine Safety Culture Index, Journal of Korean Maritime Police Science, Vol. 8. No. 4, pp. 79-106.
Park, J. H. and M. Song(2013), A Study on the Research Trends in Library & Information Science in Korea using Topic Modeling, Journal of the Korean Society for Information Management, Vol. 30, No. 1, pp. 7-32.
Salton, G. and M. J. McGill(1983), Introduction to Modern Information Retrieval, McGraw-Hill, New York.
Seo, S. H.(2016), Fintech Trend Analysis using Topic Modeling of BM Patents, Graduate School of Seoul National University of Science and Technology.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.