최근 빅 데이터의 중요성이 높아지고 관련 인프라가 발전함에 따라 과거 거래 처리 데이터 위주의 분석이 중심이 되던 때와는 비교할 수도 없이 많은 데이터들이 끊임없이 발생하고 있다. 특히 데이터의 형식 측면에서 기존 정형 데이터 위주의 분석 데이터가 문서, 사진, 음성 파일 등과 같은 비정형 데이터와 ...
최근 빅 데이터의 중요성이 높아지고 관련 인프라가 발전함에 따라 과거 거래 처리 데이터 위주의 분석이 중심이 되던 때와는 비교할 수도 없이 많은 데이터들이 끊임없이 발생하고 있다. 특히 데이터의 형식 측면에서 기존 정형 데이터 위주의 분석 데이터가 문서, 사진, 음성 파일 등과 같은 비정형 데이터와 반 정형 데이터 위주로 변화하고 있으며, 데이터가 실시간으로 생성되고 있어 기존 데이터 분석 및 처리 기술의 범위를 넘어서는 경우가 발생한다. 과거에는 저장 용량의 한계 및 분석 기술의 부재로 인해 빅 데이터를 효과적으로 활용할 수 없었으나, 데이터 저장 매체가 발전하고 다양한 오픈소스 빅 데이터 관련 인프라가 등장하면서 빅 데이터의 활용 가능성이 높아지고 있다.
이처럼 빅 데이터 활용 가능성이 높아지고 분석기술 및 저장 매체가 발달함에 따라 사회 · 경제 · 정치 각 분야에서 빅 데이터 분석을 통한 분석 결과 활용에 대한 관심이 증가하고 있다. 민간 부문에서는 기업의 비즈니스 의사결정에 빅 데이터를 활발하게 적용하고 있으며, 공공 부문에서는 국가 미래전략 수립, 데이터 기반의 과학적 정책 수립, 재난 관리 등에 빅 데이터를 활용하고 있다.
우리나라에서는 1990년대 일어난 대형 사고들을 계기로 재난에 대한 체계적인 관리가 필요하다는 인식이 확산되었고, 국가 차원에서 재난 및 안전 관리에 관한 법률을 제정했다. 과거 재난은 자연 재해, 전쟁 등에 치중되어 있었으나, 최근에는 인적 요인에 의한 사고와 국가 기반 체계의 마비를 일으킬 수 있는 장애 요소들을 뜻하는 것으로 그 의미가 확장되고 있다. 빅 데이터 분석은 빅 데이터로부터 데이터간의 연관 관계 및 숨어있는 패턴을 찾아내어 미래를 예측할 수 있기 때문에 재난 관련 분야에 적용하려는 수요가 크다.
본 연구에서는 재난의 범위 중 교통사고, 그 중에서도 항공 안전과 관련된 비정형 데이터에 빅 데이터 분석 기법을 적용했다. 항공 사고는 한 번 발생하면 수많은 인명 피해와 더불어 물적 재산의 손해, 나아가 큰 사회적 문제가 될 수 있기 때문에 우리나라에서는 항공 사고를 교통 부문 재난으로 규정했다. 기존의 많은 연구들에서 항공 안전 분야 관련 데이터를 분석하려는 시도가 있었으나 항공 분야에는 아직 정형 데이터만을 분석 대상으로 한 연구들이 대부분이며, 비정형 데이터를 분석에 적용한 연구는 미비하다.
이에 본 연구에서는 항공 사고 및 준 사고 관리를 재난 관리 관점에서 바라보고, 항공 재난 관리를 위한 빅 데이터 분석 기법 활용에 관해 연구한다. 본 연구에서는 기존에 정형 데이터에만 치중 되었던 연구들의 한계를 극복하기 위해 빅 데이터 분석 기법인 텍스트 마이닝을 적용하여 항공 안전과 관련된 비정형 텍스트 데이터를 분석하였다. 항공 안전 장애 사례 텍스트 데이터의 토픽 분석을 통해 항공 안전과 관련된 중요 키워드들을 도출하고 키워드 간 관계를 시각화하며, 텍스트 클러스터링을 통해 항공 사고 및 준 사고를 일으킬 수 있는 장애 요인을 살펴봄으로써 잠재 원인 도출 및 향후 항공 사고로 인한 재난 발생을 예방하기 위한 항공 분야 빅 데이터 분석의 기반을 마련하고자 한다.
최근 빅 데이터의 중요성이 높아지고 관련 인프라가 발전함에 따라 과거 거래 처리 데이터 위주의 분석이 중심이 되던 때와는 비교할 수도 없이 많은 데이터들이 끊임없이 발생하고 있다. 특히 데이터의 형식 측면에서 기존 정형 데이터 위주의 분석 데이터가 문서, 사진, 음성 파일 등과 같은 비정형 데이터와 반 정형 데이터 위주로 변화하고 있으며, 데이터가 실시간으로 생성되고 있어 기존 데이터 분석 및 처리 기술의 범위를 넘어서는 경우가 발생한다. 과거에는 저장 용량의 한계 및 분석 기술의 부재로 인해 빅 데이터를 효과적으로 활용할 수 없었으나, 데이터 저장 매체가 발전하고 다양한 오픈소스 빅 데이터 관련 인프라가 등장하면서 빅 데이터의 활용 가능성이 높아지고 있다.
이처럼 빅 데이터 활용 가능성이 높아지고 분석기술 및 저장 매체가 발달함에 따라 사회 · 경제 · 정치 각 분야에서 빅 데이터 분석을 통한 분석 결과 활용에 대한 관심이 증가하고 있다. 민간 부문에서는 기업의 비즈니스 의사결정에 빅 데이터를 활발하게 적용하고 있으며, 공공 부문에서는 국가 미래전략 수립, 데이터 기반의 과학적 정책 수립, 재난 관리 등에 빅 데이터를 활용하고 있다.
우리나라에서는 1990년대 일어난 대형 사고들을 계기로 재난에 대한 체계적인 관리가 필요하다는 인식이 확산되었고, 국가 차원에서 재난 및 안전 관리에 관한 법률을 제정했다. 과거 재난은 자연 재해, 전쟁 등에 치중되어 있었으나, 최근에는 인적 요인에 의한 사고와 국가 기반 체계의 마비를 일으킬 수 있는 장애 요소들을 뜻하는 것으로 그 의미가 확장되고 있다. 빅 데이터 분석은 빅 데이터로부터 데이터간의 연관 관계 및 숨어있는 패턴을 찾아내어 미래를 예측할 수 있기 때문에 재난 관련 분야에 적용하려는 수요가 크다.
본 연구에서는 재난의 범위 중 교통사고, 그 중에서도 항공 안전과 관련된 비정형 데이터에 빅 데이터 분석 기법을 적용했다. 항공 사고는 한 번 발생하면 수많은 인명 피해와 더불어 물적 재산의 손해, 나아가 큰 사회적 문제가 될 수 있기 때문에 우리나라에서는 항공 사고를 교통 부문 재난으로 규정했다. 기존의 많은 연구들에서 항공 안전 분야 관련 데이터를 분석하려는 시도가 있었으나 항공 분야에는 아직 정형 데이터만을 분석 대상으로 한 연구들이 대부분이며, 비정형 데이터를 분석에 적용한 연구는 미비하다.
이에 본 연구에서는 항공 사고 및 준 사고 관리를 재난 관리 관점에서 바라보고, 항공 재난 관리를 위한 빅 데이터 분석 기법 활용에 관해 연구한다. 본 연구에서는 기존에 정형 데이터에만 치중 되었던 연구들의 한계를 극복하기 위해 빅 데이터 분석 기법인 텍스트 마이닝을 적용하여 항공 안전과 관련된 비정형 텍스트 데이터를 분석하였다. 항공 안전 장애 사례 텍스트 데이터의 토픽 분석을 통해 항공 안전과 관련된 중요 키워드들을 도출하고 키워드 간 관계를 시각화하며, 텍스트 클러스터링을 통해 항공 사고 및 준 사고를 일으킬 수 있는 장애 요인을 살펴봄으로써 잠재 원인 도출 및 향후 항공 사고로 인한 재난 발생을 예방하기 위한 항공 분야 빅 데이터 분석의 기반을 마련하고자 한다.
The growing importance of Big data and the development of related infrastructures, huge amounts of data have generated in real time. Especially the format of Big data has changed from structured data to unstructured or semi-structured data, such as text, images, and sound files. Because of 3V(Volume...
The growing importance of Big data and the development of related infrastructures, huge amounts of data have generated in real time. Especially the format of Big data has changed from structured data to unstructured or semi-structured data, such as text, images, and sound files. Because of 3V(Volume, Velocity, Variety)s, the main features of Big data, there are difficulties to analyze and handle Big data. In the past, it was hard to utilize Big data because of the shortage of storage and the absence of analyzing skills. However, thanks to the development of data repository and the appearance of open-source analysis softwares, we can make better use of Big data.
Nowadays, people who worked in various fields of society want to analyze Big data and utilize analysis results. People commonly use Big data in order to support business decision making in private sectors. Also in public sectors, people utilize Big data in various sectors including scientific policy making and disaster management.
In this study, we used Big data analytics for unstructured text data in order to manage aviation accident, a type of aviation disaster. Korea defined aviation accidents as traffic accident disasters by law. Although the aviation accident does not occur very often, it has significant social affect when it happens. Even though many researchers have attempted to analyze data about aviation safety, there are few studies using unstructured data.
To overcome the limitations of previous studies, we use Text Mining, one of the Big data Analytics for unstructured text data. The purpose of this study is to derive the key words from real cases which are potential causal factors of aviation accidents. In addition, we use text clustering methods to classify factors that cause aviation accidents. By doing this, we attempt to establish the foundation of using Big data in aviation sector for future studies.
The growing importance of Big data and the development of related infrastructures, huge amounts of data have generated in real time. Especially the format of Big data has changed from structured data to unstructured or semi-structured data, such as text, images, and sound files. Because of 3V(Volume, Velocity, Variety)s, the main features of Big data, there are difficulties to analyze and handle Big data. In the past, it was hard to utilize Big data because of the shortage of storage and the absence of analyzing skills. However, thanks to the development of data repository and the appearance of open-source analysis softwares, we can make better use of Big data.
Nowadays, people who worked in various fields of society want to analyze Big data and utilize analysis results. People commonly use Big data in order to support business decision making in private sectors. Also in public sectors, people utilize Big data in various sectors including scientific policy making and disaster management.
In this study, we used Big data analytics for unstructured text data in order to manage aviation accident, a type of aviation disaster. Korea defined aviation accidents as traffic accident disasters by law. Although the aviation accident does not occur very often, it has significant social affect when it happens. Even though many researchers have attempted to analyze data about aviation safety, there are few studies using unstructured data.
To overcome the limitations of previous studies, we use Text Mining, one of the Big data Analytics for unstructured text data. The purpose of this study is to derive the key words from real cases which are potential causal factors of aviation accidents. In addition, we use text clustering methods to classify factors that cause aviation accidents. By doing this, we attempt to establish the foundation of using Big data in aviation sector for future studies.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.