최근 우리나라에서 일어나고 있는 재해의 규모 및 유형은 과거와 달리 다양화되고 있다. 하지만 우리나라는 이러한 여러 재해를 예측하기 위한 다양한 정보지원체계를 구축하지 못하고 있다. 현재 많은 기관에서 관련정보를 제공하고 있다. 이들 정보는 주로 웹으로 제공되고 있지만 대부분 실시간정보가 아니다. 본 연구에서는 기관들이 제공하는 정보와 함께 좀 더 양질의 실시간 정보를 제공하기 위해서 빅데이터를 활용한 정보지원을 주목하게 되었다. 빅데이터는 실시간성을 갖는 많은 양의 정보가 있고, 이를 이용하여 사용자맞춤 서비스를 할 수 있다. 그 중에서 트위터나 페이스북 등의 SNS는 재난이 발생했을 때 새로운 정보수집매체로서 이용할 수 있다. 그러나 너무 많은 정보로부터 필요한 정보를 자세히 검색하는 것은 무척 어렵고, 직감적인 정보수집이 곤란하다는 문제가 있다. 이를 위해서 본 연구에서는 트위터를 이용한 정보지원시스템을 개발한다. 시스템은 트위터 해시태그를 이용하여 정보를 검색한다. 또한 직감적으로 정보를 파악할 수 있도록, 지도상에 정보 매핑을 수행한다. 시스템의 평가를 위해, 정보추출, 매핑정도, 추천속도를 평가한다.
최근 우리나라에서 일어나고 있는 재해의 규모 및 유형은 과거와 달리 다양화되고 있다. 하지만 우리나라는 이러한 여러 재해를 예측하기 위한 다양한 정보지원체계를 구축하지 못하고 있다. 현재 많은 기관에서 관련정보를 제공하고 있다. 이들 정보는 주로 웹으로 제공되고 있지만 대부분 실시간정보가 아니다. 본 연구에서는 기관들이 제공하는 정보와 함께 좀 더 양질의 실시간 정보를 제공하기 위해서 빅데이터를 활용한 정보지원을 주목하게 되었다. 빅데이터는 실시간성을 갖는 많은 양의 정보가 있고, 이를 이용하여 사용자맞춤 서비스를 할 수 있다. 그 중에서 트위터나 페이스북 등의 SNS는 재난이 발생했을 때 새로운 정보수집매체로서 이용할 수 있다. 그러나 너무 많은 정보로부터 필요한 정보를 자세히 검색하는 것은 무척 어렵고, 직감적인 정보수집이 곤란하다는 문제가 있다. 이를 위해서 본 연구에서는 트위터를 이용한 정보지원시스템을 개발한다. 시스템은 트위터 해시태그를 이용하여 정보를 검색한다. 또한 직감적으로 정보를 파악할 수 있도록, 지도상에 정보 매핑을 수행한다. 시스템의 평가를 위해, 정보추출, 매핑정도, 추천속도를 평가한다.
Recently, the size and type of disasters in Korea has been diversified. However, Korea has not been able to build various information support systems to predict these disasters.Many other organizations also provide relevant information. This information is mainly provided on the Web, but most of it ...
Recently, the size and type of disasters in Korea has been diversified. However, Korea has not been able to build various information support systems to predict these disasters.Many other organizations also provide relevant information. This information is mainly provided on the Web, but most of it is not real time information. In this study, we have paid attention to support information using big data to provide better quality real - time information together with information provided by institutions. Big data has a large amount of information with real-time property, and it can make customized service using it. Among them, SNS such as Twitter and Facebook can be used as a new information collection medium in case of disaster. However, it is very difficult to retrieve necessary information from too much information, and it is difficult to collect intuitive information. For this purpose, this study develops an information support system using Twitter. The system retrieves information using the Twitter hashtag. Also, information mapping is performed on the map so that intuitive information can be grasped. For system evaluation, information extraction, degree of mapping, and recommendation speed are evaluated.
Recently, the size and type of disasters in Korea has been diversified. However, Korea has not been able to build various information support systems to predict these disasters.Many other organizations also provide relevant information. This information is mainly provided on the Web, but most of it is not real time information. In this study, we have paid attention to support information using big data to provide better quality real - time information together with information provided by institutions. Big data has a large amount of information with real-time property, and it can make customized service using it. Among them, SNS such as Twitter and Facebook can be used as a new information collection medium in case of disaster. However, it is very difficult to retrieve necessary information from too much information, and it is difficult to collect intuitive information. For this purpose, this study develops an information support system using Twitter. The system retrieves information using the Twitter hashtag. Also, information mapping is performed on the map so that intuitive information can be grasped. For system evaluation, information extraction, degree of mapping, and recommendation speed are evaluated.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
해시 태그를 트윗에 부여하는 것으로, 같은 해시 태그 그룹으로 정보를 구성 할 수 있게 된다. 기본적으로같은 정보는 같은 해시 태그를 부여하여 동일한 정보를알기 쉽게 정리하는 것이 목적이다. 또한 해시 태그를 검색하여 동일 그룹 정보를 검색 할 수 있게 된다.
본 논문에서는 재해분류 중 지진을 배경으로 연구하였다. 한반도는 지진학적으로 판구조 운동으로 인한 국지적 응력이 축적되어 지진이 발생할 수 있는 판 내부에속하며 발생지진도 판 내부지진의 특성을 갖고 있다.
이들 정보는 주로 웹 포털로 제공되고 있지만 대부분 실시간 정보가 아니다. 본 연구에서는 기관들이 제공하는 정보와 함께 좀 더 양질의 실시간 정보를 제공하기 위해서 빅데이터를 활용한 정보지원을 주목하게 되었다.
본 연구에서는 트위터에서 방대한 정보에서 사용자가원하는 재해 정보만을 추출하는 시스템을 구축하고 시스템의 유효성을 평가한다. 제안 시스템에서는 해시 태그를 이용하여 재해 정보를 조사하고, 피해 정보를 지도상에 매핑함으로써 사용자의 재해 정보 수집을 용이하게한다.
본 연구에서는 트위터의 방대한 정보에서 사용자가원하는 재해 정보만을 추출하는 시스템을 구축하고 시스템의 유효성을 평가한다. 제안 시스템에서는 해시 태그를 이용하여 재해 정보를 조사하고, 피해 정보를 지도상에 매핑함으로써 사용자의 재해 정보 수집을 용이하게 한다.
제안 시스템은 사용자가 재해 정보를 쉽게 추출해서서비스를 받는 것을 목적으로 한다. 따라서 제안된 시스템에서는 추천 재해 정보 및 사용자가 원하는 재해 정보의 일치율과 추천 재해 정보의 매핑의 일치율 및 재해 정보 추천 속도에 대한 평가를 실시한다.
제안 방법
첫째, 정보 필터링을 통해 글 내용에서 명사를 추출한다. 그리고 추출한 명사와 사전에 준비한 지명 사전과 비교하여 일치하는 명사를 그 피해 정보의 위치 정보로 추출한다. GPS 위치 정보가 추가되는 경우, 그 위치 정보를 재해 정보의 위치 정보로 추출한다.
키워드로 정보 검색을 실시했을 경우, 검색을 통해 추출된 피해 정보에서 해시 태그를 추출한다.그리고 추출한 해시 태그마다 해시 태그 그룹의 특징어를 추출한다.
해시 태그를 이용한 감시는 사용자가 정보를 검색 할때 해시 태그가 서로 다르고 복잡하기 때문에 정보의 취득이 곤란하다. 따라서 제안 된 시스템은 내용이 동일한해시태그를 통일하고 사용자가 쉽게 정보를 얻을 수 있도록 한다. 다음에서 해시 태그를 이용한 조사의 내용을말한다.
제안 시스템은 사용자가 재해 정보를 쉽게 추출해서서비스를 받는 것을 목적으로 한다. 따라서 제안된 시스템에서는 추천 재해 정보 및 사용자가 원하는 재해 정보의 일치율과 추천 재해 정보의 매핑의 일치율 및 재해 정보 추천 속도에 대한 평가를 실시한다. 평가의 재해 정보로 잡음 데이터, 해시 태그 데이터, 위치 정보 데이터, 세가지 정보를 사용한다.
사용자는 정보를 취득할 때, 재해 정보와 자신의 위치정보와 대조가 어렵고, 피해 상황의 정확한 파악이 곤란하다. 따라서 제안된 시스템은 재해 정보의 위치 정보를이용하여 매핑을 수행하고 사용자가 쉽게 피해 상황을파악할 수 있도록 한다. 다음에 해시 태그를 이용한 조사의 내용을 기술한다.
또한 Twitter에서 제안 시스템이 제대로 작동하는지평가도 실시했다. Twitter에서 정보를 추출하는 수단으로 Twitter API 중 하나 인 Search API을 이용했다.
제안 시스템은 처음에 Twitter에서 취득한 정보에서해시 태그 추출한다. 이 추출한 해시 태그를 이용하여 정보를 감시하고 사용자에게 적합한 재해 정보를 추천한다.다음은 조사 된 피해 정보에서 위치 정보를 추출한다.
본 연구에서는 트위터의 방대한 정보에서 사용자가원하는 재해 정보만을 추출하는 시스템을 구축하고 시스템의 유효성을 평가한다. 제안 시스템에서는 해시 태그를 이용하여 재해 정보를 조사하고, 피해 정보를 지도상에 매핑함으로써 사용자의 재해 정보 수집을 용이하게 한다.
본 연구에서는 트위터의 방대한 정보에서 사용자가원하는 재해 정보만을 추출하는 시스템을 구축하고 시스템의 유효성을 평가한다. 제안 시스템에서는 해시 태그를 이용하여 재해 정보를 조사하고, 피해 정보를 지도상에 매핑함으로써 사용자의 재해 정보 수집을 용이하게 한다.
제안 시스템은 우선 사용자가 원하는 정보에 대해 검색한다. 그런 다음 정보를 포함 해시 태그 그룹에서 특징어를 추출한다.
제안 시스템은 처음에 Twitter에서 취득한 정보에서해시 태그 추출한다. 이 추출한 해시 태그를 이용하여 정보를 감시하고 사용자에게 적합한 재해 정보를 추천한다.
제안 시스템은 해시 태그를 사용하여 사용자에 맞는재해 정보를 추천하고 추출한 위치 정보를 이용하여 매핑 한다. 제안 시스템의 흐름을 Fig 1에 나타낸다.
위치 정보를 추출을 위해 정보 필터링을 사용한다. 첫째, 정보 필터링을 통해 글 내용에서 명사를 추출한다. 그리고 추출한 명사와 사전에 준비한 지명 사전과 비교하여 일치하는 명사를 그 피해 정보의 위치 정보로 추출한다.
특징어를 추출하기 위해 정보 필터링을 사용한다. 정보 필터링하여 검색 정보에서 중요도가 높은 명사를 추출하고 그 명사를 문장의 특징어로 사용한다.
대상 데이터
따라서 평가에서도 그런환경에 견딜 수 있는지를 검증 할 필요가 있다. 이번 평가에서는 2 번째 이후의 조사 시 1 회당 500개의 잡음 데이터를 정보로 제공한다.
해시 태그 데이터는 위치 정보를 유지하지 않도록 설정하고 있다. 초기 데이터량으로잡음 데이터는 1000개, 해시 태그 데이터는 500개, 위치정보 데이터는 500개로 한다. 대상 Twitter는 시간이 지남마다 정보량이 방대해 진다.
따라서 제안된 시스템에서는 추천 재해 정보 및 사용자가 원하는 재해 정보의 일치율과 추천 재해 정보의 매핑의 일치율 및 재해 정보 추천 속도에 대한 평가를 실시한다. 평가의 재해 정보로 잡음 데이터, 해시 태그 데이터, 위치 정보 데이터, 세가지 정보를 사용한다. 잡음 데이터는 재해 정보를 포함하지 않거나 사용자가 원하는 재해 정보가 아닌 정보로구성된 데이터 집합이다.
성능/효과
평가 결과에서 제안된 시스템은 Twitter에서도 충분한 정확도를 가지고, 사용자에게 재해 정보를 추천하는것이 가능하다고 할 수 있다. 추천 정보와 매핑의 일치도모두 높은 수준을 이 검색이 가능 해지고 있다.
평가 결과에서 제안된 시스템은 충분한 정확도를 가지고, 사용자에게 재해 정보를 추천하는 것이 가능하다고 할 수 있다. 횟수가 거듭될수록 수치가 떨어지는 이유는 다음과 같다.
후속연구
향후의 과제로서 검색의 효율성을 통한 속도 향상을들 수 있다. Twitter에서 정보를 검색 할 경우 대량의 정보를 한 번에 액세스하기 위해 일반 검색에서 추천 속도에 큰 부담이 된다.
질의응답
핵심어
질문
논문에서 추출한 답변
재해의 사전적 정의는?
재해의 사전적 정의로는 "재앙으로 인하여 입은 피해," "재앙으로 말미암아 받는 피해로 지진, 태풍, 홍수,가뭄, 해일, 화재, 전염병, 따위에 의하여 받게 되는 피해이며, 자연적 요인 또는 인위적인 요인으로 말미암아 인간 및 인간사회에 어떤 파괴력이 가해져 인명이나 사회적 재산 등의 손실을 입힘으로써 그때까지 구축되어온사회적 균형이 붕괴되는 일"이라고 정의되어 있다.[7]
다양하고 수많은 비정형 데이터들이 만들어지기 시작한 배경은?
스마트폰의 급격한 보급과 페이스북, 트위터, 카카오톡 등 다양한 정보채널의 등장으로 우리 주변에는 다양하고 수많은 비정형 데이터들이 만들어지고 있다. 트위터는 전세계 1억명의 이용자들이 하루 평균 2억 개의 트윗을 발생시킨다.
빅데이터가 가지는 한계는?
그러나 너무 많은 정보로부터 필요한 정보를 자세히검색하는 것은 무척 어렵고 갱신되는 정보의 양과 빈도수가 너무 크다. 그렇기 때문에 사용자는 수많은 정보를검색하지 않고 사용자가 원하는 정보를 얻는 것은 굉장히 어렵다. 또한 트위터의 정보는 기본적으로 문자정보만 있기 때문에 자신의 위치정보와 대조가 어려워 피해상황을 정확히 인식하는 것이 곤란하다.
참고문헌 (17)
Y. Yoo & C. Yoon & H. Lee & J. Lee. (2011). A Study on Natural Disaster Damage and Response in Vulnerable Country. THE JOURNAL OF APPLIED GEOGRAPHY, 29, 77-93.
S. H. Oh. & S. H. Shin. (2016). Correlation Analysis of Gyeongju Earthquake Waveform and Structural Damage Scale. JOURNAL OF THE ARCHITECTURAL INSTITUTE OF KOREA Structure & Construction, 32(12), 33-44.
Y. Lee & C. H. Song & C. R. Park.(2016). A Study of Guidelines for Coverage in Dangerous Areas : The Case of Japan. Japanese Cultural Studies, 58, 227-252.
J. B. Yi & C. K. Lee & K. J. Cha. (2015). An Analysis of IT Trends Using Tweet Data. Journal of Intelligence and Information Systems, 21(1), 143-159.
O. H. Kwan, S. H. Nam, C. H. Lee.(2001). A Study on Practical Analyzing and Improving Disaster Management Organization of Korean Government, Korea Institute of Fire Science and Engineering, Volume 15, Issue 1, pp.127-138
S. H. Oh & S. H. Shin.(2016) Correlation Analysis of Gyeongju Earthquake Waveform and Structural Damage Scale, JOURNAL OF THE ARCHITECTURAL INSTITUTE OF KOREA Structure & Construction, 32(12), 33-44.
E. Y. Lee & D. O. Park & I. O. Choi. (2014). Current Status of Educational Big Data Research. Proceedings of the Korean Society of Computer Information Conference, 22(2), 175-176.
S. Choi & Y. J. Hyun & N. G. Kim. (2015) Improving Performance of Recommendation Systems Using Topic Modeling. Journal of Intelligence and Information Systems, 21(3) ,101-116.
B. S. Kim. (2014). Analyzing SNS Users' Knowledge Sharing Behaviors in a Big Data Era: A Privacy Calculus Model Perspective. The e-Business Studies, 15(1), 297-315.
Twitter, 2018/01/01, https://twitter.com/
https://developers.google.com/maps/?hlko
James M. & Michael C. (2011). Big data: The next frontier for innovation, competition, and productivity, McKinsey Global Institute, pp. 1-36.
Y. J. Yi & S. H. Lee & J. S. Yi. (2014). KB Kookmin Card's Marketing Activities and Use of Big Data. Korea Business Review, 18(1), 145-176.
S. W. Kim.(2017). Value Model for Applications of Big Data Analytics in Logistics, Journal of Digital Convergence, 15(9), pp.167-178
J. S. Han(2014). Utilization Outlook of Medical Big Data in the Cloud Environment, Journal of Digital Convergence, 12(6), pp.341-347
※ AI-Helper는 부적절한 답변을 할 수 있습니다.