$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

트위터를 활용한 실시간 이벤트 탐지에서의 재난 키워드 필터링과 지명 검출 기법
Keyword Filtering about Disaster and the Method of Detecting Area in Detecting Real-Time Event Using Twitter 원문보기

정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.5 no.7, 2016년, pp.345 - 350  

하현수 (가톨릭대학교 컴퓨터공학과) ,  황병연 (가톨릭대학교 컴퓨터정보공학부)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 트위터를 활용하여 이벤트를 실시간으로 탐지하는 시스템에서의 재난 키워드 필터링과 지명 검출 기법을 제안한다. 스마트폰의 보급이 SNS의 빠른 확산을 이끌었고, 최근 SNS를 활용하여 다양한 연구들이 진행되고 있다. SNS 중에서 트위터는 140자의 단문으로 작성되어 빠르게 확산되는 특성을 가지고 있다. 따라서 트윗 사용자들이 작성하는 트윗은 하나의 센서 역할을 수행할 수 있다. 이러한 특성들을 이용하여 발생한 이벤트를 탐지하는 연구가 진행되었다. 그러나 최근 개인 정보 유출 사례가 증가해 자신의 위치 정보를 공개하기 꺼려함에 따라 재난이 발생한 지역을 파악하는데 어려움이 있다. 또한 맞춤법을 따르지 않은 게시글의 내용을 분석하는 과정에서 정확성과 관련된 문제가 발생한다. 따라서 이벤트 발생 탐지 과정에 재난 관련 키워드 필터링과 지명 검출 기법이 추가적으로 적용되어야 한다. 본 논문에서는 재난 관련 키워드 필터링의 적용과 두 가지 지명 검출 기법을 제안한다. 지명을 검출하는 두 가지 기법은 지명 단어에서 발생되는 노이즈를 제거하는 지명 노이즈 제거 기법과 랜드 마크를 이용하여 지명 단어를 확정하는 지명 확정 기법이다. 재난 관련 키워드와 두 지명 검출 기법을 적용한 결과 기존 시스템의 정확도 49%에서 지명노이즈 제거기법은 78%, 지명확정기법은 89%로 향상되었다.

Abstract AI-Helper 아이콘AI-Helper

This research suggests the keyword filtering about disaster and the method of detecting area in real-time event detecting system by analyzing contents of twitter. The diffusion of smart-mobile has lead to a fast spread of SNS and nowadays, various researches based on studying SNS are being processed...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 본 논문에서는 이벤트를 탐지하는 TRED 시스템의 키워드 추출 과정과 지명 검출 과정에 추가적인 알고리즘을 설계하여 제안한다. 우선 재난 이벤트 관련 키워드 필터링 과정을 위해 트위터에서 실제로 사용되어지는 재난 관련 단어를 수집하고 분류과정을 거친 뒤 데이터베이스에 저장하였다.
  • 수집된 트윗에서 키워드를 추출하는 이유는 TRED 시스템이 이벤트가 발생되었다고 탐지했을 때, 트윗 내용을 전부 읽지 않고, 키워드를 통해 어떤 이벤트가 발생되었는지 알기 위함이다. 마찬가지로 지명을 검출하는 이유도 어디에서 이벤트가 발생하였는지 파악하기 위해서다. 지명 지정의 기준은 통계청에서 제공한 시·군·구 범위의 168개의 행정구역명을 참고하여 결정하였다[10].
  • 본 논문에서는 트위터를 이용한 이벤트 탐지 시스템의 정확성을 높이기 위해 재난 관련 키워드 필터링과 지명 검출 기법을 제안하였다.
  • 그럼으로써 적합한 큰 영향을 미칠 수 있는 결정을 내리는데 도움을 줄 수 있다. 이 연구를 통해 이벤트 범위 지정에 대한 도움을 받고, 키워드 필터링의 필요성을 인식하였다. 그러나 [2]와 [3]은 한국어로 진행된 연구가 아니기에 한국어가 적용된 연구가 필요하다고 판단하였다.
  • 지명 노이즈 제거기법의 탐지율과 지명 확정 기법의 정확도가 결합 가능하다면 최적의 지명 검출 기법이 될 것이라 예상하고 시도해보았다. 그러나 지명 확정 기법의 알고리즘이 지명 노이즈 제거기법의 알고리즘을 무의미하게 만들었다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
팔로잉-팔로워 구조는 무엇인가? 또한 팔로잉-팔로워 구조로 이루어져 있어서 개방적인 네트워크를 형성하고 있다. 팔로잉-팔로워 구조는 트위터 이용자가 일방적으로 트위터 상대방에게 요청을 보내면 상대방의 콘텐츠를 공유하게 되는 구조이다. 따라서 트위터 이용자들이 자신이 경험한 일들을 트윗으로 작성하면 다른 이용자들과 작성된 트윗을 공유하게 된다.
랜드 마크는 무엇을 의미하는가? 반면에 지명 확정 기법은 랜드 마크 데이터베이스를 통해 실제 지명인 단어들만 검출하여 지명으로 확정한다. 랜드 마크란 지역의 이미지를 대표하는 특이성 있는 시설이나 건물을 의미한다. 이벤트가 발생한 위치를 지명보다 더 자세하게 검출하려는 목표를 두고 고안한 기법이다.
본 논문에서 제안한 TRED 시스템의 지명 검출 과정에서 발생하는 노이즈는 어떻게 분류되는가? 지명 검출 과정에서 발생하는 노이즈는 두 가지로 분류된다. 첫 번째 지명 노이즈는 지명 바로 뒤에 조사가 붙어 동형이의어로 사용되는 경우이다. 동형이의어는 형태는 같으나 의미가 다른 관계에 있는 단어를 의미한다. 예를 들어 ‘강화’라는 단어가 ‘강화한’, ‘강화되어’와 같이 조사가 함께 사용되면 ‘강화하다’라는 의미로 단어가 사용된다. 두 번째 지명 노이즈는 지명을 포함하고 있는 단어로 인해 발생된다. ‘여주인공’이라는 단어를 지명 ‘여주’라고 판단하거나, ‘너구리’라는 단어를 지명 ‘구리’로 판단해 검출되는 것을 예로 들 수 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (11)

  1. J. Yim and B. Hwang, "Twitter Based Realtime Event-Location Detector," KIPS Transactions on Software and Data Engineering, Vol.4, No.8, pp.301-308, 2015. 

  2. R. Li, K. H. Lei, R. Khadiwala, and K. Chang, "TEDAS: a Twitter Based Event Detection and Analysis System," Proc. of the IEEE 28th International Conference on Data Engineering, pp.1273-1276, 2012. 

  3. X. Zhou and L. Chen, "Event Detection over Twitter Social Media Streams," The VLDB Journal, Vol.23, No.3, pp.381-400, 2014. 

  4. J. Shin and C. Ock, "A Stage Transition Model for Korean Part-of-Speech and Homograph Tagging," Journal of KIISE : Software and Applications, Vol.39, No.11, pp.889-901, 2012. 

  5. J. Hur and C. Ock, "A Homonym Disambiguation System based on Semantic Information Extracted from Dictionary Definitions," Journal of KIISE : Software and Applications, Vol.28, No.9, pp.688-698, 2001. 

  6. J. Yim, H. Ha, and B. Hwang, The Method for Removing Noises from Event Detection using Twitter," Proc. of KSII Fall Conference, pp.105-106, 2014. 

  7. S. Woo and B. Hwang, "Geographical Name Denoising by Machine Learning of Event Detection Based on Twitter," KIPS Transactions on Software and Data Engineering, Vol. 4, No.10, pp.447-454, 2015. 

  8. Twitter Streaming API [Internet], http://dev.twitter.com/docs/streaming-apis. 

  9. S. Lee, Lucean Korean Morph Analyzer [Internet], http://cafe.naver.com/korlucene. 

  10. Republic of Korea National Statistical Office, Population and Housing Census [Internet], http://www.kostat.go.kr. 

  11. Naver Breaking News [internet], http://news.naver.com/main/list.nhn?modeLSD&midsec&sid1001. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로