$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

유저 모델과 실시간 뉴스 스트림을 사용한 트윗 개체 링킹
Entity Linking For Tweets Using User Model and Real-time News Stream 원문보기

인지과학 = Korean journal of cognitive science, v.26 no.4, 2015년, pp.435 - 452  

정소윤 (서강대학교 컴퓨터공학과) ,  박영민 (서강대학교 컴퓨터공학과) ,  강상우 (서강대학교 컴퓨터공학과) ,  서정연 (서강대학교 컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

최근 개체 링킹에 대한 연구들은 지식 베이스를 외부 자원으로 사용하여 실세계의 지식과 의미적인 관련도를 통해 중의성을 해소하는데 중점을 두고 있다. 지식 베이스를 사용한 개체 링킹은 신문기사나 블로그 포스트 등에서는 좋은 성능을 보이지만, 마이크로블로그에서는 짧은 텍스트 길이와 지식 베이스에 존재하지 않는 주제를 다루는 특성 때문에 비교적 낮은 성능을 보인다. 본 논문에서는 140자가 되지 않는 짧은 텍스트 내에서 실시간으로 빠르게 정보를 공유하는 특성을 가지는 마이크로블로그에서 나타나는 개체명의 중의성을 해소하는 방법을 제안한다. 제안하는 방법은 지식 베이스만 사용하는 개체 링킹의 한계를 극복하기 위해 마이크로블로그 사용자 기록과 뉴스 기사를 이용하고, 지식 베이스에 존재하는 특정 엔트리로 개체 링킹을 수행한다. 본 논문에서는 개체명을 포함하는 한국어 트윗을 추출하여 데이터를 구축하였다. 성능 평가는 정확도 지표(시스템이 정답으로 판정한 데이터 개수/전체 데이터 개수)를 사용하였으며, 제안하는 시스템은 구축한 데이터에서 기존 지식 베이스만 사용한 개체 링킹 시스템보다 높은 67.7%의 정확도를 나타내었다.

Abstract AI-Helper 아이콘AI-Helper

Recent researches on Entity Linking(EL) have attempted to disambiguate entities by using a knowledge base to handle the semantic relatedness and up-to-date information. However, EL for tweets using a knowledge base is still unsatisfactory, mainly because the tweet data are mostly composed of short a...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 3가지 스코어링 모델인 문맥 모델, 유저 모델 그리고 이슈 모델을 통합하는 링킹 모델로 이루어진 개체 링킹 시스템을 제안하였다. Charton, E.
  • , 2014). 본 논문에서는 실시간으로 일어나는 사건들에 대한 소통이 많이 이루어지는 트윗의 특성을 고려하여 기존 연구에서 사용되지 않았던 뉴스 기사를 외부 자원으로 사용함으로써 트윗 개체 링킹의 성능을향상시킨다.
  • 본 논문에서는 지식 베이스 뿐 만 아니라, 이슈 모델링과 유저 모델링을 통해 트윗에서의 개체 링킹을 제안한다. 본 논문의 구성은 다음과 같다.

가설 설정

  • 신문 기사 속 작은따옴표는 이름 표시 기능을 가지는데, 요컨대 이름 표시를 할 때는 신문사마다 약간의 차이가 있으나, 책 이름, 영화 이름, 음반 이름, 드라마 이름 등이 작은따옴표로 묶일 수 있다(이동혁, 2008). 그러므로 개체 생성 모듈은 뉴스 기사의 작은따옴표로 명시된 용어들을 의미 있는 개체명이라 가정하고, 모두 링크로 생성한다. 개체 생성 모듈은 링크 생성 규칙에 따라 각 기사 마다 링크를 생성하고, 표 1은 개체 생성규칙과 그림 5의 예제에서 개체가 생성된 예제를 보여준다.
  • 유저 모델은 이러한 특성을 이해하여 사용자의 행동과 관심분야를 다루기 위해 사용자의 이전 트윗 기록을 모두 사용한다. 이 때, 사용자의 이전 트윗에서 나타나는 개체명들에 대해 사용자는 관심과 흥미를 가지고 있다고 가정한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
개체 링킹은 어떠한 작업인가? 정보 추출의 한 분야인 개체명 인식과, 인식된 개체명을 특정 개체에 링킹하는 연구들은 방대한 정보 속에서 의미 있는 지식을 추출하기 위해 활발히 시도되고 있다. 개체 링킹(EntityLinking)은 텍스트에 출현한 개체명을 위키피디아와 같은 지식 베이스의 특정 엔트리1)에 대응시키는 작업이다.
트윗의 특성은 무엇인가? 예를 들면 대표적인 마이크로블로그 서비스 중 트윗에서의 연구가 활발하다. 트윗은 사용자들이 실시간으로 140자 이내의 트윗이라는 글을 쓰는 행위를 통해 의사소통하는 공간이며 트윗은 개인의 관심 분야나 일상생활, 사회적 이슈 등의 주제에 대해 실시간으로 빠르게 전파되는 특성을 지닌다(Java, A. et al.
짧고 비정형적인 텍스트 내에서의 개체 링킹에 대한 연구 중 해외의 대표적인 예는 무엇인가? 최근에는 신문 기사와 같은 정형화된 텍스트 내에서의 개체 링킹 뿐 만 아니라,짧고 비정형적인 텍스트 내에서의 개체 링킹에 대한 연구가 해외에서 활발히 진행되고 있다. 예를 들면 대표적인 마이크로블로그 서비스 중 트윗에서의 연구가 활발하다. 트윗은 사용자들이 실시간으로 140자 이내의 트윗이라는 글을 쓰는 행위를 통해 의사소통하는 공간이며 트윗은 개인의 관심 분야나 일상생활, 사회적 이슈 등의 주제에 대해 실시간으로 빠르게 전파되는 특성을 지닌다(Java, A.
질의응답 정보가 도움이 되었나요?

참고문헌 (14)

  1. 김영식, 함영균, 김지성, 황도삼, 최기선 (2014). 한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소, 제26회 한글 및 한국어 정보처리 학술대회 논문집, 100-106. 

  2. 이동혁 (2008). 신문기사 속 작은따옴표의 기능. 우리말연구, (23), 139-162. 

  3. Bansal, R., Panem, S., Gupta, M. & Varma, V. (2014). EDIUM: Improving Entity Disambiguation via User Modeling. Journal of Advances in Information Retrieval, 8416, 418-423. 

  4. Bunescu, R. C. & Pasca, M. (2006). Using Encyclopedic Knowledge for Named entity Disambiguation. Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics, 6, 9-16. 

  5. Charton, E., Meurs, M. J., Jean-Louis, L. & Gagnon, M. (2014). Mutual Disambiguation for Entity Linking. Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics, 476-481. 

  6. Cucerzan, S. (2007). Large-Scale Named Entity Disambiguation Based on Wikipedia Data. Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, 7, 708-716. 

  7. Derczynski, L., Maynard, D., Rizzo, G., van Erp, M., Gorrell, G., Troncy, R.,Bontcheva, K. (2015). Analysis of named entity recognition and linking for tweets. Journal of Information Processing and Management 51, 32-49 

  8. Java, A., Song, X., Finin, T. & Tseng, B. (2007). Why We Twitter: Understanding Microblogging Usage and Communities. Proceedings of the 9th WebKDD and 1st SNA-KDD workshop on Web mining and social network analysis, 56-65. 

  9. Shen, W., Wang, J., Luo, P. & Wang, M. (2013). Linking Named Entities in Tweets with Knowledge Base via User Interest Modeling. Proceedings of the 19th SIGKDD international conference on Knowledge Discovery and Data mining, 68-76. 

  10. Kang, S., Kim, H., Kang, H. K. & Seo, J. (2014). Lightweight morphological analysis model for smart home applications based on natural language interfaces. International Journal of Distributed Sensor Networks, 2014, 1-9. 

  11. Liu, X., Zhang, S., Wei, F. & Zhou, M. (2011). Recognizing Named Entities in Tweets. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, 1, 359-369. 

  12. Han, X. & Zhao, J. (2009). Named Entity Disambiguation by Leveraging Wikipedia Semantic Knowledge. Proceedings of the 18th Conference on Information and Knowledge Management, 215-224. 

  13. Mihalcea, R. & Csomai, A. (2007). Wikify!: Linking Documents to Encyclopedic Knowledge. Proceedings of the 16th conference on Conference on Information and Knowledge Management, 233-242. 

  14. Milne, D. & Witten, I. H. (2008). Learning to Link with Wikipedia. Proceedings of the 18th Conference on Information and Knowledge Management, 215-224. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로