$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

개체 링킹을 위한 RDF 지식그래프 기반의 포괄적 상호의존성 짝 연결 접근법
A Global-Interdependence Pairwise Approach to Entity Linking Using RDF Knowledge Graph 원문보기

정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.8 no.3, 2019년, pp.129 - 136  

심용선 (서울대학교 치의과학과) ,  양성권 (서울대학교 의료정보학과) ,  김홍기 (서울대학교 치의과학과)

초록
AI-Helper 아이콘AI-Helper

자연어 표현에는 인물, 조직, 장소, 제품 등의 다양한 개체들이 존재한다. 이러한 개체는 다양한 의미를 가질 수 있다. 이러한 개체가 갖는 중의성 문제는 자연어 처리 분야에 있어 매우 도전적인 과제이다. 개체 링킹(Entity Linking)이란 텍스트에 등장한 개체명지식베이스 내의 적절한 개체로 연결해주는 작업이다. 개체 링킹을 위한 대표적인 방법론인 짝 연결 접근법(Pairwise based method)은 한 문장에서 등장한 개체가 두 개 이상일 경우 서로의 연관성을 이용해 개체 링킹을 하는 방법이다. 이 방법은 동일 문장에서 등장하는 개체들 간의 상호의존성(interdependence)만을 고려하고 있어 포괄적인 상호의존성(Global interdependence)이 부족하다는 한계를 갖고 있다. 본 논문에서는 개체 링킹을 위해 RDF 형태의 지식베이스 정보를 바탕으로 Word2vec을 활용한 Entity2vec 모델을 생성하였다. 그리고 생성된 모델을 사용하여 각 개체에 대한 랭킹을 하였다. 본 논문에서는 짝 연결 접근법의 한계점을 보완하기 위해 포괄적인 상호의존성을 바탕으로 짝 연결 접근법을 고안하고 구현 및 실험을 통해 기존의 짝 연결 접근법과 비교하였다.

Abstract AI-Helper 아이콘AI-Helper

There are a variety of entities in natural language such as people, organizations, places, and products. These entities can have many various meanings. The ambiguity of entity is a very challenging task in the field of natural language processing. Entity Linking(EL) is the task of linking the entity...

주제어

표/그림 (10)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 그러나 본 예제질문에서 사용된 ‘소나무’는 나무 ‘소나무’를 의미하기 때문에 잘못 연결이 됐다 할 수 있다. 본 논문에서는 이러한 전통적인 짝 연결 접근법의 한계점을 보완하기 위해 포괄적인 상호의존성을 바탕으로 짝 연결 접근법을 고안하고 구현 및 실험을 통해 전통적인 짝 연결 접근법과 비교하였다.
  • 구축된 조합을 대상으로 각 후보군에서 추출된 후보 간의 코사인 유사도를 계산한 뒤 평균을 구한다. 본 논문에서는 전통적인 짝 연결 접근법과 달리 조합 전체의 유사도를 사용함으로써 포괄적인 상호의존성을 바탕으로 개체 중의성을 해소하여 하였다. 포괄적인 상호의존성을 바탕으로 제시하는 짝 연결 접근법의 알고리즘 수식은 (1)과 같다.
  • 본 논문에서는 포괄적인 상호의존성 바탕의 짝 연결 접근법을 사용하여 전통적인 짝 연결 접근법의 한계점을 극복하고자 하였다. 그리고 포괄적인 상호의존성의 개념을 차용한 개별화된 페이지 랭크 알고리즘(Personalized Pagerank Algorithm)과 본 논문에서 제시하는 알고리즘을 비교하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
개체 링킹은 어떠한 분야에 활용되고 있는가? 개체 링킹(Entity Linking)이란 텍스트에 등장한 개체를 지식베이스 내의 적절한 개체로 연결해주는 작업이다[1]. 이러한 개체 링킹은 질의응답 시스템, 정보추출 시스템 등의 분야에 활용되고 있다. 예를 들어 ‘영화 레옹에서 마틸다 역할은 내털리 포트먼인가요?’라는 질문에서 사용된 ‘레옹’은 영화 ‘레옹’을 의미한다.
개체 링킹이란? 이러한 개체가 갖는 중의성 문제는 자연어 처리 분야에 있어 매우 도전적인 과제이다. 개체 링킹(Entity Linking)이란 텍스트에 등장한 개체명을 지식베이스 내의 적절한 개체로 연결해주는 작업이다. 개체 링킹을 위한 대표적인 방법론인 짝 연결 접근법(Pairwise based method)은 한 문장에서 등장한 개체가 두 개 이상일 경우 서로의 연관성을 이용해 개체 링킹을 하는 방법이다.
짝 연결 접근법은 어떠한 한계가 있는가? 개체 링킹을 위한 대표적인 방법론인 짝 연결 접근법(Pairwise based method)은 한 문장에서 등장한 개체가 두 개 이상일 경우 서로의 연관성을 이용해 개체 링킹을 하는 방법이다. 이 방법은 동일 문장에서 등장하는 개체들 간의 상호의존성(interdependence)만을 고려하고 있어 포괄적인 상호의존성(Global interdependence)이 부족하다는 한계를 갖고 있다. 본 논문에서는 개체 링킹을 위해 RDF 형태의 지식베이스 정보를 바탕으로 Word2vec을 활용한 Entity2vec 모델을 생성하였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (21)

  1. Kulkarni, S., Singh, A., Ramakrishnan, G., and Chakrabarti, S., "Collective annotation of Wikipedia entities in web text," in Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining, ACM, pp.457-466, June, 2009. 

  2. Mikolov, T., Chen, K., Corrado, G., and Dean, J. "Efficient estimation of word representations in vector space," arXiv preprint arXiv:1301.3781., 2013. 

  3. Page, L., Brin, S., Motwani, R., and Winograd, T., "The PageRank citation ranking: Bringing order to the web," Stanford InfoLab, 1999. 

  4. Bunescu, R. and Pasca, M., "Using encyclopedic knowledge for named entity disambiguation," in 11th conference of the European Chapter of the Association for Computational Linguistics, 2006. 

  5. Cucerzan, S., Large-scale named entity disambiguation based on Wikipedia data. in Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP-CoNLL), 2007. 

  6. Dredze, M., McNamee, P., Rao, D., Gerber, A., and Finin, T., "Entity disambiguation for knowledge base population," in Proceedings of the 23rd International Conference on Computational Linguistics, Association for Computational Linguistics, pp.277-285, Aug. 2010. 

  7. Fader, A., Soderland, S., Etzioni, O., and Center, T., "Scaling Wikipedia-based named entity disambiguation to arbitrary web text," in Proceedings of the IJCAI Workshop on User-contributed Knowledge and Artificial Intelligence: An Evolving Synergy, Pasadena, CA, USA, pp.21-26, Jan. 2009. 

  8. Milne, D. and Witten, I. H., "Learning to link with wikipedia," in Proceedings of the 17th ACM conference on Information and knowledge management, ACM, pp.509-518, Oct. 2008. 

  9. Medelyan, O., Witten, I. H., and Milne, D., "Topic indexing with Wikipedia," in Proceedings of the AAAI WikiAI Workshop, Vol.1, pp.19-24, Jul. 2008. 

  10. SeoHyun Kim, YoungDuk Seo, and Doo-Kwon Baik, "Tweet Entity Linking Method based on User Similarity for Entity Disambiguation," Journal of KIISE, Vol.43, No.9, pp.1043-1051, 2016. 

  11. Zwicklbauer, S., Seifert, C., and Granitzer, M, "DoSeR-a knowledge-base-agnostic framework for entity disambiguation using semantic embeddings," in International Semantic Web Conference, Springer, Cham, pp.182-198, May 2016. 

  12. Wousung Won, Jongseong Woo, Jiseong Kim, YoungGyun Hahm, and Key-Sun Choi, "Linking Korean Predicates to Knowledge Base Properties," Journal of KIISE, Vol.42, No.12, pp.1568-1574, 2015. 

  13. Yamada, I., Shindo, H., Takeda, H., and Takefuji, Y., "Joint learning of the embedding of words and entities for named entity disambiguation," arXiv preprint arXiv:1601.01343., 2016. 

  14. Ganea, O. E. and Hofmann, T. "Deep joint entity disambiguation with local neural attention," arXiv preprint arXiv:1704.04920., 2017. 

  15. Hokyung Lee., Jaehyuun An., Jeongmin Yoon., Kyoungman Bae., and Youngjoong Ko., "A Method to Solve the Entity Linking Ambiguity and NIL Entity Recognition for efficient Entity Linking based on Wikipedia," Journal of KIISE, Vol.44, No.8, pp.813-821, 2017. 

  16. In-Su Kang, "An Effect of Semantic Relatedness on Entity Disambiguation: Using Korean Wikipedia," Journal of Korean Institute of Intelligent Systems. Vol.25, No.2, pp.111-118, 2015. 

  17. Miller, E. "An introduction to the resource description framework," Bulletin of the American Society for Information Science and Technology, Vol.25, No.1, pp.15-19, 1998. 

  18. Saltlux's Adam Platform [internet], http://adams.ai/. 

  19. Deep Learning for Java [internet], https://deeplearning4j.org/ 

  20. Dubey, M., Banerjee, D., Chaudhuri, D., and Lehmann, J., "EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs," arXiv preprint arXiv:1801.03825., 2018. 

  21. Goyal, P. and Ferrara, E. "Graph embedding techniques, applications, and performance: A survey," Knowledge-Based Systems, Vol.151, pp.78-94, 2018. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로