$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

생의학 분야 학술 문헌에서의 이벤트 추출을 위한 심층 학습 모델 구조 비교 분석 연구
A Comparative Study on Deep Learning Topology for Event Extraction from Biomedical Literature 원문보기

한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science, v.51 no.4, 2017년, pp.77 - 97  

김선우 (경기대학교 일반대학원 문헌정보학과) ,  유석종 (한국과학기술정보연구원 생명의료융합기술연구실) ,  이민호 (한국과학기술정보연구원 생명의료HPC연구센터) ,  최성필 (경기대학교 문헌정보학과)

초록
AI-Helper 아이콘AI-Helper

최근 생의학 분야의 학술 문헌이 기하급수적으로 급증함에 따라 관련 분야 연구자들은 선행 연구 및 연구 동향 파악에 어려움을 겪고 있다. 이에 효율적인 선행 연구 및 연구 동향 파악을 위한 정보 추출 기술이 요구되며, 학술 문헌의 정보 추출을 위한 개체인식 및 개체 간의 생의학 이벤트 추출 연구가 활발히 진행되고 있다. 본 연구는 이에 심층 학습(Deep Learning)의 기법 중 하나인 컨볼루션 네트워크(Convolutional Neural Networks, CNN) 모델을 기반으로 이벤트 내의 개체 유형 정보의 적용 위치와 함께, 이벤트 식별 및 분류를 고려하여 총 8가지의 모델을 구성하여 실험하였다. 실험 결과, 본 연구에서 제안하는 모델 중 최고성능을 보인 개체 유형 완전연결 모델이 이벤트 분류 실험에서 F-점수 72.09%의 높은 성능을 보였으나, 이벤트 추출 실험에서는 학습 컬렉션의 불균형 문제 및 이벤트 식별 모델의 성능 저조 등으로 인하여 F-점수 21.81%의 비교적 저조한 성능을 보였다.

Abstract AI-Helper 아이콘AI-Helper

A recent sharp increase of the biomedical literature causes researchers to struggle to grasp the current research trends and conduct creative studies based on the previous results. In order to alleviate their difficulties in keeping up with the latest scholarly trends, numerous attempts have been ma...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 생의학 이벤트를 추출하기 위해서는 학술 문헌 내에서 개체(단백질, 유전자, 질병명, 약물명, 기타 용어 등)를 자동으로 추출하고 이들 간의 상호 연관 관계를 추출하는 생의학 텍스트 마이닝(Biomedical text mining) 기술이 필요하다(이기헌, 허고은, 송민 2015). 본 논문에서는 생의학 이벤트 추출을 위해 심층 학습 기반의 다양한 토폴로지를 구성하고 비교 분석 하여, 적절한 토폴로지를 제시하는 것이다. 2장에서는 현재까지 연구된 다양한 생의학 정보 추출 기술을 소개하고, 3장에서는 그 중에서도 생의학 이벤트를 추출하기 위한 심층학습 기반의 모델 구조를 소개한다.
  • 본 연구에서 제안하는 모델은 학술 문헌 내의 개체 쌍을 기반으로 문장 정보를 입력하면 개체 간에 유의미한 이벤트가 있는지 식별하고, 있다면 어떤 유형의 이벤트인지를 분류하는 것을 목적으로 한다. 이에 대한 성능 향상을 위해본 연구에서는 컨볼루션 네트워크를 기반으로한 심층 학습 모델을 구성한다.
  • 본 연구에서는 이벤트 분류 모델의 실제적인 이벤트 분류 성능을 파악하기 위해, 유의미한 이벤트가 있는 개체 쌍에 대한 이벤트 분류 실험을 수행한다. 이벤트 분류 성능은 이벤트 추출 성능과 달리 유의미한 이벤트를 추출하는 식별 과정이 제외되고, 유의미한 이벤트가 이벤트 유형 중 어떤 이벤트에 해당하는지를 분류하는 성능이다.
  • 위 실험 이후, 이벤트 추출 구조에 있어 이벤트 분류 모델을 단독으로 사용하였을 때 오히려 성능이 좋게 나오는 점과 재현율이 정확률에 비해 성능이 높게 나오는 점 등을 통해, 이벤트 식별 모델의 성능이 저조하다는 것을 추론하였다. 이에 개체 유형 완전연결 분류 모델 자체의 이벤트 분류 성능 평가를 수행하기 위한 실험을 수행 하였다. 실험 집합이 공개되어 있지 않아, 유의미한 이벤트를 가진 개체 쌍만을 출력하기 어렵기 때문에, 본 실험은 검증 집합을 통해 이루어졌다.
  • 본 연구에서는 최근 텍스트 마이닝 및 정보 추출 분야에서 높은 성능을 보이는 심층 학습 기법 중 컨볼루션 네트워크 기반의 모델을 구성 하여 BioNLP-ST 2016 컬렉션을 중심으로 생의학 이벤트 추출 모델을 구성하였다. 특히, 기존 연구의 생의학 이벤트 추출 관련 방법론들을 참고하여 개체 유형을 중요 자질로 판단하고, 이를 컨볼루션 네트워크 기반의 심층 학습 모델에 구조적으로 어떻게 적용할 것인지에 대하여 중심적으로 연구하였다. 결과적으로, 개체 유형 적용 구조에 따른 모델 4종을 고안하였고, 각 구조의 모델 마다 이벤트 식별 및 분류 모델을 따로 구성하여 총 8종의 이벤트 추출 모델을 구축 하여 비교분석하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
효율적인 선행 연구 및 연구 동향 파악을 위한 정보 추출 기술이 요구되는 이유는 무엇인가? 최근 생의학 분야의 학술 문헌이 기하급수적으로 급증함에 따라 관련 분야 연구자들은 선행 연구 및 연구 동향 파악에 어려움을 겪고 있다. 이에 효율적인 선행 연구 및 연구 동향 파악을 위한 정보 추출 기술이 요구되며, 학술 문헌의 정보 추출을 위한 개체인식 및 개체 간의 생의학 이벤트 추출 연구가 활발히 진행되고 있다.
컨볼루션 네트워크란 무엇인가? 이에 효율적인 선행 연구 및 연구 동향 파악을 위한 정보 추출 기술이 요구되며, 학술 문헌의 정보 추출을 위한 개체인식 및 개체 간의 생의학 이벤트 추출 연구가 활발히 진행되고 있다. 본 연구는 이에 심층 학습(Deep Learning)의 기법 중 하나인 컨볼루션 네트워크(Convolutional Neural Networks, CNN) 모델을 기반으로 이벤트 내의 개체 유형 정보의 적용 위치와 함께, 이벤트 식별 및 분류를 고려하여 총 8가지의 모델을 구성하여 실험하였다. 실험 결과, 본 연구에서 제안하는 모델 중 최고성능을 보인 개체 유형 완전연결 모델이 이벤트 분류 실험에서 F-점수 72.
컨볼루션 네트워크 모델을 기반으로 한 8가지 모델 실험의 결과는 무엇인가? 본 연구는 이에 심층 학습(Deep Learning)의 기법 중 하나인 컨볼루션 네트워크(Convolutional Neural Networks, CNN) 모델을 기반으로 이벤트 내의 개체 유형 정보의 적용 위치와 함께, 이벤트 식별 및 분류를 고려하여 총 8가지의 모델을 구성하여 실험하였다. 실험 결과, 본 연구에서 제안하는 모델 중 최고성능을 보인 개체 유형 완전연결 모델이 이벤트 분류 실험에서 F-점수 72.09%의 높은 성능을 보였으나, 이벤트 추출 실험에서는 학습 컬렉션의 불균형 문제 및 이벤트 식별 모델의 성능 저조 등으로 인하여 F-점수 21.81%의 비교적 저조한 성능을 보였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. 김정균, 조혜진, 이현주. 2015. 생의학 문헌에서 질병 관련 정보를 추출하기 위한 텍스트 마이닝 기법. 정보과학회지, 33(4): 13-19. (Kim, Jeong kyun, Jo, Hye Jin and Lee, Hyeon Ju. 2015. "Text Mining Approaches to Extract Disease Information from Biomedical Articles." Communications of the Korean Institute of Information Scientists and Engineers, 33(4): 13-19.) 

  2. 김태현 외. 2002. 정보 추출을 위한 이벤트 문장 추출. 한국정보과학회 언어공학연구회 학술발표 논문집, 2002년 10월 11-12일, 청주: 충북대학교: 325-331. (Kim, Tae-Hyun. et al. 2002. Event Sentence Extraction for Information Extraction. In Proceedings of the 14th Annual Conference on Human and Cognitive Language Technology, October 11-12, 2002, Cheongju: Chungbuk National University: 325-331.) 

  3. 이기헌, 허고은, 송민. 2015. 생의학 텍스트 마이닝: 새로운 생의학 지식 발견 방법 연구 동향. 정보과학회지, 33(4): 30-38. (Lee, Keeheon, Heo, Go Eun and Song, Min. 2015. Biomedical Text Mining: A Trend in Biomedical Knowledge Discovery Based on Text Mining. Communications of the Korean Institute of Information Scientists and Engineers, 33(4): 30-38.) 

  4. Choi, S. 2016. "Extraction of Protein-Protein Interactions(PPIs) from the Literature by Deep Convolutional Neural Networks with Various Feature Embeddings." Sage Journal. 

  5. Huang, C. and Lu, Z. 2016. "Community Challenges in Biomedical Text Mining over 10 Years: Success, Failure and the Future." Briefings in Bioinformatics, 17(1): 132-144. 

  6. Kim, J. D., Wang, Y. and Yasunori, Y. 2013. "The Genia Event Extraction Shared Task, 2013 Edition-Overview." In Proceedings of the BioNLP Shared Task 2013 Workshop, 8-15. 

  7. Kim, J. D. et al. 2011. "Overview of Genia Event Task in BioNLP Shared Task 2011." In Proceedings of the BioNLP Shared Task 2011 Workshop, 7-15. 

  8. Li, C., Rao, Z. and Zhang, X. 2016. "LitWay, Discriminative Extraction for Different Bio-Events." In Proceedings of the 4th BioNLP Shared Task 2015 Workshop, 32-41. 

  9. Li, C. et al. 2015. "Using Word Embedding for Bio-event Extraction." ACL-IJCNLP, 2015: 121-126. 

  10. Li, F. et al. 2015. "Mapping Publication Trends and Identifying Hot Spots of Research on Internet Health Information Seeking Behavior: A Quantitative and Co-Word Biclustering Analysis." J Med Internet Res, 17(3). 

  11. Liu, X., Bordes, A., and Grandvalet, Y. 2015. "Extracting Biomedical Events from Pairs of Text Entities." BMC Bioinformatics, 16(10): 45-49. 

  12. Panyam N. C. et al. 2016. "SeeDev Binary Event Extraction using SVMs and a Rich Feature Set." In Proceedings of the 4th BioNLP Shared Task 2015 Workshop, 82-87. 

  13. Collobert, R. et al. 2011. "Natural Language Processing (Almost) from Scratch." Journal of Machine Learning Research, 12: 2493-2537. 

  14. Xia, J., Fang, A. C. and Zhang, X. 2014. "A Novel Feature Selection Strategy for Enhanced Biomedical Event Extraction Using the Turku System." BioMed Research International, 2014. 

  15. Stanford CS231n. 2017. Convolutional Neural Networks for Visual Recognition. Stanford University CS Class. [online] [cited 2017. 10. 9.] 

  16. GENIA. 2017. The 4th BioNLP Shared Task 2016. The BioNLP Shared Task. [online] [cited 2017. 10. 9.] 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로