$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

기계 학습을 이용한 바이오 분야 학술 문헌에서의 관계 추출에 대한 실험적 연구
An Experimental Study on the Relation Extraction from Biomedical Abstracts using Machine Learning 원문보기

한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science, v.50 no.2, 2016년, pp.309 - 336  

최성필 (경기대학교 문헌정보학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 지지벡터기계(Support Vector Machines, SVM) 기반의 기계 학습 모듈을 활용하여 특정 문장 내에서의 두 개체 간의 관계를 자동으로 식별하고 분류하는 바이오 분야 관계 추출 시스템을 제안한다. 제안된 시스템의 특징은 개체를 포함하고 있는 문장 내에서 풍부한 언어 자질을 추출하여 학습에 활용함으로써 그 성능을 극대화할 수 있는 다양한 기능들을 포함하고 있다는 점이다. 제안된 시스템의 성능 측정을 위해서 전 세계적으로 많이 활용되고 있는 바이오 분야 관계 추출 표준 컬렉션 3가지를 활용하여 심층적인 실험을 수행한 결과 모든 컬렉션에서 높은 성능을 획득하여 그 우수성을 입증하였다. 결론적으로, 본 논문에서 수행한 바이오 분야 관계 추출에 대한 광범위하고 심층적인 실험 연구가 향후 기계학습 기반의 바이오 분야 텍스트 분석 연구에 많은 시사점을 제공할 것으로 보인다.

Abstract AI-Helper 아이콘AI-Helper

This paper introduces a relation extraction system that can be used in identifying and classifying semantic relations between biomedical entities in scientific texts using machine learning methods such as Support Vector Machines (SVM). The suggested system includes many useful functions capable of e...

주제어

질의응답

핵심어 질문 논문에서 추출한 답변
생물학적 심층 지식을 효율적으로 구축하기 위한 방법은 무엇입니까? 일반적으로 생의학 지식베이스란 객관적인 연구 성과로서 도출된 학술 정보(논문, 특허, 기술 보고서 등)에 출현한 다양한 전문 용어와 그들 간의 의미적 상관관계를 네트워크 형식으로 표현하고 있으며, 생명공학 관점에서는 단백질, 유전자, 세포 등의 생체적 요소 간의 역학관계 혹은 상호작용 등을 세밀하게 기술한 생물학적 심층 지식으로 볼 수 있다. 이러한 심층 지식을 효율적으로 구축하기 위해서는 텍스트 문헌을 기계적으로 분석하여 세포명, 화합물명, 질병, 약품, 치료법 등과 같은 핵심 용어들을 자동으로 추출하고, 이들 간의 의미적 연관 관계를 문헌 내에 기술된 정보를 바탕으로 식별하는 바이오 텍스트 마이닝(Bio Text Mining) 및 정보 추출(Information Extraction) 기술이 필수적이다(Li, Liakata and Rebholz-Schuhmann 2014).
일반적으로 생의학 지식베이스란 무엇을 표현합니까? 일반적으로 생의학 지식베이스란 객관적인 연구 성과로서 도출된 학술 정보(논문, 특허, 기술 보고서 등)에 출현한 다양한 전문 용어와 그들 간의 의미적 상관관계를 네트워크 형식으로 표현하고 있으며, 생명공학 관점에서는 단백질, 유전자, 세포 등의 생체적 요소 간의 역학관계 혹은 상호작용 등을 세밀하게 기술한 생물학적 심층 지식으로 볼 수 있다. 이러한 심층 지식을 효율적으로 구축하기 위해서는 텍스트 문헌을 기계적으로 분석하여 세포명, 화합물명, 질병, 약품, 치료법 등과 같은 핵심 용어들을 자동으로 추출하고, 이들 간의 의미적 연관 관계를 문헌 내에 기술된 정보를 바탕으로 식별하는 바이오 텍스트 마이닝(Bio Text Mining) 및 정보 추출(Information Extraction) 기술이 필수적이다(Li, Liakata and Rebholz-Schuhmann 2014).
기계학습 및 통계적 기법의 특징은 무엇입니까? 마지막으로 기계학습 및 통계적 기법은 가장 최근에 도래한 기법으로서, 지도학습(supervised learning) 혹은 반지도 학습(semi-supervised learning) 기반의 기계학습 모델을 적용하여, 미리 수작업으로 구성된 학습 집합을 기반으로 관계 및 상호작용을 표현하는 핵심 단서인 자질 집합을 자동으로 추출하고 이를 학습에 적용한다. 확장성 및 효율성 측면에서 가장 높은 성능을 나타내고 있으며, 지금까지도 연구가 활발하게 진행되고 있다(Andrade and Valencia 1998; Bunescu et al.
질의응답 정보가 도움이 되었나요?

참고문헌 (25)

  1. Airola, A. et al. 2008. "All-Paths Graph Kernel for Protein-Protein Interaction Extraction with Evaluation of Cross-Corpus Learning." BMC Bioinformatics, 9(11): 1-12. 

  2. Ananiadou, S., Kell, D. B. and Tsujii, J. 2006. "Text Mining and Its Potential Applications in Systems Biology." Trends in Biotechnology, 24(12): 571-579. 

  3. Ananiadou, S. et al. 2010. "Event Extraction for Systems Biology by Text Mining the Literature." Trends in Biotechnology, 28(7): 381-390. 

  4. Andrade, M. A. and Valencia, A. 1998. "Automatic Extraction of Keywords from Scientific Text: Application to the Knowledge Domain of Protein Families." Bioinformatics, 14(7): 600-607. 

  5. Blaschke, C., Hirschman, L. and Valencia, A. 2002. "Information Extraction in Molecular Biology." Briefings in Bioinformatics, 3(2): 154-165. 

  6. Bunescu, R. et al. 2005. "Comparative Experiments on Learning Information Extractors for Proteins and Their Interactions." Artificial Intelligence in Medicine, 33(2): 139-155. 

  7. Chang, C. C. and Lin, C. J. 2011. "LIBSVM: A Library for Support Vector Machines." ACM Transactions on Intelligent Systems and Technology, 2(3): 1-39. 

  8. Choi, S. P. et al. 2014. "An Intensive Case Study on Kernel-based Relation Extraction." Multimedia Tools and Applications, 71(2): 741-767. 

  9. Choi, S. P. and Myaeng, S. H. 2010. "Simplicity Is Better: Revisiting Single Kernel PPI Extraction." In Proceedings of the 23rd International Conference on Computational Linguistics, August 23rd-27th, 2010, Beijing: Beijing International Convention Center: 206-214. 

  10. Craven, M. and Kumlien, J. 1999. "Constructing Biological Knowledge Bases by Extracting Information from Text Sources." In Proceedings of the 7th International Conference on Intelligent Systems for Molecular Biology, August 6th-10th, 1999, Heidelbrg: Kongresshaus Stadthalle: 77-86. 

  11. Fan, R. E. et al. 2008. "LIBLINEAR: A Library for Large Linear Classification." Journal of Machine Learning Research, 9: 1871-1874. 

  12. Fundel, K., Kuffner, R. and Zimmer, R. 2007. "RelEx - Relation Extraction Using Dependency Parse Trees." Bioinformatics, 23(3): 365-371. 

  13. Li, C., Liakata, M. and Rebholz-Schuhmann, D. 2014. "Biological Network Extraction from Scientific Literature: State of the Art and Challenges." Briefings in Bioinformatics, 15(5): 856-877. 

  14. Manning, C. D. et al. 2014. "The Stanford CoreNLP Natural Language Processing Toolkit." In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations, June 22nd-27th, 2014, Baltimore, MD: 55-60. 

  15. Miller, G. A. 1995. "WordNet: A Lexical Database for English." Communications of the ACM, 38(11): 39-41. 

  16. Miwa, M. et al. 2009. "Protein-Protein Interaction Extraction by Leveraging Multiple Kernels and Parsers." International Journal of Medical Informatics, 78(12): e39-e46. 

  17. Ono, T. et al. 2001. "Automated Extraction of Information on Protein-Protein Interactions from the Biological Literature." Bioinformatics, 17(2): 155-161. 

  18. Papanikolaou, N. et al. 2014. "Protein-Protein Interaction Predictions Using Text Mining Methods." Methods, 74: 47-53. 

  19. Wikipedia. 2016. San Francisco, CA: Wikimedia Foundation.. s.v. "Protein-Protein Interaction." [online] 

  20. Pyysalo, S. et al. 2008. "Comparative Analysis of Five Protein-Protein Interaction Corpora." BMC Bioinformatics, 9(3): 1-11. 

  21. Pyysalo, S. et al. 2007. "BioInfer: A Corpus for Information Extraction in the Biomedical Domain." BMC Bioinformatics, 8(1): 50-73. 

  22. Rosario, B. and Hearst, M. A. 2004. "Classifying Semantic Relations in Bioscience Texts." In Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics, July 21st-26th, 2004, Barcelona: Forum Convention Centre: 430-437. 

  23. Sekimizu, T., Park, H. S. and Tsujii, J. 1998. "Identifying the Interaction between Genes and Gene Products Based on Frequently Seen Verbs in Medline Abstracts." Genome Informatics, 9: 62-71. 

  24. Temkin, J. M. and Gilder, M. R. 2003. "Extraction of Protein Interaction Information from Unstructured Text using a Context-Free Grammar." Bioinformatics, 19(16): 2046-2053. 

  25. Zhou, D. and He, Y. 2008. "Extracting Interactions Between Proteins from the Literature." Journal of Biomedical Informatics, 41(2): 393-407. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로