최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science, v.51 no.4, 2017년, pp.227 - 248
강슬기 (경기대학교 일반대학원 문헌정보학과) , 최윤수 (한국과학기술정보연구원 생명의료융합기술연구실) , 최성필 (경기대학교 문헌정보학과)
This paper introduces an integrated model for systematically constructing a linguistic resource database that can be used by machine learning-based biomedical information extraction systems. The proposed method suggests an orderly process of collecting and constructing dictionaries and training sets...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
자연어 처리 기술의 특징? | 2006). 비정형 텍스트에서 핵심 개체를 인식하고 추출하기 위한 자연어 처리 기술은 주로 규칙 기반 접근법과 통계 기반 접근법을 통해 이루어져 왔으며, 최근에는 기계학습 방법 중 하나인 딥 러닝 기술에 기반 한 자연어처리 연구가 활발히 진행되고 있다(이혜진, 김재웅 2017). | |
데이터 검증 대상에서 제외하고,개체명 사전을 통해 구축한 학습 데이터만을 대상으로 검증 과정을 실시한 이유는? | 본 연구에서 구축된 학습 데이터는 구축과정에서 활용된 수집 자원의 유형에 따라 개체명 사전을 통해 구축한 학습 데이터와 코퍼스 자원을 통해 구축한 학습 데이터로 구분할 수 있다. 코퍼스 자원을 통해 구축한 학습 데이터의 경우 수집된 코퍼스 자원이 구축 기관의 검증 과정을 거쳐 배포되고 있고 이미 다양한 연구에서 활용되고 있기 때문에 데이터 검증 대상에서 제외하고,개체명 사전을 통해 구축한 학습 데이터만을 대상으로 검증 과정을 실시하였다. 데이터 검증은 유관 분야의 논문 초록을 수집하고, 수집된 데이터를 대상으로 학습 데이터에 존재하는 개체명을 검색하는 개체명 완전 일치 방법을 통해 수행되었다. | |
유관분야 연구는 KAIST의 자연어 처리 연구실에서 소규모로 진행되고 있는 상황인 이유는? | 대표적인 예로 한의약 분야에서는 한의학 학술 문헌에 대한 딥 러닝 기반 자연어 처리 과정을 도입하여 한약진흥재단에서 인공지능을 활용한 한의임상정보학 포럼을 갖는 등 언어처리에 대한 연구가 활발히 진행되고 있다. 그러나 생의학 분야의 경우, 사회적 관심과 정부 주도의 연구 개발 투자에도 불구하고 바이오 분야 심층 지식베이스의 구축 및 연계, 활용 분야에 적극적인 지원 및 투자가 이루어지지 않고 있다. 따라서 유관분야 연구는 KAIST의 자연어 처리 연구실에서 소규모로 진행되고 있는 상황이다. |
송영길, 정석원, 김학수. 2015. 위키피디아 기반 개체명 사전 반자동 구축 방법. 정보과학회논문지, 42(11): 1397-1403. (Song, Y., Jeong, S. and Kim, H. 2015. "(A)Semi-automatic Construction method of a Named Entity Dictionary Based on Wikipedia." Journal of KIISE, 42(11): 1397-1403.)
이혜진, 김재웅. 2017. 자연어 처리 기술 현황 및 표준화 동향에 관한 연구. 한국통신학회 학술대회 논문집, 2017년 6월 21일, 제주: 라마다 프라자 제주 호텔: 876-877. (Lee, H. and Kim, J. 2017. "A Study on the Natural Language Processing(NLP) Technical and Standardization Trend." Proceedings of Symposium of the Korean Institute of communications and Information Sciences, June 21, Jeju: Ramada Plaza Jeju Hotel: 876-877.)
Ananiadou, S., Kell, D. B. and Tsujii, J. 2006. "Text Mining and Its Potential Applications in Systems Biology." Trends in Biotechnology, 24(12): 571-579.
Beuning, P. and Musier-Forsyth, K. 1999. "Transfer RNA Recognition by Aminoacyl-tRNA Synthetases." Biopolymers, 52(1): 1-28.
Biomedical Informatics Lab at ASU. 2017. Arizona Disease Corpus. [online] [cited 2017. 6. 1.]
Choi, S. 2016. "Extraction of Protein-Protein Interactions (PPIs) from the Literature by Deep Convolutional Neural Networks with Various Feature Embeddings." Sage Journals, 2016.
Comparative Toxicogenomics Database. 2017. Gene vocabulary. [online] [cited 2017. 4. 27.]
DrugBank. 2017. COMPLETE DATABASE: All drugs. [online] [cited 2017. 4. 27.]
Fraunhofer Institute for Algorithms and Scientific Computing SCAI. 2017. Silver Standard Corpus for Protein Protein and Drug Drug Interaction. [online] [cited 2017. 6. 2.]
GENIA: The BioNLP Shared Task 2016. 2017. The BioNLP Shared Task. [online] [cited 2017. 10. 9.]
Huang, C. and Lu, Z. 2016. "Community Challenges in Biomedical Text Mining over 10 years: Success, Failure and the Future." Briefings in Bioinformatics, 17(1): 132-144.
HUGO Gene Nomenclature Committee. 2017. Complete HGNC Dataset. [online] [cited 2017. 4. 27.]
Jensen, L. J., Saric, J. and Bork, P. 2006. "Literature Mining for the Biologist: from Information Retrieval to Biological Discovery." Nature Reviews Genetics, 7(2): 119-129.
Kim, J., Wang, Y. and Yasunori, Y. 2013. "The Genia Event Extraction Shared Task, 2013 Edition-Overview." In Proceedings of the BioNLP Shared Task 2013 Workshop, August 9, 2013, Sofia: Association for Computational Linguistics.
National Center for Biotechnology Information. 2017. PubMed. [online] [cited 2017. 6. 11.]
National Institutes of Health. 2017. Genetic Association Database. [online] [cited 2017. 6. 1.]
Natural Language Toolkit. 2017. Natural Language Processing with Python. [online] [cited 2017. 7. 29.]
The National Centre for Text Mining. 2016. Text Mining Resources. [online] [cited 2017. 9. 17.]
The University of Pittsburgh Pharmacokinetic Drug-drug Interation (PK DDI) Package Insert Corpus. 2017. Download the PK-DDI corpus with consensus annotations. [online] [cited 2017. 6. 20.]
tagtog. 2017. LocText. [online] [cited 2017. 6. 2.]
Thomas, P et al. 2012. "Weakly labeled corpora as silver standard for drug-drug and protein-protein interaction." In Proceedings of the Workshop on Building and Evaluating Resources for Biomedical Text Mining (BioTxtM) on Language Resources and Evaluation Conference (LREC), 2012. Istanbul, Turkey.
Tripathi, V. et al. 2010. "The Nuclear-Retained Noncoding RNA MALAT1 Regulates Alternative Splicing by Modulating SR Splicing Factor Phosphorylation." Molecular Cell, 39(6): 925-938.
UniProt. 2017. Uniprot data. [online] [cited 2017. 4. 27.]
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.