보고서 정보
주관연구기관 |
경기대학교 산학협력단 |
연구책임자 |
최성필
|
참여연구자 |
엄재혁
,
최가람
,
이계원
,
조현양
,
이정찬
,
이용운
,
최경호
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2015-09 |
주관부처 |
미래창조과학부 KA |
사업 관리 기관 |
한국과학기술정보연구원 Korea Institute of Science and Technology Information |
등록번호 |
TRKO201600000547 |
DB 구축일자 |
2016-04-16
|
키워드 |
정보추출,개체명 인식,관계추출,기계학습,딥러닝,텍스트 마이닝Information Extraction,Named-Entity Recognition,Relation Extractionn,Machine Learning,Deep Learning,Text Mining
|
초록
▼
- 치매 질환 중심의 생의학 분야 언어 자원 수집 및 통합
= 개체명 인식 및 관계 추출을 위한 바이오 분야 대용량 언어 자원 수집 및 통합(MeSH,UniProt,UMLS,PubMed ,LLL,Biolnfer,HPRD50,AIMed,12B2,Five PPI Corpora 등)
= 수집된 언어 자원의 효율적인 활용을 위한 자원 검색 및 저장 시스템 개발
- 치매 유관 분야 핵심 개체 자동 인식 및 식별 기술 개발
= Deep Learning을 이용한 생의학 분야 개체명 인식 시스템 기술확보(FFNN,CNN4SE
- 치매 질환 중심의 생의학 분야 언어 자원 수집 및 통합
= 개체명 인식 및 관계 추출을 위한 바이오 분야 대용량 언어 자원 수집 및 통합(MeSH,UniProt,UMLS,PubMed ,LLL,Biolnfer,HPRD50,AIMed,12B2,Five PPI Corpora 등)
= 수집된 언어 자원의 효율적인 활용을 위한 자원 검색 및 저장 시스템 개발
- 치매 유관 분야 핵심 개체 자동 인식 및 식별 기술 개발
= Deep Learning을 이용한 생의학 분야 개체명 인식 시스템 기술확보(FFNN,CNN4SEQ,RNN,LSTM RNN 기반 인식 모델 개발) 및 성능 검증
= 단백질,유전자,질병 명칭 등의 효율적인 인식 및 식별을 위한 사전 기반 개체명 인식 시스템 개발
- 치매 유관 분야 핵심 개체 간 의미적 연관 관계 자동 추출 엔진 개발
= 실용화 수준의 커널 기반 관계 추출 엔진 기술 확보 (관계 종류 20개 이상 처리 가능)
= 다양한 학습 및 검증 컬렉션을 통해 세계 최고 성능 수준 확인
= 치매 분야 관계 추출 학습 집합 반자동 구축을 위한 워크플로우 기술 확보
- 지속 가능한 성능 최적화 지원 플랫폼 개발
= 개체명 인식 및 관계 추출의 성능 최적화 기반 기술 확보 (학습 모델에 대한 매개변수 및 자질 추출 방법별 성능 최적화 기능 구현)
= 생의학 분야 학술 정보의 정보 추출 결과에 대한 가시화 기술 개발
Abstract
▼
IV. Result of the study
○ Divisions
Collection and Integration of biomedical Iinguistic resources related to dementia
○ Objectives
•Integration of more than 10 linguistic resources including Alzheimer's Disease Ontology(ADO)
•Collection of various ontologies for constructing relation
IV. Result of the study
○ Divisions
Collection and Integration of biomedical Iinguistic resources related to dementia
○ Objectives
•Integration of more than 10 linguistic resources including Alzheimer's Disease Ontology(ADO)
•Collection of various ontologies for constructing relation extraction pattern-base
○ Result of the Study
•Collection and Integration of PudMed , ADO, BioInfer,BioText, UMLS,UniProt,i2b2 VA REL,GENIA,LLL,HPR50,AIMed and BioGRID as well as development of resource managing system
•Development of relation pattern extraction system and construction of pattern-base consisting of about 12,000 Iinguistic expression from BioText,BioInfer and i2b2 collections based on syntactic analysis
100%
○ Divisions
Research on the dementia-related named-entity recognition
○ Objectives
•Dictionary and Approximate Matching based Named-Entity Recognition System
○ Result of the Study
•Development of biomedical named-entity recognition system based on various Deep Learning models (FFNN ,RNN ,CNN ,LSTM CRF)
•Development of biomedical named-entity recognition and identification system using dictionary based soft-matching methods based on UMLS,UniProt,SNOMED
100%
○ Divisions
Research on relation extraction system for biomedical domains
○ Objectives
•Achievement of World-Class Performance of Binary Relation Extraction
•Fundamental Study on Complex Relation Extraction
○ Result of the Study
•Achievement of world best performance on Relation Extraction using Complex Features( Relation ldentification :0.7367,Relation Classification :0.6820(BioText) ,0.7242(Biolnfer), 0.753 (i2b2))
•Development of semi-automatic collection construction model for relation extraction
100%
○ Divisions
Development of sustainable and efficient performance optimization system
○ Objectives
•Development of System Performance Optimizer and Domain Adaptation System
○ Result of the Study
•Automatic Relation lnstance Candidate Extraction System based on Distance Supervision using Alzheimer's Disease Terms
100%
목차 Contents
- 표지 ... 1
- 제출문 ... 3
- 보고서 요약서 ... 4
- 요약문 ... 5
- Summary ... 10
- Contents ... 14
- 목차 ... 15
- 표목차 ... 16
- 그림목차 ... 19
- 제1장 연구개발과제의 개요 ... 24
- 제1절 연구개발의 필요성 및 추진 배경 ... 24
- 제2절 연구개발의 최종 목표 ... 28
- 제2장 국내외 기술개발 현황 ... 30
- 제1절 생의학 분야 지식화 플랫폼 및 지식베이스 ... 30
- 제2절 생의학 분야 정보 추출 기술 ... 33
- 제3장 연구개발수행 내용 및 결과 ... 39
- 제1절 치매 질환 중심의 생의학 분야 언어 자원 수집 및 통합 ... 39
- 제2절 치매 유관 분야 핵심 개체 자동 인식 및 식별 기술 개발 ... 60
- 제3절 치매 유관 분야 핵심 개체 간 의미적 연관 관계 자동 추출엔진 개발 ... 76
- 제4절 지속 가능한 성능 최적화 지원 플랫폼 개발 ... 123
- 제4장 목표달성도 및 관련분야에의 기여도 ... 128
- 제1절 세부 업무별 연구개발 목표 및 달성도 ... 128
- 제2절 연구 실적 도출 상황 ... 129
- 제3절 관련 분야에서의 기여도 ... 130
- 제5장 연구개발결과의 활용계획 ... 131
- 제6장 연구개발과정에서 수집한 해외과학기술정보 ... 133
- 1. MeSH (Medical Subject Headings) 사전 분석 및 변환 ... 133
- 2. UniProt (Universal Protein Resource) 통합 사전 분석 및 변환 ... 133
- 3. UMLS (Unified Medical Language System) 확보 ... 133
- 4. BioText 관계 추출용 학습 집합 분석/변환 ... 134
- 5. BioInfer 관계 추출용 학습 집합 분석 및 변환 ... 136
- 6. i2b2/VA REL 진료 기록 내 관계 추출용 학습 집합 분석 및 변환 ... 139
- 7. PubMed 데이터베이스 ... 139
- 8. Stanford POS tagger ... 139
- 9. CUDA ... 142
- 참고문헌 ... 144
- 부록 1 본 연구 사업에 대한 전문가 평가 의견 ... 151
- 부록 2 Alzheimer Disease 분야 개체 간 관계 문장포함 문장 집합 예제 ... 154
- 부록 3 Alzheimer Disease 분야 관련 용어집 ... 162
- 부록 4 추출된 관계 표현 패턴 집합 표본 (총 42,045개) ... 167
- 끝페이지 ... 173
※ AI-Helper는 부적절한 답변을 할 수 있습니다.