희귀 유전 질병.원인 유전자.데이터 마이닝.엑솜 시퀀싱.표현형 데이터.유전형 데이터.데이터베이스.파이프라인 시스템.통합 분석 시스템.rare-genetic-disease.causal variant.data mining.whole exome sequencing.phenotypic data.genetic data.database.pipeline system.integrative analysis system.
연구과제 타임라인 ▼
과제명
희귀질환의 원인 유전자 발견을 위한 엑솜 시퀀싱 데이터의 가공, 분석 및 통합 프로파일링 기법에 관한 연구
과제기간
2015 ~ 2016
총연구비 ...
과제명
희귀질환의 원인 유전자 발견을 위한 엑솜 시퀀싱 데이터의 가공, 분석 및 통합 프로파일링 기법에 관한 연구
과제기간
2015 ~ 2016
총연구비
200,000,000원
연구과제 성과물(0)
참여연구원의 다른 문헌(0)
초록 ▼
ㅇ 연구의 목적 및 내용 희귀 질병의 원인 유전자 발견은 희귀 유전 질병뿐 아니라 일반 복합질병의 기전 이해에 중요한 단서가 된다. 본 연구에서는 질병 원인 변이 추출을 위한 엑솜 시퀀싱 데이터를 이용한 데이터마이닝 알고리즘과 ...
ㅇ 연구의 목적 및 내용 희귀 질병의 원인 유전자 발견은 희귀 유전 질병뿐 아니라 일반 복합질병의 기전 이해에 중요한 단서가 된다. 본 연구에서는 질병 원인 변이 추출을 위한 엑솜 시퀀싱 데이터를 이용한 데이터마이닝 알고리즘과 파이프라인 시스템을 개발하였다. 또한 본 연구에서는 전문 큐레이션에 의한 표현형-유전형 데이터를 담은 질병 특이적 지식베이스를 구축하였다. 1차년도에는 WES 데이터 잡음 보정 전처리 기법 개발 및 상세 표현형-유전형 정보 수집을 주요 연구 내용으로 한다. 2차년도에는 WES 기반의 변이 추출 기법 개발 및 질병원인 변이/유전자 발견 모듈 개발을 주요 연구 내용으로 한다. 3차년도에는 통합 원인 유전자 분석/프로파일링 시스템 개발 및 시스템 평가를 주요 연구 내용으로 한다.
ㅇ 연구결과 1) 1차년도: - 엑솜 데이터 수집 및 특성 분석 - 엑솜 데이터의 잡음 보정을 위한 통계적 가공, 정규화 기법 개발 - WES 기반의 변이 추출 기법 개발(SNP, indel 추출 모듈 개발) - PhenoToGeno KDB 개발을 위한 데이터 수집 및 정제(PhenoToGeno KDB Ver. 1 개발) - 실적: 국내 전문 학술 논문지 1편 게재, 학술대회 논문 발표 3편 2) 2차년도: - WES 기반의 변이 추출 기법 개발(컨트롤을 사용하지 않는 CNV 추출 기법 개발) - 원인 유전자 분석 파이프라인의 기본 모듈 개발 - PhenoToGeno KDB 개발 및 성능 평가(퇴행성뇌질환을 대상으로 하는 KDB 사례개발) - PhenoToGeno KDB의 성능 평가(Meta-GSEA 기법 사용) - 실적: SCI 논문 1편(IF: 0.889) 게재, 국제 학술대회 논문 발표 3편 3) 3차년도: - 통합 원인 유전자 분석/프로파일링 시스템 개발 - 발견된 원인 유전자, 질병 연관성의 유효성 검증 기법 개발 - 통합 원인 유전자 분석 시스템 및 지식베이스 평가 및 공개/활용 - 실적: SCI 논문 2편(IF: 7.072, 2.476) 게재, 국제 학술대회 논문 발표 3편, 국내 학술대회 논문발표 2건, 국내 특허 출원 1건(10-2017-0025113)
ㅇ 연구결과의 활용계획 1) 본 연구에서 개발되는 엑솜 시퀀싱 데이터 분석 알고리즘과 프로파일링 시스템은 생물정보학 분야에서 그 학문적/실용적 가치를 인정받을 수 있다. 2) 개발 완료된 질병 원인 유전자 분석 파이프라인은 일반 연구자에게 공개되어 질병 원인 유전자 발견 연구에 활용 가능하며, 결과적으로 희귀 유전 질병의 기전 이해, 진단 및 예방법 개발에 기여하게 된다. 3) 퇴행성 뇌질환을 대상으로 하는 PhenoToGeno 지식베이스는 퇴행성 뇌질환 연구자를 위한 귀중한 자료로 활용될 수 있을 뿐 아니라, 지식베이스 개발 노하우는 타 분야 질병을 대상으로 하는 지식베이스 개발에 직접 활용될 수 있다. 4) 학제간 연구 교류의 성과가 있으며, 생명공학과 컴퓨터공학 관련 전문 지식을 모두 겸비한 전문 인력을 양성한다.
(출처 : 한글요약문 4p)
Abstract ▼
ㅇ Purpose & contents The discovery of rare-disease-causing genes provides insights into the biological mechanisms underlying ra...
ㅇ Purpose & contents The discovery of rare-disease-causing genes provides insights into the biological mechanisms underlying rare diseases, and into complex and common diseases. In this research, we developed data mining algorithms and pipeline system to identify disease-causal variants in whole exome sequencing (WES) data. We also built a disease-specific knowledge-base system to integrate carefully curated and annotated phenotypic and genetic data sets. 1) The first year: exome sequencing data collection and feature analysis; development of a statistical normalization method for noise reduction; development of WES-based variation detection algorithms; data collection and cleaning for PhenoToGeno KDB. 2) The second year: development of a control free CNV algorithm; development of the component modules for the pipeline system; development and validation of the PhenoToGeno KDB system 3) The third year: integrated system development; a validation system for discovered variants-gene-phenotype relationship; system evaluation and open
ㅇ Result 1) The first year: - Software: exome coverage data normalization method, WES-based variation detection algorithms. - Publication: 1 domestic journal paper, 3 domestic conference papers 2) The second year: - Software: control free CNV algorithm, component modules for the pipeline system, PhenoToGeno KDB system - Publication: 1 SCI journal paper (IF: 0.889), 3 international conference papers 3) The third year: - Software: control free CNV algorithm, component modules for the pipeline system, PhenoToGeno KDB system - Publication: 2 SCI journal papers (IF: 7.072, 2.476), 3 international conference papers, 2 domestic conference papers, 1 patent application
ㅇ Expected Contribution 1) The exome data analysis algorithms and a profiling system which are developed from this study deserve the scientific value in each related field. 2) The pipeline system could be used in the field of drug development, diagnosis, and treatment for rare Medelian disease. 3) The research results will support the R&D of the relevant researchers by providing a feasible and practical disease-specific PhenoToGene knowledge-base system. 4) The research results activate the studies on life sciences and bioinformatics, and thus give a help to increase the international competitiveness in these areas. Also, this research produces experts in both computer science and life science.
희귀질환의 원인 유전자 발견을 위한 엑솜 시퀀싱 데이터의 가공, 분석 및 통합 프로파일링 기법에 관한 연구
연구책임자(Manager) :
윤지희
과제기간(DetailSeriesProject) :
2015 ~ 2016
총연구비 (DetailSeriesProject) :
200,000,000원
키워드(keyword) :
희귀 유전 질병,원인 유전자,데이터 마이닝,엑솜 시퀀싱,표현형 데이터,유전형 데이터,데이터베이스,파이프라인
과제수행기간(LeadAgency) :
한림대학교
연구목표(Goal) :
대부분의 질병은 하나 이상의 유전자 변이 발생에 그 발병 원인이 있는 것으로 알려져 있다. 희귀 질병의 원인 유전자 발견은 희귀 유전 질병뿐 아니라 일반 복합질병의 기전 이해에 중요한 단서가 된다. 본 연구에서는 질병 원인 변이 추출을 위한 엑솜 시퀀싱 데이터를 이용한 데이터마이닝 알고리즘과 파이프라인 시스템을 개발한다. 또한 본 연구에서는 전문 큐레이션에...
연구내용(Abstract) :
1) 1차년도: WES 데이터 잡음 보정 전처리 기법 개발 및 상세 표현형-유전형 정보 수집 - 엑솜 데이터 수집/특성 분석 - 엑솜 데이터의 잡음 보정을 위한 통계적 가공, 정규화 기법 개발 - WES 기반의 변이 추출 기법 개발 (SNP, indel 추출 모듈 개발) - PhenoToGeno KDB 개발을 위한 데이터 수집/정제 2) 2차년도: WES...
기대효과(Effect) :
1) 본 연구에서 개발되는 엑솜 시퀀싱 데이터 분석 알고리즘과 프로파일링 시스템은 생물정보학 분야에서 그 학문적/실용적 가치를 인정받을 수 있다. 2) 개발 완료된 질병 원인 유전자 분석 파이프라인은 일반 연구자에게 공개되어 질병 원인 유전자 발견 연구에 활용 가능하며, 결과적으로 희귀 유전 질병의 기전 이해, 진단 및 예방법 개발에 기여하게 된다. 3) ...