보고서 정보
주관연구기관 |
한양대학교 HanYang University |
연구책임자 |
남진우
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2016-06 |
과제시작연도 |
2015 |
주관부처 |
미래창조과학부 Ministry of Science, ICT and Future Planning |
등록번호 |
TRKO201700010285 |
과제고유번호 |
1711023787 |
사업명 |
신진연구자지원 |
DB 구축일자 |
2017-10-12
|
키워드 |
차세대 유전체.전산 유전체학.차세대 서열 데이터.유전자 동정.유전자 특성 분석.long noncoding RNA.Genomics.computational genetics.NGS data.gene annotation.gene characterization.
|
DOI |
https://doi.org/10.23000/TRKO201700010285 |
초록
▼
연구의 목적 및 내용
본 연구에서는 long noncoding RNA (lncRNA) 연구를 위한 다음의 다섯 가지 중요 연구목표를 설정함. 목표 1. 다양한 차세대 유전체/전사체 정보를 이용하여, mRNA의 조각과 구별되는 독립 전사체를 정확히 동정할 수 있는 개선된 ab initio 전사체 재구성 알고리즘 개발. 목표 2. 다양한 차세대 유전체/전사체 정보 기반의, 인간을 포함한 포유류 lncRNA의 comprehensive annotation 시스템 개발. 목표 3. 동정된 lncRNA가 실제 “noncoding” 임을
연구의 목적 및 내용
본 연구에서는 long noncoding RNA (lncRNA) 연구를 위한 다음의 다섯 가지 중요 연구목표를 설정함. 목표 1. 다양한 차세대 유전체/전사체 정보를 이용하여, mRNA의 조각과 구별되는 독립 전사체를 정확히 동정할 수 있는 개선된 ab initio 전사체 재구성 알고리즘 개발. 목표 2. 다양한 차세대 유전체/전사체 정보 기반의, 인간을 포함한 포유류 lncRNA의 comprehensive annotation 시스템 개발. 목표 3. 동정된 lncRNA가 실제 “noncoding” 임을 검증 할 수 있는 전산학적, 실험적 방법 개발. 목표 4. 자궁경부암 및 식도암 특이적 lncRNA 검출. 목표 5. lncRNA 서열, 구조 정보를 포함한 knockout library 구축.
연구결과
1차년도: 포유류 lncRNA annotation 시스템 개발
Human (hg19) 와 Mouse (mm9) 주요 세포주의 RNA-seq, CAGE-seq, PolyA-seq, Ribosome profiling 데이터를 우선적으로 컴파일함. 새로운 전산학적 coding potential 측정 방법 개발 및 Multimodal NGS 데이터를 이용한 lncRNA annotation 시스템 (CASOL)을 개발함.
2차년도: 정확한 lncRNA 동정 및 암 관련 lncRNA의 동정
Vega 데이터베이스에서 단백질 코딩 유전자, lncRNA, 그리고 ncRNA 중 이미 알려지거나 새로 알려진 유전자만 걸러냄. 그 후 lncRNA와 ncRNA는 단백질 코딩 유전자와 엑손이 겹치지 않는 것만을 따로 모음. 모든 유전자는 사용하는 RNA-seq에서 발현량이 0.3 이상이며, 이소체가 존재할 경우 가장 긴 이소체만을 선택하여 최종적으로 품질이 아주 좋은 유전자 주석 정보를 생성함.
또한 UPF1 연관성 연구를 위해, 각 lncRNA 전사물과 같은 길이를 가지는 UTR 조각을 무작위적으로 선택하여 한 쌍으로 이루어진 주석 데이터를 생성함. 이후 이 유전자 집합을 가지고 RPS를 이용한 lncRNA 분류자 개발, UPF1을 이용한 분류자 개발 및 정확한 포유류 lncRNA를 동정함.
3차년도: lncRNA knockout library 개발
개발된 lncRNA 주석 시스템과 lncRNA 분류자를 통해 정확하게 동정 된 lncRNA를 대상으로 기능 주석에 초점을 맞추고자 함. 발현 분석(expression profiling)을 통한 lncRNAs 기능을 유추하기 위해 데이터베이스인 ENCODE 와 NCBI GEO 에서 여러 세포의 RNA-seq 데이터를 이용해 다양한 세포 타입에서 발현의 특징을 보이는 lncRNA를 조사함. lncRNAs의 기능적으로 중요한 부분인 conserved domains을 동정하고 알려진 RNA family (Rfam) motifs의 존재여부를 확인함. 또한 모든 sgRNA를 조사하여 lncRNA 기능연구를 위한 knockout library 시스템 구축.
연구결과의 활용계획
본 연구로 인한 직접적 기대효과로, 현재 전체 lncRNA community에서 mRNA fragment 이거나 non-coding이 아님에도 lncRNA로 오판하여 사용되고 있는 문제점을 개선하고 lncRNA annotation의 질적, 양적 개선을 가져올 것임. 새롭게 동정된 인간을 포함한 포유류 lncRNA는 RNA 연구 community에 귀중한 resource로서 사용될 수 있어 국내 lncRNA 연구활성화를 위한 기폭제 역할을 할 것임. 응용분야에서의 직접적 기대효과로 암 관련 lncRNA는 암, 줄기세포 진단 마커로서 사용될 수 있으며, 더 나아가 암 및 질병 치료의 target 분자로 이용 될 수 있음. lncRNA의 동정은 간접적으로 인간 유전체의 더 깊은 기능적인 이해를 제공하며, 암 유전체 변이의 해석을 위한 중요한 연결고리로써 이용될 수 있음.
(출처 : 한글요약문 4p)
Abstract
▼
Purpose&contents
In this research proposal, I aim to address the following important problems in lncRNA studies: Aim 1. Development of an advanced ab initio transcriptome reconstruction algorithm to detect independent transcripts distinct from mRNA fragments using heterogenous next-generation seq
Purpose&contents
In this research proposal, I aim to address the following important problems in lncRNA studies: Aim 1. Development of an advanced ab initio transcriptome reconstruction algorithm to detect independent transcripts distinct from mRNA fragments using heterogenous next-generation sequencing data. Aim 2.
Comprehensive annotation of human and other mammalian lncRNAs using heterogenous next-generation sequencing data. Aim 3. Development of computational and experimental approaches to validate ‘non-coding’ of lncRNA. Aim 4. Identification of cervical and esophagus cancer-specific lncRNAs. Aim 5. Development of efficient sgRNAs targeting potentially functional regions of lncRNAs.
Result
First year: Development of lncRNA annotation system
RNA-seq, CAGE-seq, PolyA-seq and Ribosome profiling data of few major human and mouse cell lines were compiled. Based on the data, novel computational coding potential measurement was developed and further established as lncRNA annotation system using multimodal NGS data (CASOL).
Second year: Highly accurate annotation and identification of cancer-related lncRNAs High quality annotation data of lncRNAs were extrated from Vega database by comparing coordination information of adjacent genes. Theses genes were further filtered according to their expression levels and then used to develop lncRNA classifier based on ribosome phaseness score and UPF1 association. The resulting classifier successfully distinguished lncRNAs in mammalian cells.
Third year: Construction of lncRNA knockout library
lncRNA annotations and classifiers that were developed in our lab, Bioinformatics & Genomics laboratory, will be applied to study functional aspects of the lncRNAs. To annotate functional evidence about the revised lncRNAs, we assayed their expression signatures in different cell types using RNA-seq data from ENCODE and NCBI GEO (expression profiling). We also identified conserved domains seemed to have important biological function and examined whether RNA family (Rfam) motifs that are already known exist in the lncRNAs. Finally, we examined and designed sgRNAs to induce double strand breaks in target DNA. As a result, a knock-out library for research of lncRNAs’ functions had been developed.
Expected Contribution
From this project, we are currently expecting to overcome the problems rising from conventional knock-out method using homologous recombination or RNAi (RNA interference) and elucidate functions of newly identified lncRNAs and their biological meaning. At present, identification of new and many lncRNAs is on the road, but their functions and biological significance are largely known. Therefore, This project will boost up the study involving many, newly identified lncRNAs, including the ones that are currently suspected to be related with pathogenesis of many disease. Moreover, if the lncRNAs are confirmed to be involved in pathogenesis of diseases such as cancer, diagnostic markers or therapeutic targets can be developed or discovered ab initio. As in an aspect of study of pure science, deep understanding of human genome and better interpretation of mutations from cancer-related genes will be achieved.
(출처 : SUMMARY 5p)
목차 Contents
- 표지 ... 1목차 ... 2연구계획 요약문 ... 3연구결과 요약문 ... 4 한글요약문 ... 4 SUMMARY ... 5연구내용 및 결과 ... 6 1. 연구개발과제의 개요 ... 6 2. 국내외 기술개발 현황 ... 10 3. 연구수행 내용 및 결과 ... 13 4. 목표달성도 및 관련분야에의 기여도 ... 24 5. 연구결과의 활용계획 ... 25 6. 연구과정에서 수집한 해외 과학기술정보 ... 27 7. 참고문헌 ... 27 8. 연구성과 ... 30 9. 국가과학기술지식정보서비스에 등록한 연구시설‧장비 현황 ... 33 10. 연구개발과제 수행에 따른 연구실 등의 안전조치 이행실적 ... 33 11. 기타사항 ... 34끝페이지 ... 34
※ AI-Helper는 부적절한 답변을 할 수 있습니다.