보고서 정보
주관연구기관 |
가톨릭대학교 Catholic University of Korea |
연구책임자 |
유희주
|
참여연구자 |
김경휘
,
김현숙
,
문정환
,
박성희
,
박종택
,
박지향
,
배성환
,
그외 다수
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2015-02 |
과제시작연도 |
2013 |
주관부처 |
농촌진흥청 |
사업 관리 기관 |
농촌진흥청 Rural Development Administration |
등록번호 |
TRKO201500010165 |
과제고유번호 |
1395031487 |
DB 구축일자 |
2015-07-11
|
초록
▼
Ⅳ. 연구개발결과
1. NGS sequencing
454 GS-FLX Plus, Illumina HiSeq, 그리고 PacBio RSII를 사용하여 whole genome shotgun sequencing 및 BAC-end sequencing을 통해 총 136.5 Gb의 유전체 서열 데이터를 생산했다. 이는 전 유전체의 약 267배에 해당한다. BAC 클론의 경우 PCR을 통해 탐색 유전자를 포함하는 196개 BAC 클론을 sequencing하고 서열을 조립했다. BAC-end sequencing의 경우, 총 23,040
Ⅳ. 연구개발결과
1. NGS sequencing
454 GS-FLX Plus, Illumina HiSeq, 그리고 PacBio RSII를 사용하여 whole genome shotgun sequencing 및 BAC-end sequencing을 통해 총 136.5 Gb의 유전체 서열 데이터를 생산했다. 이는 전 유전체의 약 267배에 해당한다. BAC 클론의 경우 PCR을 통해 탐색 유전자를 포함하는 196개 BAC 클론을 sequencing하고 서열을 조립했다. BAC-end sequencing의 경우, 총 23,040개 클론에 대한 양 말단 서열을 생산했다. Transcriptome은 18개 조직 샘플로부터 총 293 Gb의 전사체 서열을 생산했다.
2. 염색체 세포 유전지도 작성
무 중기염색체는 9쌍이며 평균 길이는 21.33 ㎛ 이었고 rDNA는 염색체 1, 2, 5 번에 존재하였다. Flow cytometry를 통해 무 유전체의 크기는 약 554.212 Mb로 계산되었다. 유전지도에 작성을 위해 FISH 분석을 실시하여, 각 염색체당 최소 1개의 BAC 클론이 연관되도록 했다
3. 무 매핑 집단의 제작 및 표준유전지도 작성
무 유전체 분석을 위한 기준 재료로서 WK10039와 WK10024를 선발했다. 두 양친 계통을 교배한 후 F2 집단을 제작하고 F2 집단 중 다형성이 높은 93개체를 선발, 매핑집단을 작성했다. F2 매핑집단에 대한 유전체 재분석을 수행한 결과, 총 591 Gb에 해당하는 염기서열을 생산했으며 read depth는 평균 13X였다. 이로부터 high-quality SNP 772,678개, 1,039개의 InDel, 13,072개의 SSR을 발굴하였다. 이들 분자표지들을 이용하여 총 1,000개의 non-redundant 분자표지로 이루어진 길이 1,538 cM의 유전지도를 작성하였다.
4.. 배추과 유전체 translational genomics 기반 구축
배추과 conserved ortholog set(COS)을 발굴하기 위해 배추, 양배추, 그리고 애기장대의 전체 유전체 서열을 기준으로 1,202개의 COS 후보 유전자를 선발했다. 152개 COS에 대해 프라이머를 작성하여 다양한 배추과 식물에 적용한 결과, SNP 발굴 및 InDel 개발에 적합한 것으로 예측되었다. 비교 유전체 분석을 위해 COS-SNP 무 유전지도를 작성하고 분석을 실시한 결과, 무 genome도 배추와 유사하게 3배수화된 유전체 구조를 가지고 있음이 확인되었고, 무와 배추의 genome의 유사성이 매우 높은 부분이 유전체 내에 block 형태로 존재하는 것이 밝혀졌다.
5. 무 유용형질관련 유전 매핑
애기장대 정보를 이용하여 개화 관련된 331개의 무 유전자를 동정하고 개화 관련 유전자 좌위로 이루어진 길이 667.9 cM의 유전지도를 작성하였다. 또한 배추 유전체 정보를 이용하여 glucosinolate 생합성 및 조절 유전자 74개 및 병 저항성에 관련되는 NBS-LRR 유전자의 241개의 유전자를 확인하고, 무 염색체 별로 존재 양상을 분석하였다.
6. 통합 유전지도(integrated genetic map) 작성
본 연구에서 개발되어진 유전체 서열을 중심으로 한 PCR기반 분자표지 118개와 322개의 COS, 그리고 일본에서 개발된 EST-SNP와 EST-SSR 분자표지 매핑으로 얻어진 348개의 EST 분자표지(JEST)를 통합하여 762개의 분자표지가 포함된 길이 740 cM의 유전지도를 작성했다.
7. 무 표준유전체 어셈블리 및 특성 분성
K-mer 빈도를 이용하여 WK10039의 유전체 크기를 510.8 Mb로 계산했다. 생산된 서열의 어셈블리 결과 크기 426Mb, gap은 55Mb인 표준유전체가 제작되었다. 27개의 BAC 클론과 서열과 비교한 결과 표준유전체 서열을 평균 94.2% 수준으로 커버하였다. 무 표준유전체 중 35.6%가 반복서열로 탐색되었다. 유전자의 경우, ab initio 유전자 모델과 evidence-based 유전자 모델은 통합하여 46,514개의 유전자 모델을 예측했다. 전체 유전자 모델 중 90%에 해당하는 41,866개의 유전자 주석을 결정했다. 비교유전체 분석 결과, 무 유전체는 뚜렷한 전유전체 3배수화 양상을 나타냈다. 무 유전체의 paralog 유전자들 간의 Ks를 분석한 결과, 무유전체는 배추와 양배추 같은 Brassica 속 작물과 같은 시기(Ks mode=0.3)에 전유전체 3배수화가 일어났음을 확인했다. 무-배추, 무-양배추 간의 ortholog 유전자에 대한 Ks 분석 결과, 무는 유전체는 3배수화 직후(Ks mode=0.2) Brassica 속 식물과 종분화한 것으로 나타났다.
8. 세포소기관 유전체 서열 분석
엽록체 및 미토콘드리아 서열은 전유전체 NGS 서열에서 배추 엽록체 및 미토콘드리아 DNA에 매핑되는 서열을 선별한 후 조립하여 153,368 bp의 무 엽록체 및 244,054 bp 무미토콘드리아 유전체를 완성했다. 엽록체 서열에서 SSR 91개를 동정했고, 무 엽록체 서열을 다른 배추과 식물과 비교 분석한 결과 배추 및 양배추와 매우 유사한 것으로 나타났다.
9. 무 발현유전체 분석
18개 조직의 RNA-sequencing read들을 유전자 모델에 매핑한 후 DeSeq 프로그램을 이용하여 표준화 및 차등발현 유전자 분석을 수행한 결과, 무 뿌리 발달 단계에서 차등발현되는 유전자 4,397개를 발굴하였다. 이 중 발현이 증가하는 것과 감소하는 것의 2개의 그룹으로 분리하여 clustering 분석을 수행하였다.
10. 무 표준유전체 정보의 가시화
무 표준유전체/전사체 가시화를 위해 UCSC Genome Browser(http://genome.ucsc.edu)를 로컬 서버에 설치하고, 이를 이용하여 무의 표준유전체, 유전자, 반복서열, 재분석, 전사체 정보, 후성유전체 정보, 유전지도 및 분자표지 정보 등의 다양한 정보를 웹 환경에서 검색할 수 있는 웹 데이터베이스 시스템을 개발했다. 완성된 형태의 포털사이트는,radish-genome.org를 통해 공개하였다.
Abstract
▼
Raphanus sativus L. is a member of tribe Brassiceae in the Brassicaceae family. It includes an annual root vegetable crop species (radish) as well as its diverse wild relatives. Assessment of the R. sativus genome provides fundamental resources for crop improvement as well as the study of crop genom
Raphanus sativus L. is a member of tribe Brassiceae in the Brassicaceae family. It includes an annual root vegetable crop species (radish) as well as its diverse wild relatives. Assessment of the R. sativus genome provides fundamental resources for crop improvement as well as the study of crop genome structure and evolution. Here we report a draft genome sequence of Korean cultivar, WK10039 (2n=18). The genome size of WK10039 was estimated to be 510 Mb by K-mer analysis and flow cytometry. We sequenced the genome using a combination of NGS platforms (454 GS-FLX Plus), Illumina HiSeq, and PacBio RSII). Assembly of the sequence reads successfully generated nine chromosome pseudomolecules spanning 344 Mb and 82 Mb of additional unique scaffold sequences, collectively covering 84% of the genome. In addition, 244 kb of the mitochondria and 153 kb of chloroplast DNAs were also assembled. Genome annotation identified that 36% of the genome are repetitive sequences whereas 46,514 protein-coding genes were predicted from the sequences. Synteny comparison of the R. sativus genome with those of Arabidopsis thaliana and Brassica rapa showed that the R. sativus genome has evident triplicated sub-genome blocks and the structure of gene space is highly similar to that of B. rapa. The genome information developed in this study is available through a web database at radish-genome.org
With the goal of anchoring genome sequence assemblies of R. sativus cv. WK10039 whose genome has been sequenced onto the chromosomes, we developed a reference genetic map based on genotyping of two parents (maternal WK10039 and paternal WK10024) and 93 individuals of the F2 mapping population by whole-genome resequencing.
To develop high-confidence genetic markers, ~83 Gb of parental lines and ~591 Gb of mapping population data were generated as Illumina 100 bp paired-end reads. High stringent sequence analysis of the reads mapped to the 344 Mb of genome sequence scaffolds identified a total of 16,282 SNPs and 150 PCR-based markers. Using a subset of the markers, a high-density genetic map was constructed from the analysis of 2,637 markers spanning 1,538 cM with 1,000 unique framework loci. The genetic markers integrated 295 Mb of genome sequences to the cytogenetically defined chromosome arms. The comparative analysis of radish genome was performed using a conserved ortholog set (COS) of Brassica. COS is a collection of genes that are conserved in both sequence and copy number between closely related genomes. COS is a useful resource for developing gene-based markers and is suitable for comparative genome mapping. We developed a COS for Brassica based on proteome comparisons of Arabidopsis thaliana, B. rapa, and B. oleracea to establish a basis for comparative genome analysis of crop species in the Brassicaceae. A total of 1,194 conserved orthologous single-copy genes were identified from the genomes based on whole-genome BLASTP analysis. Gene ontology analysis showed that most of them encoded proteins with unknown function and chloroplast-related genes were enriched. In addition, 152 Brassica COS primer sets were applied to 16 crop and wild species of the Brassicaceae and 57.9-92.8 % of them were successfully amplified across the species representing that a Brassica COS can be used as diagnostic cross-species markers of diverse Brassica species. We constructed a genetic map of Raphanus sativus by analyzing the segregation of 322 COS genes. Comparative genome analysis based on the COS genes showed conserved genome structures between R. sativus and B. rapa with lineage-specific rearrangement and fractionation of triplicated subgenome blocks indicating close evolutionary relationship and differentiation of the genomes.
To facilitate molecular breeding in radish, we generated an integrated genetic map of radish. The EST-SSR and EST-SNP markers in Japanese radish were mapped to radish WK10039 reference sequences. Genotypes of EST-SSR and EST-SNP were determined by SNP genotypes of mapped contigs. Together with mapped EST markers, the markers used in the radish reference map and COS map were used for constructing the integrated map. As a result, the integrated map was 740 cM in length and 113 PCR-based, 316 COS, and 333 mapped EST markers were linked on the map.Also, using information from Arabidopsis and B. rapa, genes involved in flowering time, glucosinolage biosynthesis, and disease resistance were identified in radish genome. In summary, we generated a reference genetic map and draft genome of radish. We performed comparative analysis of radish genome using COS genes and revealed triplicated nature and evolution of radish genome. The draft genome, genetic maps, and molecular markers developed in this study will serve as fundamental genomic resources for biology as well as genomic toolbox for breeding of radish.
목차 Contents
- 완결과제 최종보고서 ... 1
- 제출문 ... 2
- 요약문 ... 3
- SUMMARY ... 7
- 목 차 ... 9
- 제 1 장 서 론 ... 10
- 제1절 연구개발의 필요성 ... 10
- 제2절 연구개발의 목적 ... 11
- 제 2 장 국내외 기술개발 현황 ... 13
- 제1절 국내 연구 현황 ... 13
- 제2절 국외 연구 현황 ... 15
- 제3절 국내외 연구현황 비교 및 필요 연구 분야 ... 16
- 제 3 장 연구개발수행 내용 및 결과 ... 17
- 제1절 무 유전체 매핑 ... 17
- 제2절 무 유전체 해독 ... 55
- 제3절 무 유전체 어셈블리 제작 및 정보분석 ... 72
- 제4절 적요 ... 89
- 제 4 장 연구개발목표 달성도 및 대외기여도 ... 91
- 제1절 연구목표대비 대외 달성도 ... 91
- 제2절 정량적 성과 ... 92
- 제 5 장 연구개발결과의 활용계획 ... 100
- 제1절 추가연구의 필요성 ... 100
- 제2절 타 연구에의 응용 ... 100
- 제3절 현재 추진 중인 추가 성과 ... 101
- 제 6 장 연구개발과정에서 수집한 해외과학기술정보 ... 102
- 제 7 장 기타 중요 변동사항 ... 103
- 제 8 장 국가과학기술종합정보시스템에 등록한 연구장비 현황 ... 104
- 제 9 장 참고문헌 ... 105
- 끝페이지 ... 110
※ AI-Helper는 부적절한 답변을 할 수 있습니다.