무(Raphanus sativus L.)는 십자화과(Brassicaceae)에 속하는 근채 작물로서, 전세계적으로 경제적 가치가 매우 큰 채소 작물 중 하나이다. 무는 한국, 중국, 일본, 미국 등 여러 나라에서 유전체 해독, 병 저항성, 형질연관 분석 등 다양한 연구의 재료로 사용되고 있다. 한국 무 WK10039의 전체유전체는 2015년 염색체 수준으로 최초 해독되어 Rs1.0으로 보고되었다. Rs1.0은 454와 Illumina 서열을 중심으로 조립되었기 때문에 ...
무(Raphanus sativus L.)는 십자화과(Brassicaceae)에 속하는 근채 작물로서, 전세계적으로 경제적 가치가 매우 큰 채소 작물 중 하나이다. 무는 한국, 중국, 일본, 미국 등 여러 나라에서 유전체 해독, 병 저항성, 형질연관 분석 등 다양한 연구의 재료로 사용되고 있다. 한국 무 WK10039의 전체유전체는 2015년 염색체 수준으로 최초 해독되어 Rs1.0으로 보고되었다. Rs1.0은 454와 Illumina 서열을 중심으로 조립되었기 때문에 어셈블리의 길이가 짧고 공백서열(N bases)이 많으며 조립서열과 유전자 주석에 오류가 있어 그 완성도를 높일 필요가 있다. 따라서 본 연구에서는 완성도 높은 무의 고품질 표준유전체(Rs2.0)을 제작하고 유전체 특성을 규명하여 무 연구를 위한 유전체 기반을 강화하고자 하였다. 또한 근연종인 이배체 배추속 작물(배추, 양배추, 그리고 흑겨자)과 비교유전체 연구를 수행하여 무의 종 기원에 대한 진화유전체학적 근거를 제공하고자 하였다. 무 유전체 신규해독을 위해 장거리 서열과 염색체 구조 포착(Chromosome-conformation capture) 시퀀싱 서열에 기반을 둔 유전체 분석 전략을 사용하여 WK10039의 고품질 표준유전체 Rs2.0를 제작하였다. Rs2.0는 434.8 Mb 크기(공백 서열 제외 434.6 Mb)의 9개 염색체와 6,464개 스케폴드로 조립되었다. 조립 서열 중 165.8 Mb (38.1%)는 반복서열로서 4,845개의 RNA 유전자를 포함하고 있다. 유전자 주석 분석 수행 결과, 유전자 영역의 99.9% 이상을 포괄하는 52,768개의 단백질 암호화 유전자를 결정하였다. Rs2.0과 Rs1.0의 염색체 서열을 비교 분석 결과, Rs2.0의 9개 염색체에서 평균 5 Mb 크기의 동원체 영역을 새롭게 결정하였다. 모든 동원체 영역에는 동원체 특이적 반복서열(CentRs, CRB, CLs)과 완전한 구조의 OTA와 CRM Gypsy 레트로포존과 hAT-Ac, CMC-EnSpm, Helitron DNA 트랜스포손 등이 주로 존재했으며 이들의 분포 양상은 근연종인 배추와 양배추와 유사했다. 또한 동원체 영역에서 유전자의 발현량은 매우 낮은데 반해 DNA 메틸화 수준은 높았다. 이러한 결과들은 기존 Rs1.0에 비하여 Rs2.0의 조립 수준, 서열 연속성, 유전자 및 반복서열 주석 정보가 개선되었음을 나타낸다. 무의 유전체 구조와 3배수화 특성을 밝히기 위하여 Rs2.0 유전체 서열과 애기장대, 이배체 배추속 작물(배추, 양배추, 그리고 흑겨자)들의 유전체 서열을 비교 분석하였다. 무의 유전체는 이배체 배추속 작물과 같이 전유전체 3배수화 구조를 가지고 있으며 Brassica 공통조상의 9개 염색체가 재배열되어 있었다. 뿐만 아니라, Rs2.0는 Rs1.0에서 발견되지 않았거나 경계가 불분명했던 translocation Proto-Calepineae karyotype (tPCK) genome block들을 새롭게 정의하였다. 그 결과, 72개 tPCK block (24 block X 3)중 GMF2를 제외한 71개 block이 Rs2.0에 존재했다. GMF2는 Rs2.0뿐만 아니라 배추와 양배추 유전체에서도 발견되지 않아 GMF2결실이 무와 이배체 배추속 식물의 공유파생형질(synapomorphic trait)로 사료되었다. 이상의 유전체 구조 및 특성 분석 결과는 무가 Brassica 속으로부터 기원한 종이라는 가설을 지지하였다. R. sativus의 기원과 분화시기를 밝히기 위하여 무, 배추, 양배추, 흑겨자 그리고 애기장대에서 공통적으로 보존되어 있는 3,838개의 ortholog 유전자들 간의 동의치환율(synonymous substitution rate, Ks)을 분석하였다. 그 결과, 무는 흑겨자와 함께 배추/양배추 계통에서 11.3-12.1 Mya에 분화되었으며 이후 11.1 Mya에 무와 흑겨자가 분화된 것으로 계산되었다. 이상의 결과를 종합할 때, 무는 Brassica 속의 이배체 식물로부터 기원하였으며 11.1 Mya에 흑겨자로부터 분리되어 독립된 종으로 진화되었다고 사료되었다. 이때, 흑겨자에서 특이적으로 증폭된 Ale Copia 레트로포존은 두 종의 분화를 촉진시킨 것으로 추정되었다. 무 WK10039의 잎, 뿌리, 암술, 수술 등 4개 조직에서 유전자 발현과 메틸화 양상을 비교 분석하여 119개의 차등메틸화 영역을 발굴하였다. 또한 차등메틸화 영역에서 메틸화 양상과 유전자 발현 양상이 역상관 관계를 나타내며 뿌리 발달과 구조에 관여하는 유전자 14개를 선발하였다. 이 유전자들은 향후 무의 재배화 또는 유용 농업 형질에 대한 연구의 소재로 쓰일 수 있을 것이다. 본 논문을 통하여 해독한 무의 고품질 표준유전체 서열(Rs2.0)과 유전자 정보는 R. sativus 종의 기원과 분류에 대한 유전체 서열 수준의 기준을 제공하고 있다. 향후 전장유전체 연관연구(genome-wide association study)와 같은 염색체 수준의 분석에 Rs2.0은 정밀한 참조 표준유전체로 활용할 수 있을 것이다.
무(Raphanus sativus L.)는 십자화과(Brassicaceae)에 속하는 근채 작물로서, 전세계적으로 경제적 가치가 매우 큰 채소 작물 중 하나이다. 무는 한국, 중국, 일본, 미국 등 여러 나라에서 유전체 해독, 병 저항성, 형질연관 분석 등 다양한 연구의 재료로 사용되고 있다. 한국 무 WK10039의 전체유전체는 2015년 염색체 수준으로 최초 해독되어 Rs1.0으로 보고되었다. Rs1.0은 454와 Illumina 서열을 중심으로 조립되었기 때문에 어셈블리의 길이가 짧고 공백서열(N bases)이 많으며 조립서열과 유전자 주석에 오류가 있어 그 완성도를 높일 필요가 있다. 따라서 본 연구에서는 완성도 높은 무의 고품질 표준유전체(Rs2.0)을 제작하고 유전체 특성을 규명하여 무 연구를 위한 유전체 기반을 강화하고자 하였다. 또한 근연종인 이배체 배추속 작물(배추, 양배추, 그리고 흑겨자)과 비교유전체 연구를 수행하여 무의 종 기원에 대한 진화유전체학적 근거를 제공하고자 하였다. 무 유전체 신규해독을 위해 장거리 서열과 염색체 구조 포착(Chromosome-conformation capture) 시퀀싱 서열에 기반을 둔 유전체 분석 전략을 사용하여 WK10039의 고품질 표준유전체 Rs2.0를 제작하였다. Rs2.0는 434.8 Mb 크기(공백 서열 제외 434.6 Mb)의 9개 염색체와 6,464개 스케폴드로 조립되었다. 조립 서열 중 165.8 Mb (38.1%)는 반복서열로서 4,845개의 RNA 유전자를 포함하고 있다. 유전자 주석 분석 수행 결과, 유전자 영역의 99.9% 이상을 포괄하는 52,768개의 단백질 암호화 유전자를 결정하였다. Rs2.0과 Rs1.0의 염색체 서열을 비교 분석 결과, Rs2.0의 9개 염색체에서 평균 5 Mb 크기의 동원체 영역을 새롭게 결정하였다. 모든 동원체 영역에는 동원체 특이적 반복서열(CentRs, CRB, CLs)과 완전한 구조의 OTA와 CRM Gypsy 레트로포존과 hAT-Ac, CMC-EnSpm, Helitron DNA 트랜스포손 등이 주로 존재했으며 이들의 분포 양상은 근연종인 배추와 양배추와 유사했다. 또한 동원체 영역에서 유전자의 발현량은 매우 낮은데 반해 DNA 메틸화 수준은 높았다. 이러한 결과들은 기존 Rs1.0에 비하여 Rs2.0의 조립 수준, 서열 연속성, 유전자 및 반복서열 주석 정보가 개선되었음을 나타낸다. 무의 유전체 구조와 3배수화 특성을 밝히기 위하여 Rs2.0 유전체 서열과 애기장대, 이배체 배추속 작물(배추, 양배추, 그리고 흑겨자)들의 유전체 서열을 비교 분석하였다. 무의 유전체는 이배체 배추속 작물과 같이 전유전체 3배수화 구조를 가지고 있으며 Brassica 공통조상의 9개 염색체가 재배열되어 있었다. 뿐만 아니라, Rs2.0는 Rs1.0에서 발견되지 않았거나 경계가 불분명했던 translocation Proto-Calepineae karyotype (tPCK) genome block들을 새롭게 정의하였다. 그 결과, 72개 tPCK block (24 block X 3)중 GMF2를 제외한 71개 block이 Rs2.0에 존재했다. GMF2는 Rs2.0뿐만 아니라 배추와 양배추 유전체에서도 발견되지 않아 GMF2결실이 무와 이배체 배추속 식물의 공유파생형질(synapomorphic trait)로 사료되었다. 이상의 유전체 구조 및 특성 분석 결과는 무가 Brassica 속으로부터 기원한 종이라는 가설을 지지하였다. R. sativus의 기원과 분화시기를 밝히기 위하여 무, 배추, 양배추, 흑겨자 그리고 애기장대에서 공통적으로 보존되어 있는 3,838개의 ortholog 유전자들 간의 동의치환율(synonymous substitution rate, Ks)을 분석하였다. 그 결과, 무는 흑겨자와 함께 배추/양배추 계통에서 11.3-12.1 Mya에 분화되었으며 이후 11.1 Mya에 무와 흑겨자가 분화된 것으로 계산되었다. 이상의 결과를 종합할 때, 무는 Brassica 속의 이배체 식물로부터 기원하였으며 11.1 Mya에 흑겨자로부터 분리되어 독립된 종으로 진화되었다고 사료되었다. 이때, 흑겨자에서 특이적으로 증폭된 Ale Copia 레트로포존은 두 종의 분화를 촉진시킨 것으로 추정되었다. 무 WK10039의 잎, 뿌리, 암술, 수술 등 4개 조직에서 유전자 발현과 메틸화 양상을 비교 분석하여 119개의 차등메틸화 영역을 발굴하였다. 또한 차등메틸화 영역에서 메틸화 양상과 유전자 발현 양상이 역상관 관계를 나타내며 뿌리 발달과 구조에 관여하는 유전자 14개를 선발하였다. 이 유전자들은 향후 무의 재배화 또는 유용 농업 형질에 대한 연구의 소재로 쓰일 수 있을 것이다. 본 논문을 통하여 해독한 무의 고품질 표준유전체 서열(Rs2.0)과 유전자 정보는 R. sativus 종의 기원과 분류에 대한 유전체 서열 수준의 기준을 제공하고 있다. 향후 전장유전체 연관연구(genome-wide association study)와 같은 염색체 수준의 분석에 Rs2.0은 정밀한 참조 표준유전체로 활용할 수 있을 것이다.
Radish (Raphanus sativus L.) is an agronomically important root vegetable crop and is closely related to the diploid Brassica species of the Brassicaceae family. The first draft genome of R. sativus cv. WK10039 (Rs1.0) was assembled into 426.2 Mb with 54.6 Mb gaps using 454 and Illumina reads in 201...
Radish (Raphanus sativus L.) is an agronomically important root vegetable crop and is closely related to the diploid Brassica species of the Brassicaceae family. The first draft genome of R. sativus cv. WK10039 (Rs1.0) was assembled into 426.2 Mb with 54.6 Mb gaps using 454 and Illumina reads in 2015. However, Rs1.0 had a small contig size, sequence and annotation error and limited integration of scaffolds into chromosomes. Moreover, several reports using Rs1.0 as a reference were unreliable due to the limited quality of genome sequence and assembly error. Hence, it is necessary to improve Rs1.0 to increase accuracy of assembly and annotation of the R. sativus genome. I generated and annotated an improved genome assembly, Rs2.0, by using long-read sequencing and chromosome conformation capture (Hi-C) technologies to explore previously unknown regions of the radish genome. Rs2.0 was assembled into 434.9 Mb (434.6 Mb without unknown sequence, N) with 0.27 Mb gaps and the N50 scaffold length of 37.3 Mb. Approximately 38% of Rs2.0 was comprised of repetitive sequences, and 52,768 protein-coding genes and 4,845 non-protein-coding genes were predicted and annotated. The centromeric regions (average length of 5 Mb) of each chromosome were identified. Radish centromeres were characterized by co-localization of specific DNA transposon, full-length long terminal repeat retrotransposons, and previously known as centromere-specific sequence (CentRs or CRB). Gene expression from mRNA sequencing combined with global DNA methylation profiles identified differential epigenetic marks in the radish genome related to tissue development, especially radish root architecture. Synteny comparison and genomic distance analysis of R. sativus and three diploid Brassica species (B. rapa, B. oleracea, and B. nigra) suggested that the radish genome arose from the ancestral Brassica genome through unique rearrangement and combination of the triplicated common ancestral Brassica genome. Moreover, R. sativus/B. nigra and B. rapa/B. oleracea lineages diverged at 11-12 Mya and soon after the R. sativus genome split from B. nigra at 11 Mya based on molecular dating and phylogenetic analysis. In conclusion, I report an improved genome assembly of R. sativus cv. WK10039 using long-read sequencing and Hi-C technologies. Based on a comprehensive comparative genome analysis with diploid Brassica species, it appears that R. sativus is derived from the genus Brassica, and is a sibling species of B. nigra, rather than B. rapa and B. oleracea. Overall, this study makes a significant contribution to address issues of the origin, taxonomic delimitation, and genetic relationship of radish with diploid Brassica species.
Radish (Raphanus sativus L.) is an agronomically important root vegetable crop and is closely related to the diploid Brassica species of the Brassicaceae family. The first draft genome of R. sativus cv. WK10039 (Rs1.0) was assembled into 426.2 Mb with 54.6 Mb gaps using 454 and Illumina reads in 2015. However, Rs1.0 had a small contig size, sequence and annotation error and limited integration of scaffolds into chromosomes. Moreover, several reports using Rs1.0 as a reference were unreliable due to the limited quality of genome sequence and assembly error. Hence, it is necessary to improve Rs1.0 to increase accuracy of assembly and annotation of the R. sativus genome. I generated and annotated an improved genome assembly, Rs2.0, by using long-read sequencing and chromosome conformation capture (Hi-C) technologies to explore previously unknown regions of the radish genome. Rs2.0 was assembled into 434.9 Mb (434.6 Mb without unknown sequence, N) with 0.27 Mb gaps and the N50 scaffold length of 37.3 Mb. Approximately 38% of Rs2.0 was comprised of repetitive sequences, and 52,768 protein-coding genes and 4,845 non-protein-coding genes were predicted and annotated. The centromeric regions (average length of 5 Mb) of each chromosome were identified. Radish centromeres were characterized by co-localization of specific DNA transposon, full-length long terminal repeat retrotransposons, and previously known as centromere-specific sequence (CentRs or CRB). Gene expression from mRNA sequencing combined with global DNA methylation profiles identified differential epigenetic marks in the radish genome related to tissue development, especially radish root architecture. Synteny comparison and genomic distance analysis of R. sativus and three diploid Brassica species (B. rapa, B. oleracea, and B. nigra) suggested that the radish genome arose from the ancestral Brassica genome through unique rearrangement and combination of the triplicated common ancestral Brassica genome. Moreover, R. sativus/B. nigra and B. rapa/B. oleracea lineages diverged at 11-12 Mya and soon after the R. sativus genome split from B. nigra at 11 Mya based on molecular dating and phylogenetic analysis. In conclusion, I report an improved genome assembly of R. sativus cv. WK10039 using long-read sequencing and Hi-C technologies. Based on a comprehensive comparative genome analysis with diploid Brassica species, it appears that R. sativus is derived from the genus Brassica, and is a sibling species of B. nigra, rather than B. rapa and B. oleracea. Overall, this study makes a significant contribution to address issues of the origin, taxonomic delimitation, and genetic relationship of radish with diploid Brassica species.
Keyword
#Raphanus sativus improved genome long read sequencing chromosome conformation capture assembly centromere genome-wide synteny comparison Brassica species phylogenetic analysis divergence time speciation evolution
학위논문 정보
저자
조아라
학위수여기관
명지대학교 대학원
학위구분
국내박사
학과
생명과학정보학과
지도교수
문정환
발행연도
2023
총페이지
viii, 173p.
키워드
Raphanus sativus improved genome long read sequencing chromosome conformation capture assembly centromere genome-wide synteny comparison Brassica species phylogenetic analysis divergence time speciation evolution
※ AI-Helper는 부적절한 답변을 할 수 있습니다.