[논문]NGS 기술 활용 돌연변이체 해석 및 연구현황

정유진; 류호진; 조용구; 강권규

doi:10.5010/jpb.2016.43.4.411

NGS 기술 활용 돌연변이체 해석 및 연구현황
Current status and prospects to identify mutations responsible for mutant phenotypes by using NGS technology 원문보기

Journal of plant biotechnology = 식물생명공학회지, v.43 no.4, 2016년, pp.411 - 416

정유진 (국립한경대학교 원예생명과학과, 국립한경대학교 유전공학연구소) , 류호진 (충북대학교 자연과학대학 생물학과) , 조용구 (충북대학교 식물자원학과) , 강권규 (국립한경대학교 원예생명과학과, 국립한경대학교 유전공학연구소)

초록
AI-Helper

NGS 기술은 전체 게놈 시퀀싱 및 reference 게놈에 alignment에 의해 돌연변이 표현형에 관련된 돌연변이 식별에 이용한다. 그러나 품종 및 계통들을 resequence 하였을 경우 기존의 reference 게놈에 구조적 변이가 보이며, reference와 맞지 않는 게놈지역에서 돌연변이들은 단순한 alignment로 찾을 수 없다. 본 리뷰에서는 NGS 기술을 이용하여 돌연변이체로부터 변이 관련 유전자를 식별하는 MutMap, MutMap-Gap 및 MutMap+ 방법을 기술하였고 지금까지의 연구현황에 대해 기술하였다. 아울러 이들 방법은 nucleotide-binding site-leucine rich repeat (NBS-LRR) 그룹들의 병 저항성 유전자와 같이 구조적 변이를 가진 유전자를 분리하는 등 유용성에 대해 고찰하였다.

Abstract ▼ AI-Helper

Next-generation sequencing allows the identification of mutations responsible for mutant phenotypes by whole-genome resequencing and alignment to a reference genome. However, when the resequenced cultivar/line displays significant structural variation from the reference genome, mutations in the genome regions absent in the reference cannot be identified by simple alignment. In this review, we report the current status and prospects in identification of genes in mutant phenotypes, by using the methods MutMap, MutMap-Gap, and MutMap+. These methods delineate a candidate region harboring a mutation of interest, followed by de novo assembly, alignment, and identification of the mutation within genome gaps. These methods are likely to prove useful for cloning genes that exhibit significant structural variations, such as disease resistance genes of the nucleotide-binding site-leucine rich repeat (NBS-LRR) class.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

그러나 품종 및 계통들을 resequence 하였을 경우 기존의 reference 게놈에 구조적 변이가 보이며, reference 와 맞지 않는 게놈지역에서 돌연변이들은 단순한 alignment 로 찾을 수 없다. 본 리뷰에서는 NGS 기술을 이용하여 돌연변이체로부터 변이 관련 유전자를 식별하는 MutMap, MutMap-Gap 및 MutMap+ 방법을 기술하였고 지금까지의 연구현황에 대해 기술하였다. 아울러 이들 방법은 nucleotidebinding site-leucine rich repeat (NBS-LRR) 그룹들의 병 저항성 유전자와 같이 구조적 변이를 가진 유전자를 분리하는 등 유용성에 대해 고찰하였다.
본 리뷰에서는 유전체 게놈 서열 해독이 완료된 다양한 생물 종에서 차세대 시퀀서를 사용하여 신속하게 돌연변이 원인 유전자를 동정하는 기술에 대해 설명하고 고찰하고자 한다.
본 총설에서는 돌연변이의 원인 유전자 동정을 위해 MutMap법, MutMap-Gap법 및 MutMap+법 등에 대한 유용성을 살펴보았다. 본 논문의 저자들은 인위적으로 유발 하는 돌연변이와 비교하여 긴 세월에 걸쳐 그 생물이 축적해 온 자연변이는 자연 및 인위적 선택을 받아 선발된 돌연변이도 포함되기 때문에 유용한 allele을 많아 관련 유전자들의 분리 동정에 사용될 것으로 기대한다.

제안 방법

3C). Bulk DNA는 각각 Illumina GAIIx sequencer에 의해 염기배 열을 분석한 후, 양친 계통의 reference sequence와 비교 분석하였다. 각각의 bulk로부터 SNP-index와 SNP gemomic position graphs를 그렸다(Fig.
변이 형질이 열성 돌연변이로 인한 경우 F2에서는 표현형이 야생형(wild type)과 돌연변이가 3 : 1의 비율로 분리되었다. F2 개체 중 변이형을 나타내는 개체 20 개체의 게놈 DNA를 골고루 혼합(bulk화)하고, 차세대 시퀀서에 의해 전체 게놈의 염기배열을 분석하였다. 시퀀서는 75 ~ 100 bp의 짧은 염기서열 (short read)를 많이 얻을 수 있었으며, 이렇게 얻어진 short read를 Hitomebore 품종에서 미리 작성한 reference sequence에 맞게 정렬하였다.
3 B). MutMap+ 실험을 위해 포장에 M2 세대를 계통별로 10개체 정도 파종하고 표현형의 분리를 개체 별로 체크하였다(Fig. 3B). 이들 중 야생형 중에서 heterozygote로 구성된 개체를 자식하여 M3 세대를 육성하였다.
이때 기준 게놈 배열에 정렬되지 않은 short read군을 mapping하여 paired-end reads로 따로 저장하였다. ② 목적으로 하는 돌연변이를 선발 후, 원품종의 기준 배열을 이용한 MutMap 법에 의해 원인 유전자 자리의 게놈 영역을 식별하였다. ③ MutMap법으로 특정된 후보 영역에 정렬된 short read 및 paired-end reads를 이용하여 de novo 어셈블리를 하고 contig를 구축하였다.
② 목적으로 하는 돌연변이를 선발 후, 원품종의 기준 배열을 이용한 MutMap 법에 의해 원인 유전자 자리의 게놈 영역을 식별하였다. ③ MutMap법으로 특정된 후보 영역에 정렬된 short read 및 paired-end reads를 이용하여 de novo 어셈블리를 하고 contig를 구축하였다. 이 단계는 후보 영역의 게놈 배열을 de novo assembly에 따라 재구성하는 것을 의미한다.
이 단계는 후보 영역의 게놈 배열을 de novo assembly에 따라 재구성하는 것을 의미한다. ④ 마지막으로, 구축된 contig에 대해 다시 MutMap 분석한 후, 돌연변이 형질에 대한 원인 유전자 변이를 식별하였다. MutMap-Gap법을 적용함으로써 전체 게놈 서열 해독이 완료된 품종이면 해독에 이용한 품종과 다른 품종에 서도 resequencing 기술에 의한 변이 분석이 가능하다.
5와 1 사이의 SNP-index를 나타내는 것으로 예상된다. 따라서 돌연변이와 부모 계통 사이에 존재하는 모든 SNP(돌연변이 계통 군에서는 평균 약 2,000 개)에 대한 SNP-index를 계산하였다. 내염성에 저항성을 보이는 돌연변이체의 원인 유전자를 동정하기 위해 MutMap 분석을 실시한 결과 가로축에 SNP의 염색체상의 위치, 세로축에 SNP-index의 값을 나타낸 그래프에서 SNP-index 가 1이되는 피크를 찾음으로써 내염성 돌연변이 유전자의 SNP를 식별할 수 있었다(Fig.
F2 개체 중 변이형을 나타내는 개체 20 개체의 게놈 DNA를 골고루 혼합(bulk화)하고, 차세대 시퀀서에 의해 전체 게놈의 염기배열을 분석하였다. 시퀀서는 75 ~ 100 bp의 짧은 염기서열 (short read)를 많이 얻을 수 있었으며, 이렇게 얻어진 short read를 Hitomebore 품종에서 미리 작성한 reference sequence에 맞게 정렬하였다. 이 때 게놈의 특정 부분을 몇 개의 short read가 있어 얼마나 많이 시퀀싱 할 것인지(depth)를 파악하여 SNP-index 값을 결정 하였다.
본 리뷰에서는 NGS 기술을 이용하여 돌연변이체로부터 변이 관련 유전자를 식별하는 MutMap, MutMap-Gap 및 MutMap+ 방법을 기술하였고 지금까지의 연구현황에 대해 기술하였다. 아울러 이들 방법은 nucleotidebinding site-leucine rich repeat (NBS-LRR) 그룹들의 병 저항성 유전자와 같이 구조적 변이를 가진 유전자를 분리하는 등 유용성에 대해 고찰하였다.
시퀀서는 75 ~ 100 bp의 짧은 염기서열 (short read)를 많이 얻을 수 있었으며, 이렇게 얻어진 short read를 Hitomebore 품종에서 미리 작성한 reference sequence에 맞게 정렬하였다. 이 때 게놈의 특정 부분을 몇 개의 short read가 있어 얼마나 많이 시퀀싱 할 것인지(depth)를 파악하여 SNP-index 값을 결정 하였다. SNP-index는 정렬된 short read와 reference sequence사이에 SNP가 있는 경우, 그 SNP 부위를 덮는 short read 전체 중 reference sequence와 다른 염기를 가진 short read의 비율이다.
이들 중 야생형 중에서 heterozygote로 구성된 개체를 자식하여 M3 세대를 육성하였다. 이들 M3세대의 종자는 개체별로 채종하고, 80 개체 이상 포장에 심어 표현형의 분리를 조사하였다. 이렇게 얻어진 M3 식물들의 돌연변이형 bulk(20 ~ 40개체)와 야생형 bulk(20 ~ 40개체)를 구분하여 두 집단으로부터 DNA를 추출하였다(Fig.
이들 M3세대의 종자는 개체별로 채종하고, 80 개체 이상 포장에 심어 표현형의 분리를 조사하였다. 이렇게 얻어진 M3 식물들의 돌연변이형 bulk(20 ~ 40개체)와 야생형 bulk(20 ~ 40개체)를 구분하여 두 집단으로부터 DNA를 추출하였다(Fig. 3C). Bulk DNA는 각각 Illumina GAIIx sequencer에 의해 염기배 열을 분석한 후, 양친 계통의 reference sequence와 비교 분석하였다.
2013a). 이와 같이 nucleotide-binding site-leucine rich repeat (NBS-LRR) 그룹들의 병 저항성 유전자와 같이 구조적 변이를 가진 유전자를 분리하는데 입증하였다.

대상 데이터

비록 M1 세대의 돌연변이 식물들 에서 dominant와 semi-dominant는 구분되지만, 열성돌연변이는 구분이 되지 않아서, M2 세대를 진전시켜야 구별 가능하다. M2 자식세대에서 야생형과 돌연변이 표현형의 분리비가 3:1로 분리되는 것을 각각 선발하였다(Fig. 3 B). MutMap+ 실험을 위해 포장에 M2 세대를 계통별로 10개체 정도 파종하고 표현형의 분리를 개체 별로 체크하였다(Fig.

이론/모형

④ 마지막으로, 구축된 contig에 대해 다시 MutMap 분석한 후, 돌연변이 형질에 대한 원인 유전자 변이를 식별하였다. MutMap-Gap법을 적용함으로써 전체 게놈 서열 해독이 완료된 품종이면 해독에 이용한 품종과 다른 품종에 서도 resequencing 기술에 의한 변이 분석이 가능하다. 이들 방법을 이용하여 도열병 저항성 Pi 유전자 기능이 손실된 돌연변이 계통으로부터 Hitomebore 품종의 도열병 저항성 계통 육성에 이용하였다(Takagi et al.
MutMap-Gap법을 적용함으로써 전체 게놈 서열 해독이 완료된 품종이면 해독에 이용한 품종과 다른 품종에 서도 resequencing 기술에 의한 변이 분석이 가능하다. 이들 방법을 이용하여 도열병 저항성 Pi 유전자 기능이 손실된 돌연변이 계통으로부터 Hitomebore 품종의 도열병 저항성 계통 육성에 이용하였다(Takagi et al. 2013a). 이와 같이 nucleotide-binding site-leucine rich repeat (NBS-LRR) 그룹들의 병 저항성 유전자와 같이 구조적 변이를 가진 유전자를 분리하는데 입증하였다.

성능/효과

따라서 돌연변이와 부모 계통 사이에 존재하는 모든 SNP(돌연변이 계통 군에서는 평균 약 2,000 개)에 대한 SNP-index를 계산하였다. 내염성에 저항성을 보이는 돌연변이체의 원인 유전자를 동정하기 위해 MutMap 분석을 실시한 결과 가로축에 SNP의 염색체상의 위치, 세로축에 SNP-index의 값을 나타낸 그래프에서 SNP-index 가 1이되는 피크를 찾음으로써 내염성 돌연변이 유전자의 SNP를 식별할 수 있었다(Fig. 1). 염색체 6번상에서 SNP index의 2개의 피크를 찾아 이들 피크에 해당되는 영역이 내염성(hst1) 저항성에 관련이 있다고 생각할 수 있었다.
1). 염색체 6번상에서 SNP index의 2개의 피크를 찾아 이들 피크에 해당되는 영역이 내염성(hst1) 저항성에 관련이 있다고 생각할 수 있었다. 이들 영역의 부분을 상세히 조사한 결과 OsRR22 유전자 영역에서 TGG (Trp)가 TAG (Stop)로 변이가 일어나 저항성을 보였다(Abe et al.

후속연구

본 논문의 저자들은 인위적으로 유발 하는 돌연변이와 비교하여 긴 세월에 걸쳐 그 생물이 축적해 온 자연변이는 자연 및 인위적 선택을 받아 선발된 돌연변이도 포함되기 때문에 유용한 allele을 많아 관련 유전자들의 분리 동정에 사용될 것으로 기대한다. 또한 MutMap 방법들이 QTL-seq법과 함께 육종현장에서 신속 하게 식별할 수 있는 수법으로 더 발전되길 기대해 본다.
본 총설에서는 돌연변이의 원인 유전자 동정을 위해 MutMap법, MutMap-Gap법 및 MutMap+법 등에 대한 유용성을 살펴보았다. 본 논문의 저자들은 인위적으로 유발 하는 돌연변이와 비교하여 긴 세월에 걸쳐 그 생물이 축적해 온 자연변이는 자연 및 인위적 선택을 받아 선발된 돌연변이도 포함되기 때문에 유용한 allele을 많아 관련 유전자들의 분리 동정에 사용될 것으로 기대한다. 또한 MutMap 방법들이 QTL-seq법과 함께 육종현장에서 신속 하게 식별할 수 있는 수법으로 더 발전되길 기대해 본다.

질의응답

핵심어	질문	논문에서 추출한 답변
	유전적 연관(genetic association) 분석이란 무엇입니까?	이 목적을 위해 유전적 연관(genetic association) 분석이 이용되어왔다. 즉, 생물 종의 집단을 표현형에 의해 2개 이상의 그룹으로 분류 할 때, 그 분류와 통계적으로 유의한 연관 (association)을 나타내도록 게놈상의 변이를 찾는 분석이다. 게놈이 부모로부터 자손에게 유전될 때 물리적으로 서로 가까이에 있는 DNA 영역은 더 자주 함께 후손에게 전달되기 때문에 강한 연관을 보인다(Yan et al.
	NGS 기술의 단점은 무엇입니까?	NGS 기술은 전체 게놈 시퀀싱 및 reference 게놈에 alignment에 의해 돌연변이 표현형에 관련된 돌연변이 식별에 이용한다. 그러나 품종 및 계통들을 resequence 하였을 경우 기존의 reference 게놈에 구조적 변이가 보이며, reference와 맞지 않는 게놈지역에서 돌연변이들은 단순한 alignment로 찾을 수 없다. 본 리뷰에서는 NGS 기술을 이용하여 돌연변이체로부터 변이 관련 유전자를 식별하는 MutMap, MutMap-Gap 및 MutMap+ 방법을 기술하였고 지금까지의 연구현황에 대해 기술하였다.
	NGS 기술은 어떠한 목적으로 이용됩니까?	NGS 기술은 전체 게놈 시퀀싱 및 reference 게놈에 alignment에 의해 돌연변이 표현형에 관련된 돌연변이 식별에 이용한다. 그러나 품종 및 계통들을 resequence 하였을 경우 기존의 reference 게놈에 구조적 변이가 보이며, reference와 맞지 않는 게놈지역에서 돌연변이들은 단순한 alignment로 찾을 수 없다.

참고문헌 (24)

Abe A, Kosugi S, Yoshida K, Natsume S, Takagi H, Kanzaki H, Matsumura H, oshida K, Mitsuoka C, Tamiru M et al. (2012) Genome sequencing reveals gronomically important loci in rice using MutMap. Nature Biotechnology 30:174-178

상세보기
Altshule D, Daly MJ, Lander ES (2008) Genetic mapping in human disease. Science 322 (5903):881-888

상세보기
Austin RS, Vidaurre D, Stamatiou G, Breit R, Provart NJ, Bonetta D, Zhang J, Fung P, Gong Y, Wang PW et al. (2011) Next-generation mapping of Arabidopsis genes. Plant Journal 67:715-725

상세보기
Baxter SW, Davey JW, Johnston JS, Shelton AM, Heckel DG, Jiggins CD, Blaxter ML (2011) Linkage mapping and comparative genomics using next-generation RAD sequencing of a non-model organism. PLoS One 6: e19315

상세보기
Boetzer M, Henkel CV, Jansen HJ, Butler D, Pirovano W (2011) Scaffolding pre-assembled contigs using SSPACE. Bioinformatics 27:578-579

상세보기
Clark RM, Schweikert G, Toomajian C, Ossowski S, Zeller G, Shinn P, Warthmann N, Hu TT, Fu G, Hinds DA et al. (2007) Common sequence polymorphisms shaping genetic diversity in Arabidopsis thaliana. Science 317:338-342

상세보기
Elshir RJ, Glaubitz JC, Sun Q, Poland JA, Kawamoto K, Buckler ES, Mitchell SE (2011) A robust, simple genotyping-by-sequencing (GBS) approach for high diversity species. PLoS One 6: e19379

상세보기
Fekih R, Takagi H, Tamiru M, Abe A, Natsume S, Yaegashi H, Sharma S, Sharma S, Kanzaki H, Matsumura H et al. (2013) MutMap+: genetic mapping and mutant identification without crossing in rice. PLoS One 8:e68529

상세보기
Harper AL, Trick M, Higgins J, Fraser F, Clissold L, Wells R, Hattori C, Werner P, Bancroft I (2012) Associative transcriptomics of traits in the polyploid crop species Brassica napus. Nature Biotechnol. 30:798-802

상세보기
Huang X, Wei X, Sang T, Zhao Q, Feng Q, Zhao Y, Li C, Zhu C, Lu T, Zhang Z, Li M, Fan D, Guo Y, Wang A, Wang L, Deng L, Li W, Lu Y, Weng Q, Liu K, Huang T, Zhou T, Jing Y, Li W, Lin Z, Buckler ES, Qian Q, Zhang QF, Li J, Han B (2010) Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genet. 42:961-967

상세보기
Hunter KW, Crawford NPS (2008) The future of mouse QTL mapping to diagnose disease in mice in the age of whole-genome association studies. Annu. Rev. Genet 42:131-141

상세보기
Li H, Durbin R. 2009. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25:1754-1760

상세보기
Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R, 1000 Genome Project Data Processing Subgroup (2009) The sequence alignment/map format and samtools. Bioinformatics 25:2078-2079

상세보기
Lister R, Gregory BD, Ecker JR (2009) Next is now: new technologies for sequencing of genomes, transcriptomes, and beyond. Curr. Opin. Plant Biol. 12:107-118

상세보기
Morishige DT, Klein PE, Hilley JL, Sahraeian SME, Sharma A, Mullet JE (2013) Digital genotyping of sorghum-a diverse plant species with a large repeat-rich genome. BMC Genomics 14:448

상세보기
Lupski JR, Reid JG, Gonzaga-Jauregui C, Deiros DR, Chen DCY, Nazareth L, Bainbridge M, Dinh H, Jing C, Wheeler DA, Mcguire AL, Zhang F, Stankiewicz P, Halperin JJ, Yang C, Gehman C, Guo D, Irikat RK, Tom W, Fantin NJ, Muzny DM, Gibbs RA (2010) Whole-genome sequencing in a patient with Charcot-Marie-Tooth neuropathy. N. Engl. J. Med. 362:1181-1191

상세보기
Takagi H, Uemura A, Yaegashi H, Tamiru M, Abe A, Mitsuoka C, Utsushi H, Natsume S, Kanzaki H, Matsumura H et al. (2013a) MutMap-Gap: whole-genome resequencing of mutant F2 progeny bulk combined with de novo assembly of gap regions identifies the rice blast resistance gene Pii. New Phytol. 200:276-283

상세보기
Takagi H, Abe A, Yoshida K, Kosugi S, Natsume S, Mitsuoka C, Uemura A, Utsushi H, Tamiru M, Takuno S et al. (2013b) QTL-seq: rapid mapping of quantitative trait loci in rice by whole genome resequencing of DNA from two bulked populations. Plant J. 74:174-183

상세보기
Takagi H et al. (2015) MutMap accelerates breeding of a salt-tolerant rice cultivar. Nat. Biotechnol. 33:445-449

상세보기
Tian F, Bradbury PJ, Brown PJ, Hung H, Sun Q, Flint- Garcia S, Rocheford TR, McMullen MD, Holland JB, Buckler ES (2011) Genome-wide association study of leaf architecture in the maize nested association mapping population. Nature Genet. 43:6-11
Wallace JG, Larsson SJ, Buckler ES (2014) Entering the second century of maize quantitative genetics. Heredity 112:30-38

상세보기
Yan J, Shah T, Warburton ML, Buckler ES, McMullen MD, Crouch J (2009) Genetic Characterization and linkage disequilibrium estimation of a global maize collection using SNP markers. Plos One 4(12):e8451

상세보기
Zhou T, Wang Y, Chen JQ, Araki H, Jing Z, Jiang K, Shen J, Tian D (2004) Genome-wide identification of NBS genes in japonica rice reveals significant expansion of divergent non-TIR NBS-LRR genes. Molecular Genetics and Genomics 271:402-405

상세보기
Zhu C, Gore M, Buckler ES, Yu J (2008) Status and prospects of association mapping in plants. Plant Genome 1:5-20

상세보기

저자의 다른 논문 :

LOADING...

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증