차세대염기서열분석법을 이용한 잔대의 SSR 마커 개발 Development of Simple Sequence Repeat Markers from Adenophora triphylla var. japonica (Regel) H. Hara using Next Generation Sequencing원문보기
Background: Adenophora triphylla var. japonica (Regel) H. Hara shows vegetative growth with radical leaves during the first year and shows reproductive growth with cauline leaves and bolting during the second year. In addition, the shape of the plant varies within the same species. For this reason, ...
Background: Adenophora triphylla var. japonica (Regel) H. Hara shows vegetative growth with radical leaves during the first year and shows reproductive growth with cauline leaves and bolting during the second year. In addition, the shape of the plant varies within the same species. For this reason, there are limitations to classifying the species by visual examination. However, there is not sufficient genetic information or molecular tools to analyze the genetic diversity of the plant. Methods and Results: Approximately 34.59 Gbp of raw data containing 342,487,502 reads was obtained from next generation sequencing (NGS) and these reads were assembled into 357,211 scaffolds. A total of 84,106 simple sequence repeat (SSR) regions were identified and 14,133 primer sets were designed. From the designed primer sets, 95 were randomly selected and were applied to the genomic DNA which was extracted from five plants and pooled. Thirty-nine primer sets showing more than two bands were finally selected as SSR markers, and were used for the genetic relationship analysis. Conclusions: The 39 novel SSR markers developed in this study could be used for the genetic diversity analysis, variety identification, new variety development and molecular breeding of A. triphylla.
Background: Adenophora triphylla var. japonica (Regel) H. Hara shows vegetative growth with radical leaves during the first year and shows reproductive growth with cauline leaves and bolting during the second year. In addition, the shape of the plant varies within the same species. For this reason, there are limitations to classifying the species by visual examination. However, there is not sufficient genetic information or molecular tools to analyze the genetic diversity of the plant. Methods and Results: Approximately 34.59 Gbp of raw data containing 342,487,502 reads was obtained from next generation sequencing (NGS) and these reads were assembled into 357,211 scaffolds. A total of 84,106 simple sequence repeat (SSR) regions were identified and 14,133 primer sets were designed. From the designed primer sets, 95 were randomly selected and were applied to the genomic DNA which was extracted from five plants and pooled. Thirty-nine primer sets showing more than two bands were finally selected as SSR markers, and were used for the genetic relationship analysis. Conclusions: The 39 novel SSR markers developed in this study could be used for the genetic diversity analysis, variety identification, new variety development and molecular breeding of A. triphylla.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서 개발된 SSR 마커는 잔대의 유전체 정보를 기반으로 한 것으로써, 잔대의 유전적 다양성을 염기서열 수준에서 밝히는데 매우 유용하다는 것을 알 수 있었다. 또한, 이를 이용하여 국내 잔대 유전자원의 다양성을 성공적으로 파악함으로써, 잔대의 체계적인 계통 분류 및 분자 육종에 필요한 기본적 자료를 제공하였다. 본 연구에서 개발된 마커는 앞으로 국내외 잔대 유전자원의 확보 및 다양성 분석, 우수 형질의 잔대 품종 개발에도 도움을 줄 것으로 사료된다.
본 연구에서는 국내의 여러 지역에 걸쳐 자생하며 재배, 유통되고 있는 잔대를 대상으로 NGS를 통한 SSR마커를 개발하고 이를 이용하여 잔대의 유전적 다양성을 분석하여 향후 육종에 필요한 연구 기반을 마련하고자 수행하였다.
제안 방법
본 연구에서 수집된 유전자원 중 5 개 지역 (평창, 보은,나주, 임실, 화순)에서 각각 1 개체씩을 임의로 선별하고 genomic DNA를 추출한 후, 이를 동량으로 혼합하는 genomic DNA pooling 방법을 이용하여 혼합된 genomic DNA를 95 개의 프라이머에 적용하였다. 그 후, Fragment Analyzer Automated CE system (Advanced Analytical Technologies, Ankeny, IA, USA) 기기를 이용하여 Quant-iTPicoGreen dsDNA reagent kit, 1-500 bp (Invitrogen Co.,Carlsbad, CA, USA)로 전기영동을 수행하였다. 이후, 증폭된 밴드는 PROSize version 2.
, 2012)을 이용하여 SSR 프라이머 서열을 다음과 같은 조건에서 디자인하였다. 길이는 18 bp에서 26 bp (최적 길이 23 bp)이고 GC함량은 50%에서 70% (최적 60%)로 하였으며, Tm값은 55℃에서 62℃ (최적 58℃)로 설정하였다. PCR product의 길이는 150 bp에서 250 bp 사이가 되게 설계하되, 프라이머쌍 사이에 서로 다른 motif의 반복구간이 들어간 것들은 모두 제외하였다.
org/)을 이용하여 분석하였다. 또한 SSR Finder (ftp://ftp.gramene.org/pub/gramene/arch-ives/software/scripts/ssr.pl)를 사용하여 SSR 구간을 탐색하였다. SSR 구간을 탐색하기 위해 2 가지의 변수를 고려하였다.
본 연구에서 수집된 유전자원 중 5 개 지역 (평창, 보은,나주, 임실, 화순)에서 각각 1 개체씩을 임의로 선별하고 genomic DNA를 추출한 후, 이를 동량으로 혼합하는 genomic DNA pooling 방법을 이용하여 혼합된 genomic DNA를 95 개의 프라이머에 적용하였다. 그 후, Fragment Analyzer Automated CE system (Advanced Analytical Technologies, Ankeny, IA, USA) 기기를 이용하여 Quant-iTPicoGreen dsDNA reagent kit, 1-500 bp (Invitrogen Co.
선발된 마커를 수집된 자원에 적용하여 개발된 마커의 효율성을 검정하였다. 이를 위해서 선발된 프라이머를 총 23 개체에 각각 적용하였고, 증폭된 PCR 산물을 DNA Fragment Analyzer Automated CE System (Advanced Analytical Technologies, Ankeny, IA, USA)을 이용하여 분석하였다.
연구에서는 Illumina Hiseq 2500 platform을 이용하여 염기서열 분석을 수행하였다. Paired-end sequencing 방법을 이용하여 총 342,487,502 개의 read를 포함하는 총 34.
이렇게 얻어진 scaffold로부터 SSR 구간을 검색하고 primer를 제작하였다. 검색된 SSR구간은 총 84,106 개로 assembly 된 전체 염기서열의 0.
0 software (Advanced Analytical Technologies, Ankeny, IA, USA) 프로그램을 이용하여 분석하였다. 이를 바탕으로, 결과 값이 뚜렷하고, PCR product의 증폭 길이가 예상되었던 수치와 비슷하며, 또한 2 개 이상의 밴드를 보이는 프라이머를 선별하였다.
선발된 마커를 수집된 자원에 적용하여 개발된 마커의 효율성을 검정하였다. 이를 위해서 선발된 프라이머를 총 23 개체에 각각 적용하였고, 증폭된 PCR 산물을 DNA Fragment Analyzer Automated CE System (Advanced Analytical Technologies, Ankeny, IA, USA)을 이용하여 분석하였다. 그 결과를 마커 분석 프로그램인 Power Marker software(Version 3.
대상 데이터
개발된 마커의 효율성을 검증하기 위하여 23 개체에 적용하여 얻은 총 263 개의 allele을 분석하였다. Frequency of major alleles (MAF)은 0.
본 실험의 NGS 분석에는 강원도 평창에서 수집된 유전자원 PC001에 속하는 한 개체를 임의로 선택하였으며, SSR마커의 효율성 검정과 유전다양성 분석을 위한 재료는 평창, 보은, 임실, 진안, 나주, 곡성, 화순 등 7 개 지역에서 뿌리를 수집 후 농촌진흥청 국립원예특작과학원 인삼특작부에서 증식한 총 23 유전자원을 사용하였다 (Table 1).
제작된 95 개의 프라이머 세트 중 5 개체를 이용하여 다형성을 조사한 결과 총 39 개의 프라이머 세트가 선발되었다(Table 4). 선발된 39 개의 프라이머 세트를 이용하여 23 개의 자원에서 유전적 다양성을 분석한 결과 allele의 수가 2 개에서 12 개로 나타나 명확한 다형성을 보였으며 (Table 5),이 SSR 프라이머 세트는 잔대 [Adenophora triphylla var.
탐색된 SSR 구간에서 서로 다른 SSR motif가 없도록 14,133 개의 SSR 프라이머를 설계하였으며, 이 중에서 임의로tri-nucleotide 31 개, tetra-nucleotide 40 개, penta-nucleotide 24 개를 포함한 총 95 개의 프라이머 세트를 제작하였다.
데이터처리
04의 SOAPec을 이용하여 error를 보정한 후 SOAPdenovo2를 이용하여 조합하였다. Microsatellites, transposable elements,rDNAs 등과 같은 반복서열은 RepeatMasker version 4.0.5과 RepeatModeler version 1.0.8 (http://www.repeatmasker.org/)을 이용하여 분석하였다. 또한 SSR Finder (ftp://ftp.
이를 위해서 선발된 프라이머를 총 23 개체에 각각 적용하였고, 증폭된 PCR 산물을 DNA Fragment Analyzer Automated CE System (Advanced Analytical Technologies, Ankeny, IA, USA)을 이용하여 분석하였다. 그 결과를 마커 분석 프로그램인 Power Marker software(Version 3.23) (Botstein et al., 1980; Liu and Muse 2005)를 이용하여 선발된 SSR 마커의 효율성을 분석하였다.
이론/모형
NGS는 Illumina Hiseq 2500 플랫폼 (Illumuna, SanDiego, CA, USA)을 이용하여 수행하였으며, 이를 통해 얻은 핵산조각을 Gil 등 (2017)의 방법에 따라 SOAPdenovo2 version 2.04의 SOAPec을 이용하여 error를 보정한 후 SOAPdenovo2를 이용하여 조합하였다. Microsatellites, transposable elements,rDNAs 등과 같은 반복서열은 RepeatMasker version 4.
PC; Gangwondo Pyeongchang-gun 2015, BE; Chungcheongbukdo Boeun-gun 2015, IS; Jeollabuk-do Imsil-gun 2016, JA; Jeollabuk-do Jinan-gun 2015, NJ;Jeollanam-do Naju-si 2016, GS; Jeollanam-doGokseong-gun 2015, HS; Jeollanam-do Hwasungun 2016. The genetic distances between strains were calculated based on the shared allelic methods(Jin and Chakraborty, 1994) using PowerMarkerv3.25 software. The values on each branch indicate the length of the branch.
성능/효과
39 개의 SSR마커를 이용하여 얻은 결과를 바탕으로 국내 각 지역에서 수집된 잔대 유전자원 23 개에서 유전자형을 분석하여 계통학적 분석을 한 결과 수집지역별로 그룹이 만들어지지 않고 섞여서 만들어지는 것을 알 수 있었다 (Fig. 1). 또한, 한 지역에서 수집된 자원이라도 다시 세부 그룹으로 나뉘어져, 잔대는 유전적으로 다양하다는 것을 잔대 유전체 정보를 바탕으로 개발된 SSR 마커를 이용하여 확인할 수 있었다.
개발된 마커의 효율성을 검증하기 위하여 23 개체에 적용하여 얻은 총 263 개의 allele을 분석하였다. Frequency of major alleles (MAF)은 0.17 - 0.87 (평균 0.46) 이었고, genotype number (GN)는 의 값은 2 - 18 (평균 9.9)였으며, heterozygosity(HE)는 0.23 - 0.88 (평균 0.68)이었다. Observed heterozygosity(HO)의 값은 0.
64)이었다. PIC 값이 가장 컸던 마커는 Atri00959였으며, 이 마커는 PIC값과 HE 뿐만 아니라 GN도 높게 나타났다 (Table 5). 위 결과를 바탕으로 적용된 39 개의 마커는 잔대의 유전자원 분석에 적합하다고 사료되었다.
연구에서는 Illumina Hiseq 2500 platform을 이용하여 염기서열 분석을 수행하였다. Paired-end sequencing 방법을 이용하여 총 342,487,502 개의 read를 포함하는 총 34.59Gbp의 염기서열 정보를 생산하였고, GC의 비율은 41.37%였다. 생산된 염기서열로부터 총 357,211 개의 scaffold를 얻었고, N50은 1,459 bp였다.
이렇게 얻어진 scaffold로부터 SSR 구간을 검색하고 primer를 제작하였다. 검색된 SSR구간은 총 84,106 개로 assembly 된 전체 염기서열의 0.73%를 차지하였으며, 그 중 dinucleotide가 70,497 개, tri-nucleotide가 9,998 개, tetranucleotide가 1,263 개, penta-nucleotide가 752 개, hexanucleotide가 757 개, hepta-nucleotide가 87 개를 차지하였다.(Table 2, Table 3).
또한, 한 지역에서 수집된 자원이라도 다시 세부 그룹으로 나뉘어져, 잔대는 유전적으로 다양하다는 것을 잔대 유전체 정보를 바탕으로 개발된 SSR 마커를 이용하여 확인할 수 있었다. 또한, 개발된 마커의 평균 PIC 값이 0.64인 것으로 볼 때 본 연구에서 개발된 잔대의 SSR 마커는 유전자형의 다양성을 확인하는데 우수한 마커임을 알 수 있었다.
1). 또한, 한 지역에서 수집된 자원이라도 다시 세부 그룹으로 나뉘어져, 잔대는 유전적으로 다양하다는 것을 잔대 유전체 정보를 바탕으로 개발된 SSR 마커를 이용하여 확인할 수 있었다. 또한, 개발된 마커의 평균 PIC 값이 0.
본 연구에서 개발된 SSR 마커는 잔대의 유전체 정보를 기반으로 한 것으로써, 잔대의 유전적 다양성을 염기서열 수준에서 밝히는데 매우 유용하다는 것을 알 수 있었다. 또한, 이를 이용하여 국내 잔대 유전자원의 다양성을 성공적으로 파악함으로써, 잔대의 체계적인 계통 분류 및 분자 육종에 필요한 기본적 자료를 제공하였다.
제작된 95 개의 프라이머 세트 중 5 개체를 이용하여 다형성을 조사한 결과 총 39 개의 프라이머 세트가 선발되었다(Table 4). 선발된 39 개의 프라이머 세트를 이용하여 23 개의 자원에서 유전적 다양성을 분석한 결과 allele의 수가 2 개에서 12 개로 나타나 명확한 다형성을 보였으며 (Table 5),이 SSR 프라이머 세트는 잔대 [Adenophora triphylla var. japonica (Regel) H. Hara]의 SSR 마커로 활용하기에 매우 적합하다고 판단되었다. 이들 마커의 motif 종류는 tri motif 11 개, tetra motif 17 개, penta motif 11 개 였으며, 결과적으로 motif 별로 고르게 마커가 개발되었음을 알 수 있었다.
PIC 값이 가장 컸던 마커는 Atri00959였으며, 이 마커는 PIC값과 HE 뿐만 아니라 GN도 높게 나타났다 (Table 5). 위 결과를 바탕으로 적용된 39 개의 마커는 잔대의 유전자원 분석에 적합하다고 사료되었다.
Hara]의 SSR 마커로 활용하기에 매우 적합하다고 판단되었다. 이들 마커의 motif 종류는 tri motif 11 개, tetra motif 17 개, penta motif 11 개 였으며, 결과적으로 motif 별로 고르게 마커가 개발되었음을 알 수 있었다.
후속연구
또한, 이를 이용하여 국내 잔대 유전자원의 다양성을 성공적으로 파악함으로써, 잔대의 체계적인 계통 분류 및 분자 육종에 필요한 기본적 자료를 제공하였다. 본 연구에서 개발된 마커는 앞으로 국내외 잔대 유전자원의 확보 및 다양성 분석, 우수 형질의 잔대 품종 개발에도 도움을 줄 것으로 사료된다.
질의응답
핵심어
질문
논문에서 추출한 답변
잔대란 무엇인가?
japonica (Regel) H.Hara]는 초롱꽃과에 속하는 타식성 식물이며 전 세계적으로 약 60 여 종이 분포하지만 주로 아시아권에서 자생하며 그 중 약 30 여 종이 우리나라에 자생하고 있는 것으로 알려져 있다(Lee et al., 2006).
잔대의 효능은 무엇인가?
, 1988; Lee, 1989). 예로부터 알려진 약용식물인 잔대 (사삼)의 효능은 주로 폐 기능에 도움을 주며, 강한 해독능력이 있다고 전해지고 있다 (Shin and Seo,2000).
약용식물에 대한 연구로 인해 최근 어떤 것이 대두되고 있는가?
현재까지 약용식물에 대한 연구는 물질분석을 통한 이차대사산물의 이용과 같은 성분에 대한 연구와 DNA barcode기법을 통한 종판별이나 randomly amplified polymorphic DNA(RAPD)를 이용한 유연관계 분석 등의 연구가 주로 이루어졌다. 최근 들어 한약재의 기원이 되는 식물에 대해 분자수준에서의 분류학적 연구가 활발해지고 있으며 유전정보의 중요성이 대두되면서 next generation sequencing (NGS)을 통한 유전체 분석 및 유전적 다양성분석과 이를 기초로 하는 분자육종의 필요성이 대두되고 있다 (Eu et al., 2009; Lee etal.
참고문헌 (26)
Botstein D, White RL, Skolnick M and Davis RW. (1980). Construction of a genetic linkage map in man using restriction fragment length polymorphisms. American Journal of Human Genetics. 32:314-331.
Cheon KS and Yoo KO. (2013). Phylogeny of Hanabusaya (Campanulaceae), a Korean endemic, based on ITS sequences of nuclear ribosomal DNA. Journal of Systematics and Evolution. 51:704-714.
Coburn JR, Temnykh SV, Paul EM and McCouch SR. (2002). Design and application of microsatellite marker panels for semiautomated genotyping of rice(Oryza sativa L.). Crop Science. 42:2092-2099.
Eddie WMM, Shulkina T, Gaskin J, Haberle RC and Jansen RK. (2003). Phylogeny of Campanulaceae S. Str. inferred from ITS sequences of nuclear ribosomal DNA. Annals of the Missouri Botanical Garden. 90:554-575.
Eu GS, Park MR and Yun SJ. (2009). Internal transcribed spacer(ITS) regions reveals phylogenic relationships of Rubus species cultivated in Korea. Korean Journal of Medicinal Crop Science. 17:165-172.
Gil J, Um Y, Kim S, Kim OT, Koo SC, Reddy CS, Kim SC, Hong CP, Park SG, Kim HB, Lee DH, Jeong BH, Chung JW and Lee Y. (2017). Development of genome-wide SSR markers from Angelica gigas Nakai using next generation sequencing. Genes. 8: 238. http://www.mdpi.com/2073-4425/8/10/238/htm (cited by 2017 Sep 18).
Jin L and Chakraborty R. (1994). Estimation of genetic distance and coefficient of gene diversity from single-probe multilocus DNA fingerprinting data. Molecular Biology and Evolution. 11:120-127.
Kim HK. (2016). Adenophora remotiflora protects human skin keratinocytes against UVB-induced photo-damage by regulating antioxidative activity and MMP-1 expression. Nutrition Research and Practice. 10:371-376.
Kim S, Jeong JH, Chung H, Kim JH, Gil J, Yoo J, Um Y, Kim OT, Kim TD, Kim YY, Lee DH, Kim HB and Lee Y. (2016). Simple sequence repeat marker development from Codonopsis lanceolata and genetic relation analysis. Journal of Plant Biotechnology. 43:181-188.
Kress WJ, Wurdack KJ, Zimmer EA, Weigt LA and Janzen DH. (2005). Use of DNA barcodes to identify flowering plants. Proceedings of the National Academy of Sciences of the United States of America. 102:8369-8374.
Lee DR, Lee YS, Choi BK, Lee HJ, Park SB, Kim TM, Oh HJ, Yang HY and Suh JW. (2015). Roots extracts of Adenophora triphylla var. japonica improve obesity in 3T3-L1 adipocytes and high-fat diet-induced obese mice. Asian Pacific Journal of Tropical Medicine. 8:898-906.
Lee JH, Jo IH, Lee JW, Park CG, Bang KH, Kim HS and Park CB. (2010). Molecular authentication of Scrophularia herbs by PCR-RFLP based on rpl-5 region of mitochondrial DNA. Korean Journal of Medicinal Crop Science. 18:173-179.
Lee JK. (1989). Taxonomy of the genus Adenophora (Adenophorae) in Korea. Master Thesis. Sungkyunkwan University. p.75.
Lee ST, Chung YJ and Lee JK. (1988). A palynotaxonomic study of the Korean Campanulaceae. Korean Journal of Plant Taxonomy. 18:115-131.
Lee SY, Lee SK, Lee JK, Kim KH and Lee SK. (2006). Cultural characteristics and genetic diversity of Rhizina undulata isolates by random amplified polymorphic DNA(RAPD). Journal of Korean Forestry Society. 95:388-392.
Liu KJ and Muse SV. (2005). PowerMarker: An integrated analysis environment for genetic marker analysis. Bioinformatics. 21:2128-2129.
McCouch SR, Chen X, Panaud O, Temnykh S, Xu Y, Cho YG, Huang N, Ishii T and Blair M. (1997). Microsatellite marker development, mapping and applications in rice genetics and breeding. Plant Molecular Biology. 35:89-99.
Nybom H. (2004). Comparison of different nuclear DNA markers for estimating intraspecific genetic diversity in plants. Molecular Ecology. 13:1143-1155.
Shin DH and Seo YB. (2000). Bibliographical studies on the shashen(Adenophora triphylla var. japonica Hara.). The Journal of Daejeon Oriental Medicine. 8:107-122.
Untergasser A, Cutcutache I, Koressaar T, Ye J, Faircloth BC, Remm M and Rozen SG. (2012). Primer3-new capabilities and interfaces. Nucleic Acids Research. 40:e115. https://doi.org/10.1093/nar/gks596 (cited by 2017 Jan 25).
UPOV-BMT. (2002). C/36/10 Progress report of the 36th session of the technical committee, the technical working parties and working group on biochemical and molecular techniques and DNA-profiling in particular. UPOV-BMT. Geneva, Switzerland. p.21-22.
Wang Z, Gerstein M and Snyder M. (2009). RNA-Seq: A revolutionary tool for transcriptomics. Nature Reviews Genetics. 10:57-63.
Weising K, Nybom H, Wolff K and Kahl G. (2005). DNA fingerprinting in plants: Principles, methods, and applications, second edition. CRC Press. Boca Raton. FL, USA. p.21-146.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.