차세대 염기서열분석(NGS)을 이용한 멸종위기종 붉은점모시나비(Parnassius bremeri) 전사체 데이터의 생물정보학적 분석 Bioinformatic analysis of transcriptome data of endangered species Parnassius bremeri using next-generation sequencing원문보기
본 연구는 한국의 멸종위기 야생생물 Ⅰ급으로 지정된 붉은점모시나비(Parnassius bremeri) 수컷 개체의 전사체를 차세대 염기서열분석 장비인 Illumina HiSeq 2500을 사용하여 분석한 연구이다. 붉은점모시나비는 한국에서만 멸종위기로 평가된 종으로, 소멸하기 전에 전사체 데이터를 분석하기 위하여 본 연구를 진행하였다. 붉은점모시나비(Parnassius bremeri)의 전사체 서열을 분석하기 위해 채집한 시료에서 RNA를 추출하여 RNA sequencing을 하였다. 염기서열분석 결과 약 400억 bp(base pair)의 염기서열로 구성된 paired-end sequencing data를 얻었으며, 해당 서열 데이터를 참조 서열 없이 조립하기 위하여 de novo assembly를 통해 304,236개의 contig를 생성하였다. Unigene을 생성하기 위하여 클러스터링(clustering)한 결과 N50 1,580 bp, 평균 길이 952.5 bp의 70,558개 unigene을 생성하였다. 생성된 unigene의 ...
본 연구는 한국의 멸종위기 야생생물 Ⅰ급으로 지정된 붉은점모시나비(Parnassius bremeri) 수컷 개체의 전사체를 차세대 염기서열분석 장비인 Illumina HiSeq 2500을 사용하여 분석한 연구이다. 붉은점모시나비는 한국에서만 멸종위기로 평가된 종으로, 소멸하기 전에 전사체 데이터를 분석하기 위하여 본 연구를 진행하였다. 붉은점모시나비(Parnassius bremeri)의 전사체 서열을 분석하기 위해 채집한 시료에서 RNA를 추출하여 RNA sequencing을 하였다. 염기서열분석 결과 약 400억 bp(base pair)의 염기서열로 구성된 paired-end sequencing data를 얻었으며, 해당 서열 데이터를 참조 서열 없이 조립하기 위하여 de novo assembly를 통해 304,236개의 contig를 생성하였다. Unigene을 생성하기 위하여 클러스터링(clustering)한 결과 N50 1,580 bp, 평균 길이 952.5 bp의 70,558개 unigene을 생성하였다. 생성된 unigene의 기능 분석을 위해 BLAST에 사용할 데이터베이스를 선정하였고, 선정된 데이터베이스를 통해 32,460개 unigene의 주석 결과를 생성하였다. 절지동물문(Arthropoda) 데이터를 포함하는 PANM DB에서 전체 unigene의 24.8%에 해당하는 17,490개의 주석 결과를 생성하였고, 해당 결과의 종 분포를 분석한 결과 붉은점모시나비(Parnassius bremeri)와 같은 호랑나비과(Papilionidae)의 호랑나비(apilio xuthus)가 가장 많았다. Unigene의 추가적인 기능 분석을 위해 BLAST 결과를 KOG(eukaryotic orthologous groups) 범주로 분류하고 GO(Gene Ontology) 분석과 KEGG (Kyoto Encyclopedia of Genes and Genomes) pathway 분석을 진행하였다. KOG 분류는 26개의 범주로 15,422개의 unigene을 분류하였고, GO 분석 결과로 24,018개의 GO term 결과를 생성하였으며, KEGG pathway 분석 결과는 102개 경로의 203개 효소가 확인되었다. 또한, 종 특이적 마커 후보를 발굴하기 위해 SSR(Simple Sequence Repeat)을 분석한 결과 4,658개의 SSR을 발굴하였다. 본 연구에서 생성한 수컷 성체의 raw data, unigene, 주석 정보, SSR 마커 후보는 기후변화의 지표가 될 수 있는 종의 서열정보와 유전자의 기능 정보를 담고 있는 데이터로 후속 연구에 기초 자료로 활용될 가능성이 있다. 또한, 본 연구의 대용량 데이터는 유전자원 주권 확보를 가능하게 하고 대용량 공공 데이터베이스 구축의 필요 배경과 구축될 데이터베이스의 기반 자료가 될 수 있을 것으로 사료된다.
본 연구는 한국의 멸종위기 야생생물 Ⅰ급으로 지정된 붉은점모시나비(Parnassius bremeri) 수컷 개체의 전사체를 차세대 염기서열분석 장비인 Illumina HiSeq 2500을 사용하여 분석한 연구이다. 붉은점모시나비는 한국에서만 멸종위기로 평가된 종으로, 소멸하기 전에 전사체 데이터를 분석하기 위하여 본 연구를 진행하였다. 붉은점모시나비(Parnassius bremeri)의 전사체 서열을 분석하기 위해 채집한 시료에서 RNA를 추출하여 RNA sequencing을 하였다. 염기서열분석 결과 약 400억 bp(base pair)의 염기서열로 구성된 paired-end sequencing data를 얻었으며, 해당 서열 데이터를 참조 서열 없이 조립하기 위하여 de novo assembly를 통해 304,236개의 contig를 생성하였다. Unigene을 생성하기 위하여 클러스터링(clustering)한 결과 N50 1,580 bp, 평균 길이 952.5 bp의 70,558개 unigene을 생성하였다. 생성된 unigene의 기능 분석을 위해 BLAST에 사용할 데이터베이스를 선정하였고, 선정된 데이터베이스를 통해 32,460개 unigene의 주석 결과를 생성하였다. 절지동물문(Arthropoda) 데이터를 포함하는 PANM DB에서 전체 unigene의 24.8%에 해당하는 17,490개의 주석 결과를 생성하였고, 해당 결과의 종 분포를 분석한 결과 붉은점모시나비(Parnassius bremeri)와 같은 호랑나비과(Papilionidae)의 호랑나비(apilio xuthus)가 가장 많았다. Unigene의 추가적인 기능 분석을 위해 BLAST 결과를 KOG(eukaryotic orthologous groups) 범주로 분류하고 GO(Gene Ontology) 분석과 KEGG (Kyoto Encyclopedia of Genes and Genomes) pathway 분석을 진행하였다. KOG 분류는 26개의 범주로 15,422개의 unigene을 분류하였고, GO 분석 결과로 24,018개의 GO term 결과를 생성하였으며, KEGG pathway 분석 결과는 102개 경로의 203개 효소가 확인되었다. 또한, 종 특이적 마커 후보를 발굴하기 위해 SSR(Simple Sequence Repeat)을 분석한 결과 4,658개의 SSR을 발굴하였다. 본 연구에서 생성한 수컷 성체의 raw data, unigene, 주석 정보, SSR 마커 후보는 기후변화의 지표가 될 수 있는 종의 서열정보와 유전자의 기능 정보를 담고 있는 데이터로 후속 연구에 기초 자료로 활용될 가능성이 있다. 또한, 본 연구의 대용량 데이터는 유전자원 주권 확보를 가능하게 하고 대용량 공공 데이터베이스 구축의 필요 배경과 구축될 데이터베이스의 기반 자료가 될 수 있을 것으로 사료된다.
주제어
#유전자원 멸종위기 동물 붉은점모시나비 전사체 생물정보학 NGS RNA Sequencing
※ AI-Helper는 부적절한 답변을 할 수 있습니다.