차세대염기서열 빅데이터의 생물정보학적 분석을 통한 한국산 육산 연체동물 4종에 대한 유전체 및 전사체의 비교분석 연구 Genome and transcriptome characterization of the four Korean land snails using NGS and bioinformatics databases원문보기
본 연구는 우리나라에 서식하고 있는 육산 연체동물들 중에서 거제외줄달팽이 (Satsuma myomphala), 북한산달팽이 (Koreanohadra kurodana), 제주배꼽달팽이 (Aegista chejuensis) 제주배꼽털달팽이 (Aegista quelpartensis) 4종에 대한 NGS를 사용한 최초의 유전제 및 전사체 분석 연구이다. 거제외줄달팽이는 한국과 일본에 출현하는 동북아시아 특산종이지만, 국내에는 거제도의 한정된 곳에서만 출현하는 고립종이다. 반면에 북한산달팽이는 한국 고유 속 의 종이지만, 한반도 중북부 지역에 넓게 분포하는 특징을 보인다. 또한 배꼽달팽이속의 제주배꼽달팽이와 제주배꼽털달팽이는 제주도를 중심으로 한정된 지역에 분포하고 있다. 따라서 본 연구는 이러한 지리적 분포 특성을 지니는 육산 연체동물 4종을 대상으로 각 종의 ...
본 연구는 우리나라에 서식하고 있는 육산 연체동물들 중에서 거제외줄달팽이 (Satsuma myomphala), 북한산달팽이 (Koreanohadra kurodana), 제주배꼽달팽이 (Aegista chejuensis) 제주배꼽털달팽이 (Aegista quelpartensis) 4종에 대한 NGS를 사용한 최초의 유전제 및 전사체 분석 연구이다. 거제외줄달팽이는 한국과 일본에 출현하는 동북아시아 특산종이지만, 국내에는 거제도의 한정된 곳에서만 출현하는 고립종이다. 반면에 북한산달팽이는 한국 고유 속 의 종이지만, 한반도 중북부 지역에 넓게 분포하는 특징을 보인다. 또한 배꼽달팽이속의 제주배꼽달팽이와 제주배꼽털달팽이는 제주도를 중심으로 한정된 지역에 분포하고 있다. 따라서 본 연구는 이러한 지리적 분포 특성을 지니는 육산 연체동물 4종을 대상으로 각 종의 유전체 및 전사체 분석을 통하여 유전자원의 선점, 종의 보존을 위한 기초데이터 확보, 유용자원으로서의 기능유전자 탐색을 등을 진행하고자 하였다. 4종의 육산 연체동물을 채집하여 유전체 및 전사체 분석을 하기 위하여 DNA 및 RNA를 추출한 뒤 라이브러리를 구축하여 Illumina HiSeq 2500을 사용하여 시퀀싱하였다. 분석 결과 거제외줄달팽이 유전체에서 약 120 Gb의 raw 데이터와 1,255,442 개의 contigs, 전사체에서 약 33 Gb의 raw 데이터 및 103,774 개의 unigenes을 얻었다. 북한산달팽이 유전체에서는 약 31 Gb의 raw 데이터와 42,066 개의 contigs, 전사체에서는 약 30 GB의 raw 데이터와 191,071 개의 unigenes을 얻었다. 제주배꼽달팽이의 경우 유전체에서는 약 32 GB의 raw 데이터 및 258,618 개의 contigs를 얻었으며, 전사체에서는 약 32 Gb의 raw 데이터와 198,531 개의 unigenes을 확보하였다. 제주배꼽털달팽이 유전체 분석에서는 약 30 Gb의 raw 데이터와 245,566 개의 contigs를 얻었고, 전사체 분석에서는 약 30 Gb의 raw 데이터와 230,497 개의 unigenes 서열들을 확보하였다. 또한 이렇게 생산된 raw data 들은 NCBI SRA 에 등록을 완료하였다. Annotation 분석시간의 단축 등을 위하여 PANM 데이터베이스를 구축하였고 검증 결과 연체동물 NGS 데이터 분석에 있어서 좋은 데이터베이스로 활용이 될 것이라고 확인되었다. PANM 데이터베이스 및 공공 데이터베이스들을 활용하여 전사체의 unigenes에 대한 annotation 결과 거제외줄달팽이에서는 전체의 약 40%에 해당하는 41,670 개의 annotation 결과를 얻었고, 북한산달팽이에서는 약 36%, 69,303 개의 결과를 얻었다. 제주배꼽달팽이와 제주배꼽털달팽이의 경우 각각 약 35%, 69,088 개, 약 34%, 78,494 개의 annotation 결과를 확인하였다. 또한 KOG와 GO 를 이용하여 유전자들을 기능별로 분류하였으며, InterProScan, KEGG pathway 및 SSR 분석을 실시하였다. 그리고 환경적응과 관련된 유전자를 스크리닝하여 AMPK, HSP70, IRS1, TLR4, AQP2 등의 유전자를 확인하였다. 유전체분석 결과 유전체의 크기는 거제외줄달팽이가 약 4.9 Gb, 북한산달팽이 2.9 Gb, 제주배꼽달팽이 약 2.5 Gb, 제주배꼽털달팽이 약 2.2 Gb 로 예측되었다. Large contigs 에 대하여 반복서열 검색 및 SSR 분석을 실시하였으며, 유전자예측을 통하여 얻은 유전자에서 약 30% 이상의 annotation 결과를 얻을 수 있었다. 또한 예측된 유전자의 KOG 분석을 통하여 유전자를 기능별로 분류하였다. 본 연구 이후 추가적으로 deep sequencing 등을 통하여 더 많은 데이터를 축적하게 되면, 본 연구에 의해 얻어진 데이터들과 함께 분석하여 각 4종의 육산 연체동물의 유전체와 전사체와의 상관관계, 또는 다른 종들의 유전체 및 전사체와의 유연관계 등을 자세히 연구할 수 있을 것이다. 또한 본 연구의 데이터들은 많은 연구자들과 공유하여 이들 4종의 육산 연체동물에 연구에 있어서 매우 중요한 기초자료가 될 것이라 사료된다.
본 연구는 우리나라에 서식하고 있는 육산 연체동물들 중에서 거제외줄달팽이 (Satsuma myomphala), 북한산달팽이 (Koreanohadra kurodana), 제주배꼽달팽이 (Aegista chejuensis) 제주배꼽털달팽이 (Aegista quelpartensis) 4종에 대한 NGS를 사용한 최초의 유전제 및 전사체 분석 연구이다. 거제외줄달팽이는 한국과 일본에 출현하는 동북아시아 특산종이지만, 국내에는 거제도의 한정된 곳에서만 출현하는 고립종이다. 반면에 북한산달팽이는 한국 고유 속 의 종이지만, 한반도 중북부 지역에 넓게 분포하는 특징을 보인다. 또한 배꼽달팽이속의 제주배꼽달팽이와 제주배꼽털달팽이는 제주도를 중심으로 한정된 지역에 분포하고 있다. 따라서 본 연구는 이러한 지리적 분포 특성을 지니는 육산 연체동물 4종을 대상으로 각 종의 유전체 및 전사체 분석을 통하여 유전자원의 선점, 종의 보존을 위한 기초데이터 확보, 유용자원으로서의 기능유전자 탐색을 등을 진행하고자 하였다. 4종의 육산 연체동물을 채집하여 유전체 및 전사체 분석을 하기 위하여 DNA 및 RNA를 추출한 뒤 라이브러리를 구축하여 Illumina HiSeq 2500을 사용하여 시퀀싱하였다. 분석 결과 거제외줄달팽이 유전체에서 약 120 Gb의 raw 데이터와 1,255,442 개의 contigs, 전사체에서 약 33 Gb의 raw 데이터 및 103,774 개의 unigenes을 얻었다. 북한산달팽이 유전체에서는 약 31 Gb의 raw 데이터와 42,066 개의 contigs, 전사체에서는 약 30 GB의 raw 데이터와 191,071 개의 unigenes을 얻었다. 제주배꼽달팽이의 경우 유전체에서는 약 32 GB의 raw 데이터 및 258,618 개의 contigs를 얻었으며, 전사체에서는 약 32 Gb의 raw 데이터와 198,531 개의 unigenes을 확보하였다. 제주배꼽털달팽이 유전체 분석에서는 약 30 Gb의 raw 데이터와 245,566 개의 contigs를 얻었고, 전사체 분석에서는 약 30 Gb의 raw 데이터와 230,497 개의 unigenes 서열들을 확보하였다. 또한 이렇게 생산된 raw data 들은 NCBI SRA 에 등록을 완료하였다. Annotation 분석시간의 단축 등을 위하여 PANM 데이터베이스를 구축하였고 검증 결과 연체동물 NGS 데이터 분석에 있어서 좋은 데이터베이스로 활용이 될 것이라고 확인되었다. PANM 데이터베이스 및 공공 데이터베이스들을 활용하여 전사체의 unigenes에 대한 annotation 결과 거제외줄달팽이에서는 전체의 약 40%에 해당하는 41,670 개의 annotation 결과를 얻었고, 북한산달팽이에서는 약 36%, 69,303 개의 결과를 얻었다. 제주배꼽달팽이와 제주배꼽털달팽이의 경우 각각 약 35%, 69,088 개, 약 34%, 78,494 개의 annotation 결과를 확인하였다. 또한 KOG와 GO 를 이용하여 유전자들을 기능별로 분류하였으며, InterProScan, KEGG pathway 및 SSR 분석을 실시하였다. 그리고 환경적응과 관련된 유전자를 스크리닝하여 AMPK, HSP70, IRS1, TLR4, AQP2 등의 유전자를 확인하였다. 유전체분석 결과 유전체의 크기는 거제외줄달팽이가 약 4.9 Gb, 북한산달팽이 2.9 Gb, 제주배꼽달팽이 약 2.5 Gb, 제주배꼽털달팽이 약 2.2 Gb 로 예측되었다. Large contigs 에 대하여 반복서열 검색 및 SSR 분석을 실시하였으며, 유전자예측을 통하여 얻은 유전자에서 약 30% 이상의 annotation 결과를 얻을 수 있었다. 또한 예측된 유전자의 KOG 분석을 통하여 유전자를 기능별로 분류하였다. 본 연구 이후 추가적으로 deep sequencing 등을 통하여 더 많은 데이터를 축적하게 되면, 본 연구에 의해 얻어진 데이터들과 함께 분석하여 각 4종의 육산 연체동물의 유전체와 전사체와의 상관관계, 또는 다른 종들의 유전체 및 전사체와의 유연관계 등을 자세히 연구할 수 있을 것이다. 또한 본 연구의 데이터들은 많은 연구자들과 공유하여 이들 4종의 육산 연체동물에 연구에 있어서 매우 중요한 기초자료가 될 것이라 사료된다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.