NGS를 이용한 멸종위기종 귀이빨대칭이(Cristaria plicata) 전사체 데이터의 생물정보학적 분석 Bioinformatic analysis of transcriptome of the endangered freshwater pearl bivalve, Cristaria plicata using Next Generation Seqeuncer (NGS)원문보기
귀이빨대칭이(Cristaria plicata)는 석패목(Order Unionoida) 석패과(Family Unionidae)에 속하는 담수 이매패류 종으로 한국, 중국, 일본 등 동부아시아 지역에 분포하고 있는 종이다. 우리나라의 경우 인위적인 토지개발 및 환경오염에 의해 귀이빨대칭이의 서식지가 사라져가고 있으며, 환경부 멸종위기야생동물 1급으로 지정되어있다. ...
귀이빨대칭이(Cristaria plicata)는 석패목(Order Unionoida) 석패과(Family Unionidae)에 속하는 담수 이매패류 종으로 한국, 중국, 일본 등 동부아시아 지역에 분포하고 있는 종이다. 우리나라의 경우 인위적인 토지개발 및 환경오염에 의해 귀이빨대칭이의 서식지가 사라져가고 있으며, 환경부 멸종위기야생동물 1급으로 지정되어있다. 멸종위기종의 유전자원 발굴은 종 보존 연구에서 활용되어 질 수 있는 중요한 데이터이다. 본 연구에서는 귀이빨대칭이의 전사체를 분석하기 위하여 RNA를 추출한 후 cDNA를 합성하였고, 합성된 cDNA는 Next Generation Sequencer (NGS) 중 하나인 Illumina HiSeq 2500을 이용하여 sequencing하였다. Sequencing 후 de novo assembler 인 Trinity 프로그램과 TGICL 프로그램을 사용하여 unigene으로 assembly하였으며, unigene을 이용하여 생물정보학적 분석을 실시하였다. PANM database, KOG database, NCBI Unigene database를 통해 BLAST 프로그램을 이용하여 annotation을 실시하였으며, BLAST2GO software를 이용하여 GO 및 KEGG 분석과 단백질 도메인 분석을 실시하여 귀이빨대칭이의 발현유전자 특징과 유전자 기능분석을 하였다. 또한, 환경적응 유전자, 면역 관련 유전자, 성 결정 관련 유전자와 같은 유용 유전자의 발굴을 통해 귀이빨대칭이의 서식환경 연구 및 양식과 관련된 후속 연구의 기반을 마련하였다. 추가적으로 미토콘드리아에 존재하는 COI 유전자를 이용하여 계통분류학적 분석을 실시하였으며, microsatellite 마커 분석을 통해 종 판별에 사용할 수 있는 SSR 마커를 발굴하였다. Sequencing 결과 총 286,152,584개의 raw reads가 생산되었으며, assembly 및 clustering 결과 373,794개의 unigenes가 생성되었다. PANM database를 통한 unigenes의 BLAST 검색결과 79,960개의 unigenes가 매치되었으며, 가장 많이 검색된 종은 연체동물 중 연구가 가장 많이 진행되어진 굴(Crassostrea gigas)로 전체 40.78%를 차지하였다. KOG 분석을 실시한 결과 40,196개의 unigenes가 검색되었으며, signal transduction mechanisms 12.23%, post translational modification 8.19%과 관련 된 유전자가 많이 포함되는 것을 알 수 있다. GO 분석 결과 23,246개의 unigenes 서열에서 중복되는 annotation 결과를 포함하여 총 67,464개의 GO 분석결과를 얻었으며, GO terms group 중 binding (GO:0005488), catalytic activity (GO:0003824), cellular process (GO:0009987) group에서 많은 결과를 보였다. KEGG pathway database를 통해 생화학적 경로를 분석한 결과 4,776개의 unigenes가 pathway에 검색되었으며, nucleotide metabolism 1147개(24.02%), metabolism of cofactors and vitamins 951개(19.91%) 순으로 많은 결과가 도출되었다. Protein domain 검색 결과 132,299개의 unigenes에서 결과를 얻었으며, 세포에서 신호전달 및 전사조절 기능에 관여하는 Zinc finger domain과 신호전달, 가수분해, 전이효소 기능에 관여하는 P-loop containing nucleoside triphosphate hydrolase domain이 가장 많이 검색되었다. 유용유전자 검색결과 STRA6, COL1A1, HTNgene-MAP3K15 등의 환경적응유전자, Lectin, TIRs와 같은 면역관련 유전자, SOX, DMRT, Fem 등 성 결정 및 생식과 관련된 유전자들이 발굴되었다. NGS를 이용한 전사체분석을 통해 국내 멸종위기종인 귀이빨대칭이에서 대량의 유전자원을 발굴하였으며, 이러한 유전자원 데이터들은 종 보존 및 서식특성연구와 같은 후속 연구에서 중요한 기반이 될 것이다.
귀이빨대칭이(Cristaria plicata)는 석패목(Order Unionoida) 석패과(Family Unionidae)에 속하는 담수 이매패류 종으로 한국, 중국, 일본 등 동부아시아 지역에 분포하고 있는 종이다. 우리나라의 경우 인위적인 토지개발 및 환경오염에 의해 귀이빨대칭이의 서식지가 사라져가고 있으며, 환경부 멸종위기야생동물 1급으로 지정되어있다. 멸종위기종의 유전자원 발굴은 종 보존 연구에서 활용되어 질 수 있는 중요한 데이터이다. 본 연구에서는 귀이빨대칭이의 전사체를 분석하기 위하여 RNA를 추출한 후 cDNA를 합성하였고, 합성된 cDNA는 Next Generation Sequencer (NGS) 중 하나인 Illumina HiSeq 2500을 이용하여 sequencing하였다. Sequencing 후 de novo assembler 인 Trinity 프로그램과 TGICL 프로그램을 사용하여 unigene으로 assembly하였으며, unigene을 이용하여 생물정보학적 분석을 실시하였다. PANM database, KOG database, NCBI Unigene database를 통해 BLAST 프로그램을 이용하여 annotation을 실시하였으며, BLAST2GO software를 이용하여 GO 및 KEGG 분석과 단백질 도메인 분석을 실시하여 귀이빨대칭이의 발현유전자 특징과 유전자 기능분석을 하였다. 또한, 환경적응 유전자, 면역 관련 유전자, 성 결정 관련 유전자와 같은 유용 유전자의 발굴을 통해 귀이빨대칭이의 서식환경 연구 및 양식과 관련된 후속 연구의 기반을 마련하였다. 추가적으로 미토콘드리아에 존재하는 COI 유전자를 이용하여 계통분류학적 분석을 실시하였으며, microsatellite 마커 분석을 통해 종 판별에 사용할 수 있는 SSR 마커를 발굴하였다. Sequencing 결과 총 286,152,584개의 raw reads가 생산되었으며, assembly 및 clustering 결과 373,794개의 unigenes가 생성되었다. PANM database를 통한 unigenes의 BLAST 검색결과 79,960개의 unigenes가 매치되었으며, 가장 많이 검색된 종은 연체동물 중 연구가 가장 많이 진행되어진 굴(Crassostrea gigas)로 전체 40.78%를 차지하였다. KOG 분석을 실시한 결과 40,196개의 unigenes가 검색되었으며, signal transduction mechanisms 12.23%, post translational modification 8.19%과 관련 된 유전자가 많이 포함되는 것을 알 수 있다. GO 분석 결과 23,246개의 unigenes 서열에서 중복되는 annotation 결과를 포함하여 총 67,464개의 GO 분석결과를 얻었으며, GO terms group 중 binding (GO:0005488), catalytic activity (GO:0003824), cellular process (GO:0009987) group에서 많은 결과를 보였다. KEGG pathway database를 통해 생화학적 경로를 분석한 결과 4,776개의 unigenes가 pathway에 검색되었으며, nucleotide metabolism 1147개(24.02%), metabolism of cofactors and vitamins 951개(19.91%) 순으로 많은 결과가 도출되었다. Protein domain 검색 결과 132,299개의 unigenes에서 결과를 얻었으며, 세포에서 신호전달 및 전사조절 기능에 관여하는 Zinc finger domain과 신호전달, 가수분해, 전이효소 기능에 관여하는 P-loop containing nucleoside triphosphate hydrolase domain이 가장 많이 검색되었다. 유용유전자 검색결과 STRA6, COL1A1, HTNgene-MAP3K15 등의 환경적응유전자, Lectin, TIRs와 같은 면역관련 유전자, SOX, DMRT, Fem 등 성 결정 및 생식과 관련된 유전자들이 발굴되었다. NGS를 이용한 전사체분석을 통해 국내 멸종위기종인 귀이빨대칭이에서 대량의 유전자원을 발굴하였으며, 이러한 유전자원 데이터들은 종 보존 및 서식특성연구와 같은 후속 연구에서 중요한 기반이 될 것이다.
The freshwater mussel Cristaria plicata (Order Unionoida, Family Unionidae) has been assessed as Endangered and Data Deficient by the Korean Red List (KORED) of Threatened Species and International Union for Conservation of Nature and Natural Resources (IUCN) Red List of Threatened species, respecti...
The freshwater mussel Cristaria plicata (Order Unionoida, Family Unionidae) has been assessed as Endangered and Data Deficient by the Korean Red List (KORED) of Threatened Species and International Union for Conservation of Nature and Natural Resources (IUCN) Red List of Threatened species, respectively. The number of individuals been dwindling in recent times, due to indiscriminate collection of specimens and loss of natural habitats. In order to understand the strategic indices for the conservation of the species, we conducted de novo transcriptome sequencing, assembly, and annotation analysis using Illumina HiSeq2500 Next Generation Sequencer (NGS), Trinity assembler, and BLAST2GO analysis, respectively. Furthermore, the candidate genes putatively related to environmental adaptation, immunity, and reproduction were identified from the assembled sequences. Additionally, phylogenetic analysis was performed using the mitochondrial Cytochrome c oxidase subunit I (COI) gene and Simple Sequence Repeats (SSR) markers were generated that may assist in genetic typing and polymorphism studies. The Illumina sequencing obtained 98.31% of high-quality reads from a total of 286,152,584 raw read sequences. The assembly generated a total of 453,931 contigs having a mean length and N50 length of 731.2 and 1,254 bp, respectively. The contig sequences were clustered to 374,794 unigenes with a mean length of 737.1 bp and N50 length of 1,262 bp. We found a 100% coverage of C. plicata mitochondrial genes within two assembled unigenes of C. plicata. The BLAST top-hit distribution of unigenes against PANM (Protostome DB) database (79,960 hits) showed maximum homology to other molluscs. The KOG annotation suggested the maximum preference of the assembled unigenes towards ‘Cellular Processes and Signaling mechanisms’ with a total of 4,916 sequences belonging to the signal transduction mechanism category. Useful gene search analysis (from BLAST2GO and manual annotation) resulted in identification of environmental adaptation-related genes such as STRA6, COL1A1, HTNgene-MAP3K15, immune-related genes such as Lectin, TIRs, and Sex-determination-related genes such as SOX, DMRT, Fem, etc. The comprehensive dataset provides beneficial resource for protection of the species in its natural habitat and further discovery of functional transcripts using gene-targeted approach.
The freshwater mussel Cristaria plicata (Order Unionoida, Family Unionidae) has been assessed as Endangered and Data Deficient by the Korean Red List (KORED) of Threatened Species and International Union for Conservation of Nature and Natural Resources (IUCN) Red List of Threatened species, respectively. The number of individuals been dwindling in recent times, due to indiscriminate collection of specimens and loss of natural habitats. In order to understand the strategic indices for the conservation of the species, we conducted de novo transcriptome sequencing, assembly, and annotation analysis using Illumina HiSeq2500 Next Generation Sequencer (NGS), Trinity assembler, and BLAST2GO analysis, respectively. Furthermore, the candidate genes putatively related to environmental adaptation, immunity, and reproduction were identified from the assembled sequences. Additionally, phylogenetic analysis was performed using the mitochondrial Cytochrome c oxidase subunit I (COI) gene and Simple Sequence Repeats (SSR) markers were generated that may assist in genetic typing and polymorphism studies. The Illumina sequencing obtained 98.31% of high-quality reads from a total of 286,152,584 raw read sequences. The assembly generated a total of 453,931 contigs having a mean length and N50 length of 731.2 and 1,254 bp, respectively. The contig sequences were clustered to 374,794 unigenes with a mean length of 737.1 bp and N50 length of 1,262 bp. We found a 100% coverage of C. plicata mitochondrial genes within two assembled unigenes of C. plicata. The BLAST top-hit distribution of unigenes against PANM (Protostome DB) database (79,960 hits) showed maximum homology to other molluscs. The KOG annotation suggested the maximum preference of the assembled unigenes towards ‘Cellular Processes and Signaling mechanisms’ with a total of 4,916 sequences belonging to the signal transduction mechanism category. Useful gene search analysis (from BLAST2GO and manual annotation) resulted in identification of environmental adaptation-related genes such as STRA6, COL1A1, HTNgene-MAP3K15, immune-related genes such as Lectin, TIRs, and Sex-determination-related genes such as SOX, DMRT, Fem, etc. The comprehensive dataset provides beneficial resource for protection of the species in its natural habitat and further discovery of functional transcripts using gene-targeted approach.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.