볼티모어의 분류체계에 의하면 바이러스는 복제 및 단백질합성 전략에 따라 6개의 집단으로나눌 수 있다. 몇 종류의 작은 DNA 바이러스를 제외한 대부분의 바이러스는 게놈 복제를 위한 자신의 핵산중합효소를 유전자로 암호화하고 있다. 바이러스 핵산중합효소에는 DNA-의존DNA 중합효수, RNA-의존RNA 중합효소, RNA-의존 DNA 중합효소 세 종류가 있으며, 이들은 모두 4개의 공통된 모티프(motif)를 가진다. 우리는 볼티모어의 분류체계와 바이러스의 핵산중합효소와의 관계를 아미노산 서열을 통해 분자 계통분류학적 분석을 통해 알아보고자 하였다. NCBI GenBank에서 얻은 바이러스 중합효소의 아미노산 서열을 CLUSTAL X 프로그램으로 다중서열하고, Neighbor-joining, Maximum-likelihood, Bayesian의 세 가지 방법으로 계통도를 그려보았다. 미세한 차이는 있었으나, 세 가지 방법 모두에서 볼티모어의 분류법과 일치하는 결과를 보였고, 특이하게도 두 가닥 RNA 바이러스는 숙주의 종류에 따라, (-)RNA 바이러스는 게놈의 절편화에 따라 각각2개의 소집단으로 나뉘어지는 것을 볼 수 있었다.
볼티모어의 분류체계에 의하면 바이러스는 복제 및 단백질합성 전략에 따라 6개의 집단으로나눌 수 있다. 몇 종류의 작은 DNA 바이러스를 제외한 대부분의 바이러스는 게놈 복제를 위한 자신의 핵산중합효소를 유전자로 암호화하고 있다. 바이러스 핵산중합효소에는 DNA-의존DNA 중합효수, RNA-의존RNA 중합효소, RNA-의존 DNA 중합효소 세 종류가 있으며, 이들은 모두 4개의 공통된 모티프(motif)를 가진다. 우리는 볼티모어의 분류체계와 바이러스의 핵산중합효소와의 관계를 아미노산 서열을 통해 분자 계통분류학적 분석을 통해 알아보고자 하였다. NCBI GenBank에서 얻은 바이러스 중합효소의 아미노산 서열을 CLUSTAL X 프로그램으로 다중서열하고, Neighbor-joining, Maximum-likelihood, Bayesian의 세 가지 방법으로 계통도를 그려보았다. 미세한 차이는 있었으나, 세 가지 방법 모두에서 볼티모어의 분류법과 일치하는 결과를 보였고, 특이하게도 두 가닥 RNA 바이러스는 숙주의 종류에 따라, (-)RNA 바이러스는 게놈의 절편화에 따라 각각2개의 소집단으로 나뉘어지는 것을 볼 수 있었다.
According to the Baltimore Scheme, viruses are classified into 6 main classes based on their replication and coding strategies. Except for some small DNA viruses, most viruses code for their own polymerases: DNA-dependent DNA, RNA-dependent RNA and RNA-dependent DNA polymerases, all of which contain...
According to the Baltimore Scheme, viruses are classified into 6 main classes based on their replication and coding strategies. Except for some small DNA viruses, most viruses code for their own polymerases: DNA-dependent DNA, RNA-dependent RNA and RNA-dependent DNA polymerases, all of which contain 4 common motifs. We undertook a phylogenetic study to establish the relationship between the Baltimore Scheme and viral polymerases. Amino acid sequence data sets of viral polymerases were taken from NCBI GenBank, and a multiple alignment was performed with CLUSTAL X program. Phylogenetic trees of viral polymerases constructed from the distance matrices were generally consistent with Baltimore Scheme with some minor exceptions. Interestingly, negative RNA viruses (Class V) could be further divided into 2 subgroups with segmented and non-segmented genomes. Thus, Baltimore Scheme for viral taxonomy could be supported by phylogenetic analysis based on the amino acid sequences of viral polymerases.
According to the Baltimore Scheme, viruses are classified into 6 main classes based on their replication and coding strategies. Except for some small DNA viruses, most viruses code for their own polymerases: DNA-dependent DNA, RNA-dependent RNA and RNA-dependent DNA polymerases, all of which contain 4 common motifs. We undertook a phylogenetic study to establish the relationship between the Baltimore Scheme and viral polymerases. Amino acid sequence data sets of viral polymerases were taken from NCBI GenBank, and a multiple alignment was performed with CLUSTAL X program. Phylogenetic trees of viral polymerases constructed from the distance matrices were generally consistent with Baltimore Scheme with some minor exceptions. Interestingly, negative RNA viruses (Class V) could be further divided into 2 subgroups with segmented and non-segmented genomes. Thus, Baltimore Scheme for viral taxonomy could be supported by phylogenetic analysis based on the amino acid sequences of viral polymerases.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이러한 핵산중합효소의 공통 모티프를 통한 서열 분석은 바이러스의 진화와 계통분류에 대한 우리의 지식을 재정립하고 확장 시킬 수 있다고 생각한다. 본 연구에서는 RdRp, RdDp, DdDp (DNA-의존 DNA 중합효소)를 가진 바이러스의 중합효소 아미노산 서열을 통하여 계통을 분석하고 볼티모어 분류와의 관계를 알아보고자 하였다.
제안 방법
Class V 바이러스만을 대상으로 분석해본 결과 세 가지 방법에서 모두 동일하게 두 개의 소집단을 형성하였기에 BA 계통수만을 결과로 제시하였다(Fig. 3). 절편화 게놈을 가지는 Va 바이러스의 계통수 형태를 보면, 하나는 OrthomyxoviridaeS.
gov/)로부터 얻었다(Table 1). 선정된 바이러스는 각 바이러스의 참고서열과 웹 상으로 구조가 제공되는 바이러스를 기준으로 하였다.
않았다. 이미 보고된 RdRp와 RdDp의 공통 모티프와 NCBI의 CDD와 ExPASy의 PROSITE를 이용하여 palm domain 의 네 부분(A, B, C, D)의 공통 모티프 부분을 재정렬하였다. Figure 1은 볼티모어 분류체계의 Class 중 대표적인 바이러스의 아미노산 서열을 공통 모티프로 재정렬한 것이다.
81 (23)을 사용하여다중정렬 하였다. 정렬 후 계통수의 표식(phylogenetic marker)으로 이용되는 RNA 바이러스의 RdRp palm domain (26)을 대상으로 RdRp 와 RdDp 의 공통 모티프(19), NCBI 의 CDD (Conserved Domain Database, http://www.ncbi.nlm.nih.gov/entrez/ queiy.fcgi?db =cdd)와 ExPASy (http://cn.expasy.org/)의 PROSTTE 에 제공되는 MotifScan tool (7)을 이용하여 모티프를 재 정렬하였다.
대상 데이터
Bayesian (BA) 방법으로 작성한 계통수는 MrBayes 프로그램(12)의 Jones 모델을 사용하였으며, 4 Markov chain으로 각각 1,000, 000회 반복하였다. 1,000회 반복마다 파일을 받았고, 300개의 계통수를 버리고, 700개의 계통수를 얻었다. 이 700개의 계통수를 가지고가장 많은 수의 공통 계통수로부터 하나의 계통수를 작성하였다.
바이러스 분류에 관한 국제 위원회 데이터베이스(http:〃www. ncbi.nlm.nih.gov/ICTVdb/index.htm)로부터 볼티모어 분류체계에 의한 대표적인 Family (-viridae)에 속하는 바이러스를 기준으로 바이러스를 선정하였다. 볼티모어의 분류 중 전적으로 숙주의 핵산 중합 효소를 이용하는 ssDNA (ClassII)를 제외하고, 111 바이러스의 RdRp, 12 바이러스의 RdDp, 22 바이러스의 DdDp 아미노산 서열을 NCBI의 GenBank (http://www.
htm)로부터 볼티모어 분류체계에 의한 대표적인 Family (-viridae)에 속하는 바이러스를 기준으로 바이러스를 선정하였다. 볼티모어의 분류 중 전적으로 숙주의 핵산 중합 효소를 이용하는 ssDNA (ClassII)를 제외하고, 111 바이러스의 RdRp, 12 바이러스의 RdDp, 22 바이러스의 DdDp 아미노산 서열을 NCBI의 GenBank (http://www.ncbi.nlm.nih.gov/)로부터 얻었다(Table 1). 선정된 바이러스는 각 바이러스의 참고서열과 웹 상으로 구조가 제공되는 바이러스를 기준으로 하였다.
데이터처리
분석 대상 바이러스가 가지고 있는 세 종류 핵산 중합 효소의 아미노산 서열을 CLUSTAL X program v.1.81 (23)을 사용하여다중정렬 하였다. 정렬 후 계통수의 표식(phylogenetic marker)으로 이용되는 RNA 바이러스의 RdRp palm domain (26)을 대상으로 RdRp 와 RdDp 의 공통 모티프(19), NCBI 의 CDD (Conserved Domain Database, http://www.
거리행렬은 PHYLIP package (8)의 PROTDIST 프로그램 중 JTT (Jones-Taylor-Thomton) 모델로 계산하였다. 이 거리행렬을 바탕으로 Neighbor-joining 프로그램을 사용하여 계통수를 작성하였다. Maximum-likelihood (ML) 방법 역시 PHYLIP package의 PROML 프로그램의 JTT 모델을 사용하여 계통수를 작성하였다.
이론/모형
maximum-likeHhood (B) and Bayesian (C) methods. Amino acid sequences of viral polymerases were multiple-aligned by CLUSTAL X and phylogenic trees were constructed using JTT (Jones-Taylor-Thomton) model of sequence evolution. The viruses used in this study and their NCBI GenBank accession numbers arelisted in Table 1.
Maximum-likelihood (ML) 방법 역시 PHYLIP package의 PROML 프로그램의 JTT 모델을 사용하여 계통수를 작성하였다. Bayesian (BA) 방법으로 작성한 계통수는 MrBayes 프로그램(12)의 Jones 모델을 사용하였으며, 4 Markov chain으로 각각 1,000, 000회 반복하였다. 1,000회 반복마다 파일을 받았고, 300개의 계통수를 버리고, 700개의 계통수를 얻었다.
이 거리행렬을 바탕으로 Neighbor-joining 프로그램을 사용하여 계통수를 작성하였다. Maximum-likelihood (ML) 방법 역시 PHYLIP package의 PROML 프로그램의 JTT 모델을 사용하여 계통수를 작성하였다. Bayesian (BA) 방법으로 작성한 계통수는 MrBayes 프로그램(12)의 Jones 모델을 사용하였으며, 4 Markov chain으로 각각 1,000, 000회 반복하였다.
Neighbor-joining (NJ) 방법으로 재정렬한 palm domain 모티프 (562 아미노산)의 거리행렬(distance matrix)을 작성하였다. 거리행렬은 PHYLIP package (8)의 PROTDIST 프로그램 중 JTT (Jones-Taylor-Thomton) 모델로 계산하였다.
거리행렬은 PHYLIP package (8)의 PROTDIST 프로그램 중 JTT (Jones-Taylor-Thomton) 모델로 계산하였다. 이 거리행렬을 바탕으로 Neighbor-joining 프로그램을 사용하여 계통수를 작성하였다.
성능/효과
, 또 다른 하나는 Burryaviridae/Arenaviridaw로 두 개의 주요 계열로의 독립적 진화를 볼 수 있다. Vb 바이러스의 경우 계통도의 형태가 Paramyxoviridae가 paraphyletic taxon인 것을 제외하고는 과와아과로 taxonomic grouping됨을 알 수 있었다. Paramyxoviridae 의 경우 아과인 Pneumovirinae?} 다른 아과인 Filoviridae와 더욱 가까운 관계를 보였고, Bomaviridae, Rha湖loviridae 와 Paramyxoviridae 사이의 관계는 알 수 없었다.
Vb 바이러스의 경우 계통도의 형태가 Paramyxoviridae가 paraphyletic taxon인 것을 제외하고는 과와아과로 taxonomic grouping됨을 알 수 있었다. Paramyxoviridae 의 경우 아과인 Pneumovirinae?} 다른 아과인 Filoviridae와 더욱 가까운 관계를 보였고, Bomaviridae, Rha湖loviridae 와 Paramyxoviridae 사이의 관계는 알 수 없었다.
모든 분석 방법에서 Class V (-ssRNA 바이러스)의 경우 게놈의 구성에 따라 절편화 게놈(segmented genome)과 비절편화 게놈 (non-segmented genome)의 두 소집단으로 분리됨을 알 수 있었다. Class V 바이러스만을 대상으로 분석해본 결과 세 가지 방법에서 모두 동일하게 두 개의 소집단을 형성하였기에 BA 계통수만을 결과로 제시하였다(Fig.
모든 분석 방법에서 Class V (-ssRNA 바이러스)의 경우 게놈의 구성에 따라 절편화 게놈과 비절편화 게놈의 두 소집단으로 분리됨을 알 수 있었다. 절편화 게놈을 가지는 Class S에서 하나는 OrthomyxoviridaeS-, 또 다른 하나는 Bimyaviridae/Arenaviridae로 두 개의 주요 계열로의 독립적 진화를 볼 수 있다.
Figure 1은 볼티모어 분류체계의 Class 중 대표적인 바이러스의 아미노산 서열을 공통 모티프로 재정렬한 것이다. 모든 핵산 중합 효소는 네 부분의 공통 모티프를 가지고 있었으며, DdDp (Class I), RdRp (Class Ⅲ, Class IV, Class V) 그리고 RdDp (Class VI) 별로 각각의 다른 공통 서 열을 가지고 있음을 알 수 있었다.
세 핵산중합효소 palm domain의 공통 모티프 부분으로 세 가지 방법의 계통수를 구성한 결과, 몇몇을 제외하고 대부분 볼티모어 분류체계의 Class별로 클러스터를 형성함을 알 수 있었다. Class HI (dsRNA 바이러스)의 경우, Class IV (+ssRNA 바이러스) 내에 그룹이 형성되었고 이를 통해, dsRNA 바이러스가 +ssRNA 바이러스로부터 진화되었다고 추측할 수 있다.
참고문헌 (26)
Biswal, B.K., M.M. Cherney, M. Wang, L. Chan, C.G. Yannopoulos, D. Bilimoria, O. Nicolas, J. Bedard, and M.N. James. 2005. Crystal structures of the RNA-dependent RNA polymerase genotype 2a of hepatitis C virus reveal two conformations and suggest mechanisms of inhibition by non-nucleoside inhibitors. J. Biol. Chem. 280, 18202-18210
Dolja, V.V. and J.C. Carrington. 1992. Evolution of positive-strand RNA viruses. Sem. Virol. 3, 315-326
Falquet, L., M. Pagni, P. Bucher, N. Hulo, C.J. Sigrist, K. Hofmann, and A. Bairoch. 2002. The PROSITE database, its status in 2002. Nucleic Acids Res. 30, 235-238
Felsenstein, J. 2002. PHYLIP (Phylogeny Inference Package) Version 3.6a3. Distributed by the author. Department of Genome Sciences, University of Washington, Seattle, USA
Francki, R.I.B., C.M. Fauquet, D.L. Knudson, and F. Brown. 1991. Virus taxonomy. Classification and nomenclature of Viruses. Fifth report of the international committee on taxonomy of viruses
Goldbach, R. and J. Wellink. 1988. Evolution of plus-strand RNA viruses. Intervirology 29, 260-267
Habili, N. and R.H. Symons. 1989. Evolutionary relationship between luteoviruses and other RNA plant viruses based on sequence motifs and their putative RNA polymerases and nucleic acid helicases. Nucleic Acids Res. 17, 9543-9555
Huelsenbeck, J.P. and F. Ronquist. Command reperence for MrBayes ver. 3.0B4, Serial Version. Department of Biology, University of Rochester, USA
Hugot, J.P., J.P. Gonzalez, and C. Denys. 2001. Evolution of the old world arenaviridae and their rodent hosts: generalized hosttransfer or association by descent? Infect. Genet. Evol. 2, 1-8
Iyer, L.M., E.V. Koonin, and L. Aravind. 2003. Evolutionary connection between the catalytic subunits of DNA-dependent RNA polymerases and eukaryotic RNA-dependent RNA polymerases and the origin of RNA polymerases. BMC Structural Biol. 3, 1
Ng, K.K., N. Pendas-Franco, J. Rojo, J.A. Boga, A. Machin, J.M. Alonso, and F. Parra. 2004. Crystal structure of Norwalk virus polymerase reveals the carboxyl terminus in the active site cleft. J. Biol. Chem. 279, 16638-16645
Poch, O., I. Sauvaget, M. Delarue, and N. Torodo. 1989. Identification of four conserved motifs among the RNA-dependent polymerase encoding elements. EMBO J. 8, 3867-3874
Rybicki, E.P. 1990. The classification of organisms at the edge of life, or problems with virus systematics. South African J. Sci. 86, 182-186
Shwed, P.S., P. Dobos, L.A. Cameron, V.N. Vakharia, and R. Duncan. 2002. Birnavirus VP1 proteins from a distinct subgroup of RNA-dependent RNA polymerases lacking a GDD motif. Virology 296, 241-250
Thompson, J.D., T.J. Gibson, F. Plewniak, F. Jeanmougin, and D.G. Higgins. 1997. The CLUSTAL X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Res. 25, 4876-4882
Zanotto, P.M., M.J. Gibbs, E.A. Gould, and E.C. Holmes. 1996. A reevaluation of the higher taxonomy of viruses based on RNA polymerases. J. Virol. 70, 6083-6096
※ AI-Helper는 부적절한 답변을 할 수 있습니다.