Park, Jun-Hyung
(Busan Genome Center, College of Medicine, Pusan National University)
,
Kang, Byeong-Chul
(Devision of Applied Bioengineering, Dongseo University)
,
Park, Hee-Kyung
(Busan Genome Center, College of Medicine, Pusan National University)
,
Jang, Hyun-Jung
(Institute for Genomics Medicine, GeneIn. Co., Ltd.)
,
Song, Eun-Sil
(Institute for Genomics Medicine, GeneIn. Co., Ltd.)
,
Lee, Seung-Won
(Busan Genome Center, College of Medicine, Pusan National University)
,
Kim, Hyun-Jin
(Busan Genome Center, College of Medicine, Pusan National University)
,
Kim, Cheol-Min
(Busan Genome Center, College of Medicine, Pusan National University)
모든 생명체의 genetic information에는 보존적 염기서열과 다형적 염기서열이 존재한다. 다형적 염기서열과 보존적 염기서열은 하나의 종(species)을 감별하거나, 여러 종류의 종을 동시에 감별할 수 있는 genotyping의 표지자로 각각 이용될 수 있다. 본 논문은 병원성 감염질환 세균, 식중독 유발 세균, 생물의약품 오염 유발 세균 및 환경오염 세균 등 세균의 존재 유무와 속과 종 감별을 위해 대부분 세균 종의 보존적 염기서열과 다형적인 염기서열을 포함하고 있는 23S rDNA 유전자의 표적 염기 서열로부터 고안된 세균 특이적(bacterial-specific), 속 특이적(genus-specific), 종 특이적(species-specific) 올리고 뉴클레오티드프로브와 프라이머를 디자인하는 시스템을 소개한다. 시스템을 통해서 얻어진 프로브와 프라이머들은 PCR을 통한 검증단계를 거쳐서 디자인 결과의 정확성을 확인하였다. 본 시스템의 이용으로 프로브와 프라이머를 디자인하는데 몇 주가 소요되는 시간을 몇 일 내로 줄일 수 있었으며, 체계적인 데이터의 관리로 결과의 정확성을 높일 수 있었다.
모든 생명체의 genetic information에는 보존적 염기서열과 다형적 염기서열이 존재한다. 다형적 염기서열과 보존적 염기서열은 하나의 종(species)을 감별하거나, 여러 종류의 종을 동시에 감별할 수 있는 genotyping의 표지자로 각각 이용될 수 있다. 본 논문은 병원성 감염질환 세균, 식중독 유발 세균, 생물의약품 오염 유발 세균 및 환경오염 세균 등 세균의 존재 유무와 속과 종 감별을 위해 대부분 세균 종의 보존적 염기서열과 다형적인 염기서열을 포함하고 있는 23S rDNA 유전자의 표적 염기 서열로부터 고안된 세균 특이적(bacterial-specific), 속 특이적(genus-specific), 종 특이적(species-specific) 올리고 뉴클레오티드프로브와 프라이머를 디자인하는 시스템을 소개한다. 시스템을 통해서 얻어진 프로브와 프라이머들은 PCR을 통한 검증단계를 거쳐서 디자인 결과의 정확성을 확인하였다. 본 시스템의 이용으로 프로브와 프라이머를 디자인하는데 몇 주가 소요되는 시간을 몇 일 내로 줄일 수 있었으며, 체계적인 데이터의 관리로 결과의 정확성을 높일 수 있었다.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
그러나 세균의 존재 유무와 원인균 속 특이적, 종 특이적 감별을 위해서는 각각의 프로브 또는 프라이머 세트가 필요하지만 기존의 소프트웨어들은 종 특이적이거나 속 특이적인 프로브, 프라이머만을 디자인하는 한계가 있다. 따라서 본 연구에서는 각 단계의 특이적인 프로브, 프라이머를 디자인 할 뿐만 아니라 데이터의 업데이트 및 관리를 수행할 수 있는 통합시스템을 개발하였다. 또한 프로브, 프라이머를 디자인하기 위해 필요한 데이터의 수집과 BLAST를 통한 검증도 웹으로 자동으로 구현할 수 있도록 하였으며, 모든 결과는 데이터베이스에 구죽되도록 설계하였다.
본 연구는 23S rDNA 유전자를 이용하여 세균의 동정을 위한 프로브와 프라이머를 디자인하는 시스템 개발이다. 병원성 세균의 경우에는 세균의 존재 유무를 먼저 1차 스크리닝한 후 세균의 존재가 밝혀지면 각 원인균 속의 정확한 감별을 위해 2차 스크리닝을 실시함으로써 진단 비용의 절감과 함께 항생제 오남용의 예방 및 적절한 치료가 이루어 질 수 있는 신속하고 민감한 진단 방법이 제공되어야 한다.
하지만 염기 서열 변이 영역이 작아서 일부 특정 세균의 감별이 어려운 한계가 있다. 최근에는 과변이 영역 (hypervariableregion) 을 보유한 ITS( internal transcribed spacer region, 내부전사지역)을 이용하거나, 아직 염기서열 정보가 많이 밝혀지지 않았지만, 16S rDNA 보다 서열 길이가 평균적으로 1K 이상 길고, 서열 변이영역이 보다 많은 것으로 알려진 23S rDNA 유전자를 기초로 세균을 검출하는 방법이 있으며, 본 연구에서도 23S rDNA 유전자를 이용하여 세균을 검출 및 genotyping에 필수적인 프로브와 프라이머를 디자인하는 시스템을 개발하고자 하였다. 세균을 검출하기 위해 PCR과 DNA chip을 많이 사용하고있으며, 이 두 가지 방법을 사용하기 위해서는 프라이머와 프로브 디자인 작업이 선행되어야 한다.
제안 방법
최종적으로 BLAST의 자동검색을 통해 후보군들의 세균, 속, 종 특이적 프로브와 프라이머 유무를 확인할 수 있다. BLAST 검색 결과는 Taxonomy Browser형태의 이미지로 표현하여 판단을 보다 용이하게 할 수 있도록 하였으며, 그 결과는 데이터베이스에 업로드되도록 설계되었다.
나타내고 있다. 가장 먼저 대상 유전자(23S rDNA)를 선정하면 로컬화된 유전자데이터베이스를 검색해서 데이터가 존재하는지를 살펴본 후 데이터가 없으면 로컬화된 NCBI의 nt파일에서 Definition을 검사하여 찾고자 하는 데이터의 Definition을 보여준다. 제시된 데이터에서 연구자는 체크박스를 선택한 후 클릭하여 데이터베이스로 업데이트를 수행하도록 설계하였다.
동으로 NCBI의 nr(non-redundant) 데이터베이스에 BLAST를 수행하고 결과를 데이터베이스에 구축하였다. 또한 결과를 Taxonomy Browser 형태의 이미지로 표현하여 좀 더 쉽고 정확하게 프로브, 프라이머 세트의 특이성을 확인하도록 하였다.
디자인하였다. 디자인된 프로브, 프라이머의 후보군들 중 PCR을 통해서 결과의 정확성을 검증하였다.
따라서 이와 같은 흐름을 데이터 수집 단계, 다중서열정열을 통한 일치서열 구축 단계, 프로브와 프라이머를 디자인하는 단계, 마지막으로 디자인된 프로브와 프라이머의 블라스트 검증 단계로 구분하여 설계를 하였으며, 아래에서 그 내용을 자세히 다루고자 한다.
구축하였다. 또한 결과를 Taxonomy Browser 형태의 이미지로 표현하여 좀 더 쉽고 정확하게 프로브, 프라이머 세트의 특이성을 확인하도록 하였다.
그리고 종(species) 또는 속 (genus에 따라서 다중서열정렬 수행하며, 다중서열정렬 후 얻어지는 각각의 일치서열 (consensus sequence)을 관리한다. 또한 윈도우 슬라이딩과 욕심쟁이 알고리즘(greedy algorithm) 및 디자인에 필요한 파라메터들을 이용하여 프로브와 프라이머 후보군을 추출한다. 최종적으로 BLAST의 자동검색을 통해 후보군들의 세균, 속, 종 특이적 프로브와 프라이머 유무를 확인할 수 있다.
따라서 본 연구에서는 각 단계의 특이적인 프로브, 프라이머를 디자인 할 뿐만 아니라 데이터의 업데이트 및 관리를 수행할 수 있는 통합시스템을 개발하였다. 또한 프로브, 프라이머를 디자인하기 위해 필요한 데이터의 수집과 BLAST를 통한 검증도 웹으로 자동으로 구현할 수 있도록 하였으며, 모든 결과는 데이터베이스에 구죽되도록 설계하였다.
본 시스템은 리눅스 시스템을 기본 사양으로 구성하였으며, Perl과 Bioperl을 이용하여 프로그램하였다. 또한 웹형태로 구현하기 위해 Apache 서버를 기반으로 한 HTML과 CGI 형태로 프로그램하였으며, 데이터베이스는 MySQL을 사용하였다.
요구된다. 본 시스템은 이와 같은 반자동 형태의 데이터 수집 방법으로 설계하였으며, NCBI의 nt 데이터를 로컬화하여 자체 개발한 필터링을 거쳐서 23S rDNA 유전자를 검색할 수 있도록 하였다.
따라서, 종 일치서열은 strain 시퀀스들의 다중서열정렬을 통해서 얻을 수 있으며, 속 일치서열은 종 일치서열들의 다중서열정렬을 통해서 얻을 수 있다. 이와 같이 일치서열구성은 세균, 속과 종의 계층적인 구조형태를 가지고 있으며, 23S rDNA 유전자의 경우에는 새롭게 밝혀질 부분이 많이 있으므로, 수집된 데이터가 업데이트됨에 따라서 일치서열구축 단계도 업데이트 가능하도록 설계하였다.
가장 먼저 대상 유전자(23S rDNA)를 선정하면 로컬화된 유전자데이터베이스를 검색해서 데이터가 존재하는지를 살펴본 후 데이터가 없으면 로컬화된 NCBI의 nt파일에서 Definition을 검사하여 찾고자 하는 데이터의 Definition을 보여준다. 제시된 데이터에서 연구자는 체크박스를 선택한 후 클릭하여 데이터베이스로 업데이트를 수행하도록 설계하였다.
찾는 방법을 보이고 있다. 프로브, 프라이머의 최소, 최대 길이가 설정되면 일치 서열의 보존적인 영역에서 설정된 길이에 맞게 후보 영역들을 검색해 나간다. 이렇게 검색된 후보 영역들은 프로브, 프라이머를 디자인하는데 요구되는 파라메터인 서열상의 G와 C의 함량, 열역학적 조건 등을 검토하여 후보군으로 설정한다.
대상 데이터
따라서 본 시스템은 세균, 속, 종 특이적 프로브와 프라이머를 디자인하기 위해 GenBank에서 얻어진 23S rDNA 유전자와 Web-Lab에서 직접 시퀀싱을 수행한 데이터를 수집한다. 그리고 종(species) 또는 속 (genus에 따라서 다중서열정렬 수행하며, 다중서열정렬 후 얻어지는 각각의 일치서열 (consensus sequence)을 관리한다.
본 시스템을 통해서 41개의 속과 133개의 종에서 1349개의 프로브, 프라이머 후보군을 디자인하였다. 디자인된 프로브, 프라이머의 후보군들 중 PCR을 통해서 결과의 정확성을 검증하였다.
첫 번째는 GenBank의 Entrez 검색을 통해서 얻어지는 시퀀스 데이터이며, 두 번째는 Web-Lab에서 직접 시퀀싱을 통해서 얻어지는 시퀀스 데이터이다.
성능/효과
Enterococcus, Aeromonas, Mycobacterium , Streptococcus Hepetitis B virus DNA 등 여러가지 속이 포함된 실험 균주 중에서 Enterococcus 속 {Enterococcus faecal is, Enterococcus faedium, Enterococcus faedium, Enterococcus hirae)특이적인 결과들이 정확하게 구분하여 동정하는 것을 확인할 수 있었다. 그림 12와 13은 Mycobacteria 속 특이적, Streptococcus 속 특이적 프라이머 PCR 결과이다.
본 시스템을 개발하기 전 수작업으로 각 단계별 프로브, 프라이머를 디자인 하였을 때, 수개월이라는 시간이 소요되었으며, 엄청나게 많은 데이터를 관리해야 하는 번거로움이 있었다. 하지만 본 시스템을 사용하여 동일한 과정을 반복한 결과 하루, 이틀 만에 동일한 결과를 얻을 수 있었으며, 예전의 잘못된 디자인 결과물도 검출할 수 있었다.
또한 윈도우 슬라이딩과 욕심쟁이 알고리즘(greedy algorithm) 및 디자인에 필요한 파라메터들을 이용하여 프로브와 프라이머 후보군을 추출한다. 최종적으로 BLAST의 자동검색을 통해 후보군들의 세균, 속, 종 특이적 프로브와 프라이머 유무를 확인할 수 있다. BLAST 검색 결과는 Taxonomy Browser형태의 이미지로 표현하여 판단을 보다 용이하게 할 수 있도록 하였으며, 그 결과는 데이터베이스에 업로드되도록 설계되었다.
있었다. 하지만 본 시스템을 사용하여 동일한 과정을 반복한 결과 하루, 이틀 만에 동일한 결과를 얻을 수 있었으며, 예전의 잘못된 디자인 결과물도 검출할 수 있었다.
후속연구
따라서 본 시스템은 미생물의 동정을 위한 PCR과 DNA chip 개발에 많은 이바지할 것으로 생각된다. 향후 23S rDNA 유전자 뿐만 아니라 미생물들이 보유하고 있는 필수유전자를 이용하여 이와 같은 프로브, 프라이머를 디자인하고자 한다.
생각된다. 향후 23S rDNA 유전자 뿐만 아니라 미생물들이 보유하고 있는 필수유전자를 이용하여 이와 같은 프로브, 프라이머를 디자인하고자 한다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.