본 연구를 통하여 연체동물 전용 BLAST 서버 (Version II)가 웹주소 http://www.malacol.or.kr/blast에 구축되었다. 연체동물을 대상으로 하는 연구에 있어 필요한 정보를 매우 빠르게 얻을 수 있었다. 본 시스템을 사용하여 앞으로도 많은 연구가 진행되어지길 바라며, 아울러 많은 연체동물 연구자들에게 많은 도움이 되리라고 사료된다.
본 연구를 통하여 연체동물 전용 BLAST 서버 (Version II)가 웹주소 http://www.malacol.or.kr/blast에 구축되었다. 연체동물을 대상으로 하는 연구에 있어 필요한 정보를 매우 빠르게 얻을 수 있었다. 본 시스템을 사용하여 앞으로도 많은 연구가 진행되어지길 바라며, 아울러 많은 연체동물 연구자들에게 많은 도움이 되리라고 사료된다.
Since we reported a BLAST server for the mollusk in 2004, no work has reported the usability or modification of the server. To improve its usability, the BLAST server for the mollusk has been updated as version II (http://www.malacol.or.kr/blast) in the present study. The database was constructed by...
Since we reported a BLAST server for the mollusk in 2004, no work has reported the usability or modification of the server. To improve its usability, the BLAST server for the mollusk has been updated as version II (http://www.malacol.or.kr/blast) in the present study. The database was constructed by using the Intel server Platform ZSS130 dual Xeon 3.20 GHz CPU and Linux CentOS system and with NCBI WebBLAST package. We downloaded the mollusk nucleotide, amino acid, EST, GSS and mitochondrial genome sequences which can be opened through NCBI web BLAST and used them to build up the database. The updated database consists of 520,977 nucleotide sequences, 229,857 amino acid sequences, 586,498 EST sequences, 23,112 GSS and 565 mitochondrial genome sequences. Total database size is 1.2 GB. Furthermore, we have added repeat sequences, Escherichia coli sequences and vector sequences to facilitate data validation. The newly updated BLAST server for the mollusk will be useful for many malacological researchers as it will save time to identify and study various molluscan genes.
Since we reported a BLAST server for the mollusk in 2004, no work has reported the usability or modification of the server. To improve its usability, the BLAST server for the mollusk has been updated as version II (http://www.malacol.or.kr/blast) in the present study. The database was constructed by using the Intel server Platform ZSS130 dual Xeon 3.20 GHz CPU and Linux CentOS system and with NCBI WebBLAST package. We downloaded the mollusk nucleotide, amino acid, EST, GSS and mitochondrial genome sequences which can be opened through NCBI web BLAST and used them to build up the database. The updated database consists of 520,977 nucleotide sequences, 229,857 amino acid sequences, 586,498 EST sequences, 23,112 GSS and 565 mitochondrial genome sequences. Total database size is 1.2 GB. Furthermore, we have added repeat sequences, Escherichia coli sequences and vector sequences to facilitate data validation. The newly updated BLAST server for the mollusk will be useful for many malacological researchers as it will save time to identify and study various molluscan genes.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
제안 방법
NCBI에 등록되어 있는 연체동물과 관련된 유전자서열 정보, 아미노산서열 정보, 미토콘드리아서열 정보, EST 서열 정보, GSS (genome survey sequecne) 서열 정보를 taxonomy browser와 연계하여 모두 다운 받은 후 multifasta 형태의 정보를 만든 후 BLAST용 데이터베이스를 구축하였다. 또한 부가적으로 반복서열, Escherichia coli 서열, 벡터서열을 데이터베이스화하여 데이터 검증에 용이하도록 하였다.
모든 데이터베이스를 독립적으로 검색이 가능하도록 구성하였으며, query 및 데이터베이스가 허용하는 한 5가지 BLAST 프로그램이 모두 수행 가능하도록 하였다. 또한 Multi DB 메뉴를 만들어 라이브러리 검증 등을 할 때 용이하도록 하였다. 또한 국내외의 모든 연구자를 고려하여 영문으로 인터페이스를 구성하였으며 photoshop 7.
또한 Multi DB 메뉴를 만들어 라이브러리 검증 등을 할 때 용이하도록 하였다. 또한 국내외의 모든 연구자를 고려하여 영문으로 인터페이스를 구성하였으며 photoshop 7.0 및 Illustrator CS6를 활용하여 직관성과 단순성을 위주로 디자인 하였다.
NCBI에 등록되어 있는 연체동물과 관련된 유전자서열 정보, 아미노산서열 정보, 미토콘드리아서열 정보, EST 서열 정보, GSS (genome survey sequecne) 서열 정보를 taxonomy browser와 연계하여 모두 다운 받은 후 multifasta 형태의 정보를 만든 후 BLAST용 데이터베이스를 구축하였다. 또한 부가적으로 반복서열, Escherichia coli 서열, 벡터서열을 데이터베이스화하여 데이터 검증에 용이하도록 하였다.
모든 데이터베이스를 독립적으로 검색이 가능하도록 구성하였으며, query 및 데이터베이스가 허용하는 한 5가지 BLAST 프로그램이 모두 수행 가능하도록 하였다. 또한 Multi DB 메뉴를 만들어 라이브러리 검증 등을 할 때 용이하도록 하였다.
9 를 사용하였다. 운영 체제 설치 후 Apache 웹서버의 설정에서 일반 사용자가 cgi(common gate interface) 를 사용할 수 있도록 환경설정을 한 후 WebBLAST 패키지를 설치하였다.
대상 데이터
본 연구를 통하여 연체동물 전용 BLAST 서버 (Version II) 가 웹주소 http://www.malacol.or.kr/blast 에 구축되었다. 연체동물을 대상으로 하는 연구에 있어 필요한 정보를 매우 빠르게 얻을 수 있었다.
성능/효과
NCBI에 등록된 유전자 서열들을 확인 한 결과 nucleotide 서열의 수는 약 800%, amino acid 서열은 약 1500% 증가하였다. Mitochondrial genome 서열의 경우 2004년에 17개에서 2014년 565개로 약 3300% 증가함을 확인할 수 있었는데 이는 앞서 언급한 바와 같이 자동염기서열분석기의 발전으로 인한 것임을 알 수 있다.
후속연구
연체동물을 대상으로 하는 연구에 있어 필요한 정보를 매우 빠르게 얻을 수 있었다. 본 시스템을 사용하여 앞으로도 많은 연구가 진행되어지길 바라며, 아울러 많은 연체동물 연구자들에게 많은 도움이 되리라고 사료된다.
이러한 서열들을 활용하여 베타분류 연구자들이 매우 유용하게 사용되어 질 수 있을 것으로 생각된다. 추후 업데이트는 Version1 에 있었던 프라이머 제작기능 및 기타 사용자들의 요구를 반영할 예정이다.
질의응답
핵심어
질문
논문에서 추출한 답변
생물학 데이터가 계속해서 대량화 되는 이유는?
거듭되어진 생물학의 발달로 인하여 생물학 데이터는 계속해서 대량화되고 있다. 대량화 되어지는 정보들은 종의 정보는 물론 유전체 정보, 유전자 정보, 아미노산 서열 정보 등을 포함하고 있다.
연체동물 전용 BLAST 서버는 어디에 구축되었나?
본 연구를 통하여 연체동물 전용 BLAST 서버 (Version II)가 웹주소 http://www.malacol.or.kr/blast에 구축되었다. 연체동물을 대상으로 하는 연구에 있어 필요한 정보를 매우 빠르게 얻을 수 있었다.
연체동물 전용 BLAST 서버를 통해 무엇을 얻을 수 있는가?
kr/blast에 구축되었다. 연체동물을 대상으로 하는 연구에 있어 필요한 정보를 매우 빠르게 얻을 수 있었다. 본 시스템을 사용하여 앞으로도 많은 연구가 진행되어지길 바라며, 아울러 많은 연체동물 연구자들에게 많은 도움이 되리라고 사료된다.
참고문헌 (3)
Altschul, S. F., Gish, W., Miller, W., Myers, E. W. and Lipman, D. J. (1990) Basic local alignment search tool. Journal of molecular biology, 215: 403-410.
Lee, Y. S., Jo, Y. H., Kim, D. S., Kim, D. W., Kim, M. Y., Choi, S. H., Yon, J. O., Byun, I. S., Kang, B. R., Jeong, K. H. and Park, H. S. (2004) Construction of BLAST Server for Mollusks. Korean journal of malacology, 20:165-169.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.