생물정보학을 이용한 연체동물의 NLS (Nuclear Localization Signals) 포함 단백질의 분석 Bioinformatic Analysis of NLS (Nuclear Localization Signals)-containing Proteins from Mollusks원문보기
연체동물 유래 아미노산 서열 22,138 개에서 NLS가 예측되는 아미노산 서열은 266 개였으며 이는 연체동물 전체 아미노산 중 1.2% 정도였다. 또한 현재 등재되어 있는 연체동물 8,314 종 중 NLS를 포함한 아미노산이 밝혀진 생물은 60여종에 불과 하였다. 현재 알려진 연체동물 서열 중에는 두족 강의 경우가 NLS를 포함한 아미노산이 많을 것으로 예측되었다.
연체동물 유래 아미노산 서열 22,138 개에서 NLS가 예측되는 아미노산 서열은 266 개였으며 이는 연체동물 전체 아미노산 중 1.2% 정도였다. 또한 현재 등재되어 있는 연체동물 8,314 종 중 NLS를 포함한 아미노산이 밝혀진 생물은 60여종에 불과 하였다. 현재 알려진 연체동물 서열 중에는 두족 강의 경우가 NLS를 포함한 아미노산이 많을 것으로 예측되었다.
Subcellular localization of a protein containing nuclear localization signals (NLS) has been well studied in many organisms ranging from invertebrates to vertebrates. However, no systematic analysis of NLS-containing proteins available from Mollusks has been reported. Here, we describe in silico scr...
Subcellular localization of a protein containing nuclear localization signals (NLS) has been well studied in many organisms ranging from invertebrates to vertebrates. However, no systematic analysis of NLS-containing proteins available from Mollusks has been reported. Here, we describe in silico screening of NLS-containing proteins using the mollusks database that contains 22,138 amino acids. To screen putative proteins with NLS-motif, we used both predict NLS and perl script. As a result, we have found 266 proteins containing NLS sequences which are about 1.2% out of the entire proteins. On the basis of KOG (The eukaryotic orthologous groups) analysis, we can't predict the precise functions of the NLS-containing proteins. However, we found out that these proteins belong to several types of proteins such as chromatin structure and dynamics, translation, ribosomal structure, biogenesis, and signal transduction mechanism. In addition, we have analysed these sequences based on the classes of mollusks. We could not find many from the species that are the main subjects of phylogenetic studies. In contrast, we noticed that cephalopods has the highest number of NLS-containing proteins. Thus, we have constructed mollusks NLS database and added these information and data to the mollusks database by constructing web interface. Taken together, these information will be very useful for those who are or will be studying NLS-containing proteins from mollusks.
Subcellular localization of a protein containing nuclear localization signals (NLS) has been well studied in many organisms ranging from invertebrates to vertebrates. However, no systematic analysis of NLS-containing proteins available from Mollusks has been reported. Here, we describe in silico screening of NLS-containing proteins using the mollusks database that contains 22,138 amino acids. To screen putative proteins with NLS-motif, we used both predict NLS and perl script. As a result, we have found 266 proteins containing NLS sequences which are about 1.2% out of the entire proteins. On the basis of KOG (The eukaryotic orthologous groups) analysis, we can't predict the precise functions of the NLS-containing proteins. However, we found out that these proteins belong to several types of proteins such as chromatin structure and dynamics, translation, ribosomal structure, biogenesis, and signal transduction mechanism. In addition, we have analysed these sequences based on the classes of mollusks. We could not find many from the species that are the main subjects of phylogenetic studies. In contrast, we noticed that cephalopods has the highest number of NLS-containing proteins. Thus, we have constructed mollusks NLS database and added these information and data to the mollusks database by constructing web interface. Taken together, these information will be very useful for those who are or will be studying NLS-containing proteins from mollusks.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이러한 관점에서 본 연구팀은 현재까지 연체동물에서 연구된 유전자를 생물정보학적인 방법을 이용하여 NLS-like motif를 갖고 있는 유전자 혹은 단백질을 체계적으로 조사하고자 하였다. 이러한 기초 연구는 향후 육상동물과 달리 특수한 환경에서 서식하는 다양한 연체동물에서 NLS-포함 단백질에 대한 연구를 in silico 상에서 수행함으로서 연체동물의 유전자 연구를 효과적으로 할 수 있는 NLS 기초자료를 확보하고자 수행되었다.
하였다. 이러한 기초 연구는 향후 육상동물과 달리 특수한 환경에서 서식하는 다양한 연체동물에서 NLS-포함 단백질에 대한 연구를 in silico 상에서 수행함으로서 연체동물의 유전자 연구를 효과적으로 할 수 있는 NLS 기초자료를 확보하고자 수행되었다.
제안 방법
2003). NCBI에 등록되어진 KOG 데이터를 모두 다운받은 후 BLAST 수행 시 자동으로 KOG롤 판단할 수 있도록 데이터베이스를 만들고 E-value < e-10 조건에서 BLASTP 를 사용하여 BLAST를 수행 한 후 perl script를 사용하여 데이터를 정리하였다.
2006년 11월 현재까지 구축되어진 연체동물 유래 아미노산은 모두 22, 138 개였다. NLS 영역을 예측하기 위해 predict NLS 프로그램 (Cokol et al., 2000) 을 주축 엔진으로 하는 perl script를 만들고 script에서 활용할 수 있도록 데이터베이스를 변형하여 query로 활용하였으며, 나온 결과물에서 NLS를 포함한 서열들만을 선택하여 데이터베이스를 만들고, 이를 활용 할 수 있도록 웹용 인터페이스를 제작하여 연체동물 전용 BLAST 서버에 추가하였다 (Lee et al., 2004).
0 GHz CPU 시스템을 사용하였으며, 운영체제는 Linux Enterprise AS-3를 사용하였다. 운영체 제설치 후 cgi (common gate interface) 및 perl을 사용할 수 있도록 환경설정을 한 후 NCBI-BLAST# 설치하여 서열 분석을 할 수 있도록 하였다 (Altschul et al., 1990).
대상 데이터
연체동물에서 NLS (nuclear localization signal)를 포함한 아미노산 서열을 추출하기 위해 연체동물 전용 서열 BLAST (basic local alignment search tool) 서버에 구축되어진 데이터베이스를 활용하였다. 2006년 11월 현재까지 구축되어진 연체동물 유래 아미노산은 모두 22, 138 개였다.
연체동믈의 아미노산의 기능을 분석하기 위하여 KOG (the eukaryotic ortholog ous groups) 데이터롤 이용하였다(Tatusov 2003). NCBI에 등록되어진 KOG 데이터를 모두 다운받은 후 BLAST 수행 시 자동으로 KOG롤 판단할 수 있도록 데이터베이스를 만들고 E-value < e-10 조건에서 BLASTP 를 사용하여 BLAST를 수행 한 후 perl script를 사용하여 데이터를 정리하였다.
성능/효과
68%로 가장 많이 나왔으며, 기능이 알려져 있는 경우에는 histone 단백질 등이 포함된 KOG-B(chromatin structure and dynamics) 가. 10.9%, ribosomal protein 등이 포함된 KOG-J (translation, ribosomal structure and biogenesis) 가 9.77%, synaptotagmin 및 Wnt 등을 포함하고 있는 KOG-T(signal transduction mechanisms)가 8.65%로 조사되었으며 그밖에 RNA binding protein 등이 포함된 KOG-A(RNA processing and modification) 및 troponin, myosin 등을 포함하는 KOG-Z (cytoskeleton) 의 경우 각각 4.51%가 조사되었다 (Fig. 1).
현재 등재되어 있는 연체동물 8, 314 종 중 NLS를 포함한 아미노산이 밝혀진 생물은 60여종에 불과 했다. 60 종의 연체동물에서 발견된 NLS 서열을 포함하고 있는 아미노산 서열들의 전체 평균길이는 330이었다. 이 결과를 각 강(class) 별로 살펴보면 전반적으로 복족류(gastropods)가 유전자 연구가 가장 활발하게 이루어진 것으로 보이며 NLS를 포함하는 아미노산이 가장 높은 비율로 나타나는 강은 두족 강 (class Cephalopoda) 이 었으며, 그 다음은 굴족 강 (class Scaphopoda) 으로 나타났다.
KOG 분석 및 NLS 예측결과 유전자 연구가 많이 되어 있을수록, 또 분류의 목적이 아닌 특수 목적을 가지고 연구가 진행되어진 생물종일수록 다양한 기능의 유전자 연구가 진행되어 왔으며 이에 따라 NLS 포함 유전자도 더 많이 나오는 양상을 볼 수가 있었다.
PredNLS 프로그램을 통해 결과를 얻은 NLS를 포함하는 연체동물의 아미노산은 모두 266 개였다. 이 서열들에 대한 KOG 분석을 실시한 결과 기능을 예측하기 힘든 유전자가 모두 34% 정도였으며, KOG-R (general function prediction only) 이 20.
셋째, RAN-GTP와 importin이 결합 한 후 NLS포함 단백질은 핵 속에서 떨어뜨린다. 넷째, Ran-GTP-importin complex 는 NPC를 통해 다시 세포질로 이동되어진다. 다섯째, 세포질에 도달한 후 importin과 분리되어지면서 GTP에서 GDP로 가수분해된다 (Wayne et al.
둘째, importin + NLS 콤플렉스 단백질은 NPC (nuclear pore complex)를 통과한 후 discharge된다. 셋째, RAN-GTP와 importin이 결합 한 후 NLS포함 단백질은 핵 속에서 떨어뜨린다. 넷째, Ran-GTP-importin complex 는 NPC를 통해 다시 세포질로 이동되어진다.
60 종의 연체동물에서 발견된 NLS 서열을 포함하고 있는 아미노산 서열들의 전체 평균길이는 330이었다. 이 결과를 각 강(class) 별로 살펴보면 전반적으로 복족류(gastropods)가 유전자 연구가 가장 활발하게 이루어진 것으로 보이며 NLS를 포함하는 아미노산이 가장 높은 비율로 나타나는 강은 두족 강 (class Cephalopoda) 이 었으며, 그 다음은 굴족 강 (class Scaphopoda) 으로 나타났다.
아미노산은 모두 266 개였다. 이 서열들에 대한 KOG 분석을 실시한 결과 기능을 예측하기 힘든 유전자가 모두 34% 정도였으며, KOG-R (general function prediction only) 이 20.68%로 가장 많이 나왔으며, 기능이 알려져 있는 경우에는 histone 단백질 등이 포함된 KOG-B(chromatin structure and dynamics) 가. 10.
좀 더 자세한 분석을 위해 등록되어진 아미노산 숫자에 NLS 포함률이 높은 생물 순으로 나열하고 각각 포함하는 유전자를 조사해 본 결과, 청자고둥 과에 속하는 Conus cbaeus의 경우 등록되어진 23 개의 유전자 중 20 개의 유전자가 NLS를 포함하고 있었다. 하지만 실재로 등록되어진 모든 아미노산은 모두 conotoxin 관련 유전자로 청자고둥류에서 분비되는 독소 단백질의 전구체였다.
이 시그널을 가진 단백질은 핵공을 통해 이동되어지는데 그 과정은 다음과 같다. 첫째, NLS를 가진 단백질은 우선 importin (receptor protein) 과 결합한 후 세포질에서 핵공으로 이동되어진다. 둘째, importin + NLS 콤플렉스 단백질은 NPC (nuclear pore complex)를 통과한 후 discharge된다.
현재 연체동물 서열 BLAST 데이터베이스에 등록되어진 모든 아미노산을 기능에 따라 분류하기 위해 KOG 방법을 사용한 결과 KOG-C (energy production and conversion) 가 69.3%, 기능을 알 수 없는 단백질이 19.12%로 나타났으며 KOG-B (chromatin structure and dynamics)가 2.65% 정도로 나타났다. 그 수가 가장 많은 KOG-C에 속하는 단백질은 대부분 NADH와 cytochrome oxidase 종류로서 일반적으로 계통분류 및 진화연구에 많이 사용되어지는 유전자다.
후속연구
즉, 세포 내에서 합성된 NLS 영역을 갖고있는 단백질의 최종 subcellular localization 기작에 대한 기초 연구가 진행되고 있다. 또한 척추 및 무척추동물의 대량유전자발굴 사업의 결과로 얻게 된 많은 유전자중 NLS- 포함 단백질의 기능연구로 인하여 NLS 분야의 기초연구는 더욱더 활발히 진행될 것으로 생각된다. 둘째, 이와 같은 NLS의 기초연구는 더욱더 나아가 다양한 응용연구를 통하여 산업화를 추진하고 있는 실정이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.