$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

소수성과 치환행렬에 기반한 신호서열 예측
Signal Sequence Prediction Based on Hydrophobicity and Substitution Matrix 원문보기

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.34 no.7, 2007년, pp.595 - 602  

지상문 (경성대학교 컴퓨터과학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 미지의 아미노산 서열이 신호 펩티다제 I에 의해 절단되는 분비성 단백질인지를 판별하고, 분비성 단백질일 경우에는 절단 위치를 예측하는 방법을 제안한다. 아미노산의 소수성을 이용한 전처리를 수행하여 분비성 단백질의 선도서열인 신호서열의 존재와 절단 위치를 추정한다. 전처리를 통해서 신호서열 아닌 서열을 초기에 제외함으로써 신호서열 예측의 정확도를 높인다. 지지벡터기계를 신호서열의 예측에 효과적으로 적용하기 위해서, 생물학적 정보와 관련된 아미노산 서열간의 거리를 제안한다. 아미노산의 세포내 위치를 예측할 수 있는 소수성 척도와 아미노산의 진화적인 관계를 나타낼 수 있는 치환행렬을 이용하여 아미노산 서열간의 거리를 정의한다. Swiss-Prot release 50 단백질 자료에 대하여 교차타당성 기법을 사용하여 실험한 결과 제안한 방법은 신호서열중에 98.9%를 신호서열로 판별하였고, 88%의 절단위치 예측정확도를 보였다. 기존의 방법과의 비교실험을 통해서 제안한 방법이 신호서열의 예측에 더욱 효과적임을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

This paper proposes a method that discriminates signal peptide and predicts the cleavage site of the secretory proteins cleaved by the signal peptidase I. The preprocessing stage uses hydrophobicity scales of amino acids in order to predict the presence of signal sequence and the cleavage site. The ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 미지의 단백질 자료가 신호서열을 포함하는지를 판별하는 실험을 하였다. 신호서열을 포함하고 있는 자료와 신호서열을 포함하고 있지 않은 자료를 각각 5개의 부분자료로 균둥하게 나누고, 4개의 부분자료로 학습하고 나머지 한 개의 자료에 대해서 예측하는 교차 타당성 (5-fold-cross-validation)을 수행하였다.
  • 본 논문에서는 미지의 아미노산 서열이 신호서열을 포함하고 있는지를 예측하고, 신호서열을 포함하는 것으로 예측된 경우에는 절단위치를 예측하는 방법을 제안하였다. 기존의 신호서열 예측방법에서는 아미노산의 종류와 서열상의 위치 정보를 사용하지만, 제안한 방법에서는 아미노산의 생물/화학적인 특성을 이용하였다.
  • 러나, 이동 평균을 사용하는 저대역통과 필터링은 주파수 웅답특성면에서 보면 고주파 대역의 감쇠가 미흡하다. 본 연구에서는 소수성을 신호서열 예측에 적용하기 위하여, 고주파 대역의 감쇠특성이 우수하고 감쇠 대역의 선택이 용이한 필터를 사용한다. 산호 서열예측에 효과적인 통과대역을 찾기 위해서 여러 통과 대역을 시험하였고, 본 논문에서는 식 (1)의 시스템 함수와 그림 3의 주파수 웅답을 가지는 IIR(Infinite-duration impulse response) 필터를 사용하였다[14].
  • 따라서 상이한 아미노산간의 거리는 아미노산의 종류와 상관없이 같은 값을 갖는다. 본 연구에서는 아미노산마다 고유의 생물화학적인 특성을 반영하여 아미노산의 종류에 종속적인 거리를 정의한다. 아미노산의 소수성과 치환행렬을 이용하여 아미노산간의 유사성을 정의하는데, 소수성은 신호서열의 뚜렷한 구조적 특징인 소수성 영역의 특징을 나타내기에 유용하고, 치환 행렬은 아미노 산간의 진화적인 유사성을 나타낸다.
  • 파라미터의 값의 변화가 판별성능에 미치는 영향을 알아보았다. 먼저, 각기 다른 아미노산 서열의 길이에서 의 의 모든 조합에 대한 평균을 조사하였는데, 서열의 길이에 따른 성능의 차이는 크지 않았다[표 6].

가설 설정

  • 평활화한다. 두 번째 단계에서는 그림 2의 점선으로 표시된 것과 같은 필터링된 소수성을 이용하여 소수성이 문턱치 0.7 보다 큰 아미노산이 연속적으로 3개 이상 나타날 때 신호서열을 포함한 서열로 판정하고, 소수성이 0.7보다 큰 연속적인 구간을 h-영역으로 가정한다. 세 번째 단계에서는 신호서열의 절단위치는 h-영역 이후와 소포체 막 외부에 놓이는 소수성이 작은 아미노산서열사이에 존재하므로, 절단위치는 폐구간 [ h-영역의 중앙위치, h-영역 이후에 소수성이 최소인 위치+D ]내에 위치하는 것으로 예측한다.
  • 있다. 절단 위치인 T위치에 나타나는 아미노산의 종류를 SignalP 3.0[5]에서는 진핵세균의 경우에는 A, C, G, L, P, Q, S, T만이 나타나고, 그람-양성 및 그람 -음성 세균의 경우에는 A, G, S, T만이 나타난다고 가정하였고, 이러한 아미노산이외의 아미노산이 나타난 자료는 실험적인 오류인 경우가 많음을 보였다[5丄 본 논문에서도 같은 방법으로 위의 아미노산이 절단 위치에 나타난 자료만을 신호서열 예측 알고리즘의 학습과 평가에서 사용한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (19)

  1. von Heijne, G., 'A new method for predicting signal sequence cleavage sites,' Nucl. Acids Res., 14, pp. 4683-4690, 1986 

  2. von Heijne, G., 'Sequence analysis in Molecular biology: Treasure trove or trivial pursuit,' Academic, pp. 429-436, 1987 

  3. McGeoch, D.,J., 'On the predictive recognition of signal peptide sequence,' Virus Res., 3, pp. 271-286, 1985 

  4. Nakai, K., Horton, P., 'PSORT: a program for detecting sorting signals in proteins and predicting their subcellular localization,' Trends Biochem. Sci., 24, pp. 34-36, 1999 

  5. Bendtsen, J.,D., Nielsen, H., von Heijne, G., Brunak, S., 'Improved prediction of signal peptides: SignalP 3.0,' J. Mol. Biol., 340, pp. 783-795, 2004 

  6. Hua, S., Sun, Z., 'Support vector machine approach for protein subcellular localization prediction,' Bioinformatics, 17, pp. 721-728, 2001 

  7. Vert, J.P., 'Support vector machine prediction of signal peptide cleavage site using a new class of kernels for strings,' proc. pacific symposium on biocomputing, pp. 649-660, 2002 

  8. Menne, K.M., Hermjakob, H., Apweiler, R., 'A comparison of signal sequence prediction methods using a test set of signal peptides,' Bioinformatics, 16, pp. 741-742, 2000 

  9. Paetzel, M., Karla, A., Strynadka, N.C. and Dalbey, R.E., 'Signal peptidases,' Chem. Rev. 102, pp. 4549-4580, 2002 

  10. Kall, L., Krogh, A., Sonnhammer, E.,L.,L., 'A combined transmembrane topology and signal peptide prediction method,' J. Mol. Biol., 338, pp. 1027-1036, 2004 

  11. http://www.expasy.org/sprot/download.html 

  12. Engelman, D.M., Steitz, T.A., Goldman, A., 'Identifying nonpolar transbilayer helices in amino acid sequences of membrane proteins,' Annu. Rev. Biophys. Biophys. Chem., 15, 321-353, 1986 

  13. Kyte, J., Doolittle, R.F., 'A simple method for displaying the hydropathic character of a protein,' J. Mol. Biol., 157, pp. 105-132, 1982 

  14. Oppenheim, A.V., Schafer, R.W,. Discrete-time signal processing, Prentice-Hall, New Jersey, 1989 

  15. Henikoff, S., Henikoff, J.G., 'Amino acid substitution matrices from protein blocks,' proc. natl. acad. sci., 89, pp. 11915-11919, 1992 

  16. Boser, B., Guyon, I., Vapnik, V., 'A training algorithm for optimal margin classifiers,' proc. workshop, computational learning theory, pp. 144-152, 1992 

  17. Cortes, C., Vapnik, V., 'Support-vector network,' Machine learning, 20, pp. 273-297, 1995 

  18. Vapnik, V., The nature of statistical learning theory, Springer-Verlag, New York, NY, 1995 

  19. Ruping, S., mySVM-Manual, http://www-ai.cs.uni-dortmund.de/SOFTWARE/MYSVM/ 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로