$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

Fold recognition by combining profile–profile alignment and support vector machine 원문보기

Bioinformatics, v.21 no.11, 2005년, pp.2667 - 2673  

Han, Sangjo (The authors wish it to be known that, in their opinion, the first two authors should be regarded as joint First Authors.) ,  Lee, Byung-chul (The authors wish it to be known that, in their opinion, the first two authors should be regarded as joint First Authors.) ,  Yu, Seung Taek (Department of Biosystems, Korea Advanced Institute of Science and Technology Daejeon, 305-701, Korea) ,  Jeong, Chan-seok (Department of Biosystems, Korea Advanced Institute of Science and Technology Daejeon, 305-701, Korea) ,  Lee, Soyoung (Department of Biosystems, Korea Advanced Institute of Science and Technology Daejeon, 305-701, Korea) ,  Kim, Dongsup (*To whom correspondence should be addressed.)

Abstract

Motivation: Currently, the most accurate fold-recognition method is to perform profile–profile alignments and estimate the statistical significances of those alignments by calculating Z-score or E-value. Although this scheme is reliable in recognizing relatively close homologs related at the family level, it has difficulty in finding the remote homologs that are related at the superfamily or fold level.Results: In this paper, we present an alternative method to estimate the significance of the alignments. The alignment between a query protein and a template of length n in the fold library is transformed into a feature vector of length n + 1, which is then evaluated by support vector machine (SVM). The output from SVM is converted to a posterior probability that a query sequence is related to a template, given SVM output. Results show that a new method shows significantly better performance than PSI-BLAST and profile–profile alignment with Z-score scheme. While PSI-BLAST and Z-score scheme detect 16 and 20% of superfamily-related proteins, respectively, at 90% specificity, a new method detects 46% of these proteins, resulting in more than 2-fold increase in sensitivity. More significantly, at the fold level, a new method can detect 14% of remotely related proteins at 90% specificity, a remarkable result considering the fact that the other methods can detect almost none at the same level of specificity.Contact: kds@kaist.ac.kr

참고문헌 (32)

  1. 0305-1048 Nucleic Acids Research 25 17 3389 1997 10.1093/nar/25.17.3389 

  2. 0036-8075 Science Bowie 253 5016 164 1991 10.1126/science.1853201 

  3. 0305-1048 Nucleic Acids Research Chandonia 32 90001 D189 2004 10.1093/nar/gkh034 

  4. 1367-4803 Bioinformatics 20 16 2860 2004 10.1093/bioinformatics/bth300 

  5. 0887-3585 Proteins Elofsson 46 3 330 2002 10.1002/prot.10043 

  6. 0959-440X Current opinion in structural biology Friedberg 14 3 307 2004 10.1016/j.sbi.2004.04.005 

  7. 0097-8485 Computers & chemistry Gribskov 20 1 25 1996 10.1016/S0097-8485(96)80004-0 

  8. 0027-8424 PNAS 100 5 2386 2003 10.1073/pnas.2628030100 

  9. 1367-4803 Bioinformatics Hou 19 17 2294 2003 10.1093/bioinformatics/btg317 

  10. 0887-3585 Proteins Hou 57 3 518 2004 10.1002/prot.20221 

  11. 0022-2836 Journal of molecular biology Hua 308 2 397 2001 10.1006/jmbi.2001.4580 

  12. 1066-5277 Journal of computational biology : a journal of computational molecular cell biology Jaakkola 7 1-2 95 2000 10.1089/10665270050081405 

  13. 0022-2836 Journal of molecular biology Jones 287 4 797 1999 10.1006/jmbi.1999.2583 

  14. 0027-8424 PNAS Karlin 87 6 2264 1990 10.1073/pnas.87.6.2264 

  15. 0022-2836 Journal of molecular biology Kelley 299 2 499 2000 10.1006/jmbi.2000.3741 

  16. 1741-0126 Protein Engineering Design and Selection Kim 16 9 641 2003 10.1093/protein/gzg081 

  17. 1066-5277 Journal of computational biology : a journal of computational molecular cell biology Liao 10 6 857 2003 10.1089/106652703322756113 

  18. 0305-1048 Nucleic Acids Research McGuffin 32 90001 D196 2004 10.1093/nar/gkh043 

  19. 0022-2836 Journal of molecular biology Murzin 247 4 536 1995 10.1006/jmbi.1995.0159 

  20. 0887-3585 Proteins Ohlson 57 1 188 2004 10.1002/prot.20184 

  21. 0022-2836 Journal of molecular biology Park 273 1 349 1997 10.1006/jmbi.1997.1288 

  22. 0022-2836 Journal of molecular biology Przybylski 341 1 255 2004 10.1016/j.jmb.2004.05.041 

  23. 0022-2836 Journal of molecular biology Qian 313 4 673 2001 10.1006/jmbi.2001.5079 

  24. 0961-8368 Protein Science Rychlewski 9 2 232 2000 10.1110/ps.9.2.232 

  25. 0022-2836 Journal of molecular biology Sadreyev 326 1 317 2003 10.1016/S0022-2836(02)01371-2 

  26. 0022-2836 Journal of molecular biology Shi 310 1 243 2001 10.1006/jmbi.2001.4762 

  27. 0022-2836 Journal of molecular biology Tress 330 4 705 2003 10.1016/S0022-2836(03)00622-3 

  28. 1367-4803 Bioinformatics 20 14 2228 2004 10.1093/bioinformatics/bth232 

  29. 0887-3585 Proteins Wallner 54 2 342 2004 10.1002/prot.10565 

  30. 0027-8424 PNAS 101 17 6559 2004 10.1073/pnas.0308067101 

  31. 0887-3585 Proteins Xu 40 3 343 2000 10.1002/1097-0134(20000815)40:3<343::AID-PROT10>3.0.CO;2-S 

  32. 0022-2836 Journal of molecular biology Yona 315 5 1257 2002 10.1006/jmbi.2001.5293 

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로