최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.20 no.9, 2016년, pp.1816 - 1821
지상문 (Department of Computer Science and Engineering, Kyungsung University)
Protein secondary structure is important for the study of protein evolution, structure and function of proteins which play crucial roles in most of biological processes. This paper try to effectively extract protein secondary structure information from the large protein structure database in order t...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
단백질 서열의 진화적인 정보를 이용하는 방법 중 SSpro는 어떤 단계로 구성되어 있는가? | 단백질 서열의 진화적인 정보를 이용하는 또 다른 방법인 SSpro[3]의 경우에는 세단계로 구성되어 있다. 첫단계는 PSI-BLAST를 UNIREF50 단백질 자료[11]를 대상으로 세 번 반복하여 다중 서열 정렬을 수행하고, 이 결과를 이용하여 단백질 서열의 각 위치에서 나타나는 아미노산의 빈도를 구한다. 두 번째 단계에서는 첫단계에서 얻은 단백질 프로파일을 신경망의 입력으로 사용하여 단백질 이차구조를 예측한다. 세 번째 단계에서는 대규모 단백질 구조 자료인 PDB[12]에서 이차 구조를 예측하고자 하는 질의 단백질 서열의 부분서열들과 유사한 부분 서열을 찾는다. 유사한 부분 서열은 최소한 10개 이상의 연속된 아미노산이 갭이 없이 질의 서열과 일치하고, 10-9이하의 BLAST 기댓값을 갖고, 45%이상의 아미노산이 일치하고, 55%이상의 양의 치환값을 가져야 유사한 서열로 판정하는 조건을 가진다. 질의 서열의 각 위치에 대응하는 유사 부분 서열의 이차 구조를 수집하여, 가장 빈도가 높은 이차 구조로 그 위치의 이차 구조로 예측한다. 두 번째 단계에서 얻은 예측 결과는 세 번째 단계에서 예측되는 결과가 없는 위치에 사용한다. | |
단백질의 일차 구조란 무엇을 의미하는가? | 이러한 예측 방법들을 뒷받침하는 중요한 구성 요소 기술로서 단백질의 이차 구조 예측이 사용된다. 단백질의 일차 구조는 단백질을 구성하는 아미노산 서열을 의미하고, 이차 구조는 이들 아미노산의 카보닐기 산소 원자와 아민기 수소 원자 사이에 수소 결합이 형성되어 열역학적으로 안정하기 때문에 나타나는 국소적으로 규칙적 구조인 나선이나 병풍 등의 구조적 형태를 의미한다[1]. | |
단백질 이차 구조 예측에서 입력으로 단백질 서열을 직접적으로 사용하지 않고 유사한 서열들의 평균적인 단백질 서열을 사용하는 이유는 무엇 때문인가? | 현재의 단백질 이차 구조 예측과 단백질 구조 예측 방법들은 입력으로 단백질 서열을 직접적으로 사용하지 않고, 입력 서열과 유사한 서열들을 단백질 자료에서 찾아내어 이들의 평균적인 단백질 서열을 사용한다[2-5]. 이것은 질의 서열만을 사용하는 것보다 유사 서열들로 이루어지는 단백질 패밀리에서 이차 구조 등의 단백질 구조가 더 잘 보존되므로, 단백질 프로파일을 사용하는 것이 서열을 직접 사용하는 것보다 예측 성능이 높기 때문이다. 이밖에도 단백질 이차 구조 예측에 진화 정보를 이용하는 방법은 입력 서열과 유사한 서열 들의 예측 결과를 각각 구하여 이들 결과의 투표로서 최종 예측을 결정하는 방법이 있다[3]. |
H. Lodish, A. Berk, C.A. Kaiser, et al., Molecular Cell Biology, 6th Ed. New York, NY: W. H. Freeman and Company, 2007.
H. W. Buchan, et al., "Scalable web services for the PSIPRED protein analysis workbench," Nucleic Acids Res., vol. 41, W72-W76, Jul. 2013.
C. N. Magnan and P. Baldi, "SSpro/ACCpro 5: almost perfect prediction of protein secondary structure and relative solvent accessibility using profiles, machine learning and structural similarity," Bioinformatics, vol. 30, no. 18, pp, 2592-2597, Sep. 2014.
C. Mirabello and G. Pollastri, "Porter, PaleAle 4.0: high-accuracy prediction of protein secondary structure and relative solvent accessibility," Bioinformatics, vol. 29, no. 16, pp. 2056-2058, Aug. 2013.
R. Yan, et al, "A comparative assessment and analysis of 20 representative sequence alignment methods for protein structure prediction," Scientific Reports 3, Article number: 2619, Sep. 2013.
J. Zhou and O. Troyanskaya, "Deep supervised convolutional generative stochastic network for protein secondary structure prediction," in JMLR Proceedings, 32, pp. 745-753, Beijing, China, 2014.
M. Spencer, J. Eickholt and J. Cheng, "A deep learning network approach to ab initio protein secondary structure prediction," IEEE/ACM Trans. Comput. Biol. Bioinform., vol. 12, no. 1, pp. 103-112, Jan.-Feb. 2015.
R. Heffernan, et al, "Improving prediction of secondary structure, local backbone angles, and solvent accessible surface area of proteins by iterative deep learning," Scientific Reports 5, Article number: 11476, June 2015.
S. Wang, J. Peng, J. Ma, and J. Xu, "Protein secondary structure prediction using deep convolutional neural fields," Scientific Reports 6, Article number: 18962, Jan. 2016.
S. F. Altschul, et al, "Gapped blast and PSI-BLAST: a new generation of protein database search programs," Nucleic Acids Res., vol. 25, no. 17, pp. 3389-3402, Sep. 1997.
B. E. Suzek, et al, "Uniref: comprehensive and nonreduncant uniprot reference clusters," Bioinformatics, vol. 23, no. 10, pp. 1282-1288, May 2007.
H. M. Berman, et al, "The protein data bank," Nucleic Acids Res. vol. 28, no. 1, pp. 235-242, Jan. 2000.
W. Kabsch and C. Sander, "Dictionary of protein secondary structure: pattern recognition of hydrohen-bonded and geometrical features," Biopolymers, vol. 22, no. 12, pp. 2577-2637, Dec. 1983.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.