보고서 정보
주관연구기관 |
서울시립대학교 University Of Seoul |
연구책임자 |
백은옥
|
참여연구자 |
박희진
,
나승진
,
이선호
|
보고서유형 | 2단계보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2008-06 |
과제시작연도 |
2007 |
주관부처 |
과학기술부 |
사업 관리 기관 |
한국과학재단 Korea Science and Engineering Foundtion |
등록번호 |
TRKO200800006615 |
과제고유번호 |
1355049245 |
사업명 |
21세기프론티어연구개발사업 |
DB 구축일자 |
2015-01-08
|
키워드 |
단백질.펩타이드.수식화.질량분석.알고리즘.protein.peptide.post-translational modification.mass spectrometry.algorithm.
|
초록
▼
세포의 성장, 분화, 노화, 사멸 등 자연현상과 질병유발, 방어, 환경에 대한 적응과 같은 생명현상에 있어 핵심적인 역할을 하는 것으로 알려진 단백질의 수식화 (post-translational modification) 정보를 대량으로 빠르게 동정할 수 있는 질량분석기의 활용이 프로테오믹스 연구개발분야의 핵심 분석기술로 자리잡고 있다. 그러나, 단백질의 수식화 동정에 사용되는 고가의 질량분석 장비의 활용은, 소프트웨어 알고리즘의 한계로 인하여, 폭넓게 이루어지고 있지 못하다.
PTM 동정을 좀더 정확히, 좀더 신속히 함으로써
세포의 성장, 분화, 노화, 사멸 등 자연현상과 질병유발, 방어, 환경에 대한 적응과 같은 생명현상에 있어 핵심적인 역할을 하는 것으로 알려진 단백질의 수식화 (post-translational modification) 정보를 대량으로 빠르게 동정할 수 있는 질량분석기의 활용이 프로테오믹스 연구개발분야의 핵심 분석기술로 자리잡고 있다. 그러나, 단백질의 수식화 동정에 사용되는 고가의 질량분석 장비의 활용은, 소프트웨어 알고리즘의 한계로 인하여, 폭넓게 이루어지고 있지 못하다.
PTM 동정을 좀더 정확히, 좀더 신속히 함으로써 단백질의 다양한 변화양태를 올바르게 파악하여, 질병에 대한 약물의 타겟 단백질의 발굴이나 질병의 조기 진단을 가능하게 하는 표지 단백질의 발견을 앞당길 수 있다. 기존의 PTM 동정을 위한 알고리즘은 2가지 측면에서 한계를 갖고 있다. 하나는 해석에 사용되는 PTM의 종류가 10여개 이내로 매우 제한적이다. 다른 제한 요소는 하나의 펩타이드 내에서 해석가능한 PTM의 개수이다. 기존의 거의 모든 알고리즘이 하나의 펩타이드에 대해서 최대 2개까지의 PTM 해석만을 제공하고 있다. 이와 같은 기존 소프트웨어 기술의 한계를 넘어서는 새로운 개념의 알고리즘인 MODi를 개발하여 국제적으로 인정을 받았다.
PTM의 동정은 질량분해능과 정확성에 있어 기존보다 훨씬 뛰어난 최신의 질량분석기기인 FT-ICR MS을 활용을 통해 고도화될 수 있다. 그러나 최신 기술을 활용한 장비인 FT-ICR MS의 경우에도 관련 소프트웨어 기술의 개발이 미비하여 PTM 해석에 활용하는 데에 많은 어려움이 있다. 이를 극복하기 위해 FT-ICR MS 해석 소프트웨어 중 핵심기술에 해당하는 단동위질량 결정 알고리즘을 자체적으로 개발하여 확보하였다. 개발된 단동위질량 결정 알고리즘은 확률모델에 기반한 수학적인 알고리즘으로서, 기존의 패턴인식에 기반한 알고리즘에 비해 월등히 뛰어난 성능을 보인다.
PTM 해석을 위해서는 비교적 정밀도가 높은(약 100ppm 이하) 질량분석기기의 활용이 필요하나, 많이 보급되어 있는 저정밀도의 이온트랩 장비에서도 활용할 수 있도록 하기 위해 추가적인 알고리즘의 개발을 추진하여, 이온트랩 데이터의 스펙트럼의 quality를 평가할 수 있는 알고리즘과 precursor 이온의 하전량을 결정하는 알고리즘의 개발에 성공하였다.
이와 같이 개발된 다양한 소프트웨어는 웹에서 공개하여 연구자들이 자유롭게 사용할 수 있도록 제공하고 있다.
Abstract
▼
Identification of post-translational modifications (PTMs) is important to understand biological functions of proteins. Tandem mass spectrometry (MS/MS) is a useful tool for identifying PTMs. Howebver, most existing search tools are restricted to take only a few types of PTMs as an input. We develope
Identification of post-translational modifications (PTMs) is important to understand biological functions of proteins. Tandem mass spectrometry (MS/MS) is a useful tool for identifying PTMs. Howebver, most existing search tools are restricted to take only a few types of PTMs as an input. We developed a new algorithm, called MODi, which rapidly searches for all known types of PTMs at once, without limiting a multitude of modified sites in a peptide. MODi, introduces a notion of a tag chain, a computational structure made from multiple sequence tags, which effectively localizes modified regions within a spectrum and overcomes de novo sequencing errors common in tag-based approaches. When MODi is used in combination with an experimental strategy that selectively excludes abundant, unmodified peptides from MS/MS, the identification of low-abundant, modified peptides are possible. Identification of certain modified peptides, especially those with disulfide bonds, calls for data analysis different from standard peptide sequencing and PTM analysis. Once all the PTMs, including disulfide bonds, as well as single amino acid substitutions are taken into account during data analysis by MODi, we are left with localized areas of a spectrum that cannot be interpreted. Frequent mass discrepancies in those areas may indicate novel modifications, the discovery of which is made easy by MODi.
Determining isotopic clusters and their monoisotopic masses is a first step in interpreting complex mass spectra generated by high resolution mass spectrometers. We propose a mathematical model for isotopic distributionsof polypeptides and an effective interpretation algorithm. Our model uses two types of ratios: intensity ratio of two adjacent peaks and intensity ratio product of three adjacent peaks in an isotopic distribution. These ratios can be approximated as simple functions of a polypeptide mass, the values of which fall within certain ranges, depending on the polypeptide mass. Given a spectrum as a peak list, our algorithm first finds all isotopic clusters consisting of two or more peaks. Then, it scores
clusters using the ranges of ratio functions and computes the monoisotopic masses of the identified clusters. Our method was applied to high resolution mass spectra obtained from a Fourier transform ion cyclotron resolution (FT-ICR) mass spectrometer coupled to reverse-phase liquid chromatography (RPLC). For polypeptides whose amino acid sequences were identified by MS/MS, we applied both THRASH-based software implementations and our method. Our method was observed to find more masses of known peptides when the numbersof the total clusters identified by both methods were fixed. Experimental results show that o r method performed better for isotopic mass clusters of weak intensity where the
isotopic distributions deviate significantly from their theoretical distributions. Also, it correctly identified some isotopic clusters that were not found by THRASH-based implementations, especially those for which THRASH gave 1 Da mismatches. Another advantage of our method is that it is very fast,much faster than THRASH that calculates the least-squares fit.
목차 Contents
- 제출문...1
- 보고서 초록...2
- 요약문...3
- SUMMARY...5
- CONTENTS...7
- 목차...9
- 제1장 연구개발과제의 개요...11
- 제1절 연구개발의 목적...11
- 제2절 연구개발의 필요성...12
- 1. PTM 동정의 제한적 사항...12
- 2. PTM 동정 기술 개발의 필요성...12
- 3. PTM 동정 기술 개발의 최근동향...13
- 제3절 연구개발 계획과 범위...14
- 1. 연구개발 범위...14
- 제2장 국내외 기술개발 현황...16
- 제1절 연구개발의 단계...16
- 제2절 현재의 연구개발 실적과 취약점...16
- 1. 현재 PTM 동정 기술의 제한점...16
- 2. 기존의 PTM 동정을 위한 알고리즘...17
- 3. 본 연구에서 제안하는 알고리즘...18
- 제3절 연구개발의 전망과 경제성...18
- 제3장 연구개발 수행내용 및 결과...20
- 제1절 연구개발 결과...20
- 1. MODi...20
- 가. 필요성...20
- 나. 연구목표...20
- 다. 연구내용 및 주요결과...20
- 2. MassPective...22
- 가. Introduction...22
- 나. Menu...23
- 다. Function descriptions...24
- 3. Xrea, Fragment ion의 intensity를 활용하는 spectral quality 및 penalty feature의 도입...39
- 4. MS/MS 스펙트럼 precursor ion의 charge 결정...41
- 5. FT mass에서의 charge 및 monoisotopic mass 결정...43
- 가. 정확한 isotopic distribution 모델 개발...43
- 나. Isotopic distribution의 질량 결정 알고리즘...52
- 다. 실험 결과...56
- 제4장 목표달성도 및 관련분야에의 기여도...62
- 제1절 연구개발의 목표달성 계획 및 평가착안점...62
- 1. 연구개발 평가착안점 및 달성도...62
- 2. 평가의 착안점에 따른 목표달성도에 대한 자체평가...63
- 3. 연구개발결과의 기여도...64
- 가. 최종목표대비 2단계 주요성과의 기여도...64
- 나. 예상되는 파급효과...64
- 다. 과학기술적 파급효과...65
- 라. 산업적 파급효과...65
- 마. 실용화 실적 및 사업화 활용가능성...66
- 4. 연구개발의 부수적 효과...66
- 가. 연구개발 인프라 구축...66
- 나. 부수적 연구개발성과...66
- 다. 정성적 의견(국제적 기준에서의 중요도 등)...67
- 5. 연구개발 수행노력의 성실도...67
- 제5장 연구개발결과의 활용계획...69
- 제1절 기대성과...69
- 1. 기술적 측면...69
- 2. 경제·산업적 측면...69
- 제2절 활용방안...69
- 제3절 연구개발결과에 대한 활용가능성...70
- 제6장 연구개발과정에서 수집한 해외과학기술정보...72
- 제1절 국외의 기술동향 및 수준...72
- 제2절 업체현황...73
- 제7장 참고문헌...74
※ AI-Helper는 부적절한 답변을 할 수 있습니다.