$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

차세대 시퀀싱 데이터를 위한 SNP 분석 방법
SNP Analysis Method for Next-generation Sequencing Data 원문보기

한국정보처리학회 2010년도 추계학술발표대회, 2010 Nov. 12, 2010년, pp.95 - 98  

홍상균 (한림대학교 컴퓨터공학과) ,  이덕해 (한림대학교 컴퓨터공학과) ,  공진화 (한림대학교 컴퓨터공학과) ,  김덕근 (한림대학교 컴퓨터공학과) ,  홍동완 (한림대학교 컴퓨터공학과) ,  윤지희 (한림대학교 컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

최근 차세대 시퀀싱 기술의 급속한 발전에 따라 서열 정보의 해독이 비교적 쉬워지면서 개인별 맞춤의학의 실현에 대한 기대와 관심이 높아지고 있다. 각 개인의 서열 정보 사이에는 SNP (single nucleotide polymorphism), Indel, CNV (copy number variation) 등의 다양한 유전적 구조 변이가 존재하며, 이러한 서열 정보의 부분적 차이는 각 개인의 유전적 특성 및 질병 감수성 등과 밀접한 관련을 갖는다. 본 연구에서는 차세대 시퀀싱 결과로 산출되는 수많은 짧은 DNA 서열 조각인 리드 데이터를 이용한 SNP 추출 알고리즘을 제안한다. 제안된 알고리즘에서는 레퍼런스 시퀀스의 각 위치에 대한 리드 시퀀스의 매핑 정보를 기반으로 SNP 후보 영역을 추출하며, 품질 정보 등을 활용하여 에러 발생률을 최소화한다. 또한 대규모 시퀀싱 데이터와 SNP 구조 변이 데이터의 효율적인 저장/검색을 지원하는 시각적 분석 도구를 구현하여 제안된 방식의 유용성을 검증한다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 차세대 시퀀싱 기술을 활용한 SNP 분석 방법을 제안하였다. 제안하는 SNP 분석 방법은 차세대 시퀀싱 데이터를 레퍼런스 서열에 매핑하여 매핑된 리드의 염기 분포, 품질 점수 등의 정보를 활용하여 SNP 영역을 추출한다.
  • 본 연구에서는 차세대 시퀀싱 데이터를 이용한 효율적인 SNP 분석 방법을 제안한다. 제안하는 방법은 차세대 시퀀싱 데이터인 리드를 기존에 완성된 레퍼런스 서열에 매핑하고 매핑된 위치를 기반으로 레퍼런스와 리드의 염기 서열을 비교하는 방법으로 염기의 품질 점수 (quality score) [5]와 염기 서열의 분포 정보를 활용하여 SNP 분석을 수행한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
SNP의 접합자 구조 중 동형접합은 무엇인가? 접합자 구조에는 동형접합과 이형접합 (heterozygous)이 있다.동형접합은 SNP로 추출되는 염기가 매우 높은 출현 빈도를 보이는 단일 염기인 경우를 의미한다. 이형접합은 SNP로 추출되는 염기들의 출현빈도가 높지 않고 다수의 염기가 선택되는 경우를 의미한다.
시퀀싱 데이터 분석을 정확하게 수행하기 위해서는 어떤 데이터를 필요로 하는가? 시퀀싱 데이터 분석을 정확하게 수행하기 위해서는 매우 높은 리드 커버리지 (read coverage) 데이터를 필요로 한다. 제 1세대의 생어 시퀀싱 (sanger sequencing) 기술[7]은 1kbp 정도의 리드를 생성할 수 있지만 매우 고가의 실험이므로 리드 커버리지를 높이기 어려웠다.
유전적 구조 변이는 무엇으로 구분되는가? 그러나 개인의 서열 정보 사이에는 다양한 크기와 형태의 유전적 구조 변이 (genetic structural variation)가 존재하며, 이러한 변이가 유전적 특성을 나타내기도 하며, 유전병의 발병 원인이 되는 것으로 알려져 있다 [3]. 유전적 구조 변이는 작은 영역의 시퀀스 미스매치 (small sequence mismatch), 삽입 (insertion), 삭제 (deletion), 전이 (inversion),단위 반복 변이 (copy number variation), 그리고 SNP 등으로 구분된다.
질의응답 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로