$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

바이오 데이터 패턴 분석을 위한 시스템 및 알고리즘 설계
Design of the System and Algorithm for the Pattern Analysis of the Bio-Data 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.10 no.8, 2010년, pp.104 - 110  

송영옥 (우송대학교 컴퓨터정보학과) ,  김성영 (경북대학교 전기정보컴퓨터공학부) ,  장덕진 (우송대학교 컴퓨터정보학과)

초록
AI-Helper 아이콘AI-Helper

생명과학 분야에서 컴퓨터를 활용할 수 있는 대표적인 예로는 서열화, 서열화 분석, 비교, 진화, 돌연변이 추적, 약 설계를 위한 유사성 비교, 단백질 기능 예측, 그리고 세포 메커니즘과 질병 발생에서의 유전자 역할 예측 등 다양한 분야를 들 수 있다. 생명공학 연구자들에게는 이와 같은 작업을 위한 도구들이 요구되고 있다. 본 논문에서는 바이오 데이터 분석을 위한 기존 시스템의 문제점을 파악하고, 이를 개선할 수 있는 시스템 설계에 초점을 맞추었다. 또한 각각의 분석 작업을 개선할 수 있고 서로 독립적으로 진행되는 기존의 시스템을 통합할 수 있는 통합 분석 시스템을 설계하고자 한다.

Abstract AI-Helper 아이콘AI-Helper

In the field of biotechnology, computer can play varied roles such as the ordinal analysis, ordianl comparison, nutation tracing, analogy comparison for drug design, estimation of protein function, cell mechanism, and verifying the role of a gene for preventing diseases. Additionally, by constructin...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 바이오데이터 패턴을 이용하여 연구되는 분야들은 다양하며 다음 [그림 1]과 같은 기능들이 기본적으로 구현되고 이용되어야 한다. 기존의 시스템에서 DNA Sequence, RNA Sequence, Protain Sequence의 작업들을 각각 독립된 소프트웨어 시스템 환경에서 이루어 졌다면 본 논문에서 설계하고자 하는 시스템에서는 아래의 각 기능들이 하나의 시스템 환경에서 연계성 있게 이루어 질 수 있도록 설계하고자 한다.
  • 본 논문에서 바이오 데이터의 패턴을 효율적으로 분석하고 데이터를 기반으로 데이터베이스를 활용할 수 있는 전반적인 과정을 진행할 수 있는 통합 시스템을 구현하고자 필요한 전체 모듈을 구성요소별로 구분하고 설계하였다. 또한 바이오 데이터 분석에 유용하게 활용될 HMM 알고리즘의 이용을 제안하였다.
  • 본 논문에서는 ORF 검색, 유전자 탐색, 서열 유사성 검색 등의 작업을 고려하여 기존 분석 시스템들의 대표적인 특징 및 개선점들을 조사한 것을 바탕으로 효율적인 바이오 데이터의 분석도구를 구현할 수 있도록 시스템 모델링을 하고자 한다.
  • 본 논문에서는 바이오 데이터를 분석하는데 이용되는 하기위한 기존 시스템에게 공통적인 개선점을 찾아 보았다. 즉 분석 작업의 연계성 부족으로 인해 분석 과정에서 불필요한 작업이 반복되고 있으며 각각의 기능 분석을 위한 시스템을 제공되는 기관들이 서로 달라 사용자에게 여러 가지 불편함과 불필요한 작업들이 요구되는 문제점들이 존재했다.
  • 본 논문에서는 시스템의 모델링을 위하여 모델링 도구인 UML(Unified Modeling Language)[13][14]을 이용하고 유용하고 정확한 바이오 정보를 찾기 위하여 적절한 알고리즘들을 제시하고자 한다.
  • 본 논문에서는 이와 같은 문제점을 개선하여 바이오 데이터 분석 기능에서 주요 기능들을 빠르고 연속성 있게 처리할 수 있는 통합시스템의 필요성을 고려하여 바이오 데이터의 패턴을 분석하고 패턴 분석에 의해 구분 된 유용한 바이오 스트링을 기반으로 그 의미를 연구할 수 있는 통합된 시스템에 필요한 전반적인 작업과정을 모델링을 함으로써 시스템 구현에 이용하고자 한다.
  • [그림 3]에서는 ORF 축출과정을 예로 전체 시스템 요소 사이의 진행과정을 시퀀스 다이어그램을 통하여 절차를 표현하였다. 이와 같은 과정에서 기존 제공되는 검색 도구들이 이용할 때 1부터 3번까지의 과정을 반복적으로 수행하면서 최종 결과를 얻을 수 있었으나 본 설계과정에서는 ORF 축출된 결과와 DB검색결과들을 저장하고 필요에 따라 계속진행이 가능하도록 하여 무의미한 반복을 배제하고자 한다. 이는 기존 검색도구들이 사용자의 연구 결과와 진행 상황들을 보존해 줄 수 없는 문제점을 극복할 수 있도록 개인 연구 자료의 보존기능을 추가하였기 때문이다.
  • 본 논문에서 설계하고자 하는 전체 과정에서 중요한 부분 중 하나는 DNA 서열에서 정렬시키고 서열 유사성 비교 등을 들을 수 있다. 이와 같은 서열데이터에 대분석 작업을 위하여 본 논문에서는 Markov Model(MM)[12]을 개선시켜 Hidden Markov Model(HMM)[13]을 이용하고자 한다. 다음 식 (1)처럼 먼저 바이오 데이터 분석에 MM을 적용시키기 위해 각 상태 \(x_i\)는 이전 상태에 의존적인 서열의 상태를 의미하도록 설정한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
생명과학 분야에서 컴퓨터를 활용할 수 있는 대표적인 예로는 무엇이 있는가? 생명과학 분야에서 컴퓨터를 활용할 수 있는 대표적인 예로는 서열화, 서열화 분석, 비교, 진화, 돌연변이 추적, 약 설계를 위한 유사성 비교, 단백질 기능 예측, 그리고 세포 메커니즘과 질병 발생에서의 유전자 역할예측 등 다양한 분야를 들 수 있다. 또한 데이터베이스를 구축함으로써 다른 데이터 연구에서 클로닝 작업을 하고자 할 때 가용성을 제공할 뿐만 아니라 비교 유전학을 위한 기반으로 사용될 수 있다[11].
바이오인포메틱스의 분야를 크게 3개의 분야로 나누어 보시오. 바이오인포메틱스의 분야를 크게 3개의 분야로 나누고 있다. 첫 번째는 방대한 생명과학자료를 분석하기 위한 정보 처리 알고리즘과 통계 이론을 개발하는 분야이고, 두 번째는 다양한 형태의 정보와 분석 이론들을 도구화해서 생물학자가 사용할 수 있도록 구현하는 분 야이며 마지막으로 세 번째는 유전자와 단백질의 서열과 구조 및 세포와 개체의 기능에 관련된 방대한 정보 를 분석하고 해석하여 생물학적 의미를 찾아내는 분야이다[7][8].
현재까지 일반적으로 이용되고 있는 바이오 데이터 분석 시스템은 무엇인가? 현재까지 일반적으로 이용되고 있는 바이오 데이터 분석 시스템으로는 미국의 NCBI에서 제공되는 데이터 베이스를 비롯하여 각종 분석 도구들이 있으며, EBI, GenomeNet등에서 웹 기반 시스템으로 제공되고 있는 분석 시스템을 들 수 있다. 여러 가지 기능을 통합된 형태로 제공되는 분석 시스템으로 대표적인 것은 NCBI, GeneWebⅡ등을 들 수 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (14)

  1. ETRI(IT-InformationCenter), "bioinformati- cs: Technology & Market Analysis," 2001. 

  2. Andreas D.Baxevanis and B. F. Francis Ouellette, Bioinformatics : A Practical Guide to the Analysis of Genes and Proteins, 2000. 

  3. James Tisdall, "Beginning Perl for Bioinformatics," 2001. 

  4. http://www.ncbi.nlm.nih.gov/Genbank/genbankst ats.html 

  5. http://www.genome.ad.jp/dbget/db_growth.html, 

  6. http://blast.ncbi.nlm.nih.gov/Blast.cgi 

  7. Cynthia Gibas and Per Jambeck, “Developing Bioinformatics Computer Skills,” 2001. 

  8. Susumu Goto and Kotaro Shiraishi, "Constructing and Annotating Genes Database in KEGG," International journal of Genome Research, 1998(10). 

  9. Andreas D. Baxevanis and B. F. Francis Ouleeltte, "bioinformatics : A paractical Guide to the Analysis of Genes and Proteins," WILEY-INTERSCIENCE, 2001. 

  10. W. R. Pearson, "Rapid and sensitive Sequence Comparison with FASTP and FASTA," Methods in Enzymology, 183, pp.63-98, 1990. 

  11. Des Higging and Willie Taylor, "Bioinformatics: sequence, structure and databanks," Oxford University Press, 2000. 

  12. Pachel Karchin and Richard Hughey, "Weighting Hidden Morkov models for maxinum discrimination," Bioinformatics, Vol.14, 9, 1998. 

  13. Dan Pilone, Neil Pitman, "UML 2.0 in a Nutshell," OReilly Media, 2005. 

  14. He Ke-qing, Jian Hong, He Fei, and Ying Shi, "Extended UML with role modeling," Wuhan University, 2009. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로