$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

유전체 생태계 분석을 위한 알고리즘 구현: 미토콘드리아 사례
The Algorithm of implementation for genome analysis ecosystems : Mitochondria's case 원문보기

디지털융복합연구 = Journal of digital convergence, v.14 no.4, 2016년, pp.349 - 353  

최성자 (충남대학교 융복합시스템공학과) ,  조한욱 (충남대학교 전기.전자.통신공학교육과)

초록
AI-Helper 아이콘AI-Helper

융복합 패러다임의 도입은 방대한 유전체 정보의 분석을 위한 컴퓨팅 기술의 연구 및 개발 또한 활발히 진행되고 있다. 최근 유전체 분석 서비스 유형은 개인의 유전체 정보(personal genome analysis)를 읽어서 특정 질환들의 발병 확률 등을 알려주고, 해당 질병을 예방할 수 있도록 식습관, 라이프 스타일등의 변화를 꾀하도록 맞춤형의 서비스를 제공하고 있다. 생물의 특성을 결정하는 정보는 유전자이며, 이 유전자는 DNA 염기서열에 따라 결정되므로, 유전체 정보의 분석기술은 정확하고 빠르게 수행되어야 한다. 정확한 유전체 분석을 빠르게 수행하기위해 K-Mean 클러스터링 기법을 활용하였으며, 코돈 데이타 패턴을 추출하여 유전체 정보 분석에 적용하였다. 또한, 미토콘드리아 데이타군을 실험사례로 제공한다. 본 연구의 결과, 제공된 분석 데이타를 통해 기존의 문자열 형태의 유전체 분석 기법을 이미지 패턴 형태로 추출이 가능하며, 패턴형태의 이미지는 분석시간의 단축과 정확도를 높인다.

Abstract AI-Helper 아이콘AI-Helper

The studies on the human environment and ecosystem analysis is being actively researched. In recent years, The service of genome analysis has been offering the customized service to prevent the disease as reading an individual's genome information. The genome information by analyzing technology is b...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • 핵을 둘러싸는 세포질에는 유전암호를 해독하여 단백질을 합성하는 리보좀, 세포의 에너지를 공급하는 미토콘드리아, 생산된 단백질을 저장하는 골지체, 독을 제거하는 리소좀, 핵과 세포질 사이를 출입하는 소포체등이 있다. 본 논문에서는 미트콘드리아의 하나의 아미노산을 지정하는 세 개의 뉴클레오드 배열의 코돈(Codon)을 활용하여 클러스터링화 하였다.
  • 3]에서 보여주고 있다. 본 논문에서는 휴먼 미트콘드리아의 K-Mean 클러스터링을 통해 분석된 클러스터링 군 밀집도를 [Fig. 4]에서 보여주고 있다. 클러스터링 군을 표현하기 위해 {^,*,+,o} 문자셋을 클러스터링 표현을 위해 플럿상에 구분하였으며, cluster1, cluster 2, cluster3, cluster4에 각각 매핑 되었다.
  • 4]에서 보여주고 있다. 클러스터링 군을 표현하기 위해 {^,*,+,o} 문자셋을 클러스터링 표현을 위해 플럿상에 구분하였으며, cluster1, cluster 2, cluster3, cluster4에 각각 매핑 되었다. 클러스터링 결과 화면을 통해, 코돈 데이타 셋은 뉴클레오드유형의 새로운 데이타 패턴을 제공하며, 코돈 데이타 셋을 통해 유전체 분석 및 비교가 가능하며, 패턴의 유형에 따라 유전체 예측이 가능할 것으로 보여 진다.
  • 클러스터링 데이타 셋을 얻기 위해 genBank 데이타 군의 휴먼 미트콘드리아 유전체의 클러스터링 셋을 얻기 위한 코드를 수행하였으며, 적용된 알고리즘을 수행하여 [Table 2]의 코돈 클러스터링 데이타 셋을 추출하였다. 코돈 데이타 셋은 리신(AAA)가 167의 오브젝트 군으로 구성되어 있으며, 아스파라긴(AAC)는 171개의 오브젝트 군으로 구성된 데이타 셋을 확인할 수 있다.
  • 텍스트 유형의 유전체정보를 코돈 조합을 추출하여 클러스터링 후 이미지 형태의 패턴을 생성하여 유전체 정보를 분석하였다. 이는 기존의 텍스트 유형의 방법보다 빠르고 손쉽게 유전체 정보를 추출 할 수 있다.

이론/모형

  • K-Mean 클러스터링 알고리즘은 분할법을 적용한다. 분할법은 주어진 데이타를 여러 그룹으로 분할하며, 입력된 데이타 보다 작거나 같은 k개의 군집으로 나눈다.
  • 또 한, Furlong[5]은 야생형 대 돌연변이의 유전자 발현 변화 패턴을 찾기 위해 클러스터링을 사용하였다. 대표적인 클러스터링 알고리즘은 계층응집성 클러스터링 [14,15,16], K-Mean 클러스터링[6], 자기조직화 지도[7] 등이 있으며, 본 논문에서는 매틀랩을 활용하여 유전체 생태계 정보를 K-Mean 클러스터링 기법을 적용하여 구현하였다. 미트콘드리아 유전체정보는 유전자 재조합이 거의 없기 때문에 실험 데이터로 활용하였으며, 제시된 알고리즘을 활용하여 코돈 조합의 데이터 군을 클러스터링화 하였고, 유전체 분석 패턴이 가능한 이미지를 생성하여 결과를 확인할 수 있다.
  • 클러스터링은 계층적 구조와 분할적 구조로 구분되며, 계층적 구조는 단일 링크와 완전링크기법이 있다. 또한, 분할적 구조를 사용한 클러스터링은 그래프이론, 혼합해법, 모드탐색, 스케어 에러등의 기법을 적용한다
  • 유전체분석[8,9]을 위한 미토콘드리아 데이타 군을 적용하였으며, 미토콘드리아의 기본 데이타 군을 분석하기 위해 MatLab 2015b 버전을 사용하여 분석하였다. [Fig.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
시퀀싱기법이란? 유전체 정보의 분석을 위해 시퀀싱 과정을 거쳐야 하는데 염기의 순서를 화학적으로 읽어서 염기서열해독과정을 수행한다. 시퀀싱기법은 생명체가 가지고 있는 전체 유전체를 해독하는 방법이며, 이를 통해 서로 다른 개체들간의 특이적인 변이를 찾거나 질환 특이적인 변이를 찾는데 유용하게 적용되고 있다. 시퀀싱 기법의 응용 예는 다음과 같다.
시퀀싱기법은 무엇에 유용하게 적용되고 있는가? 유전체 정보의 분석을 위해 시퀀싱 과정을 거쳐야 하는데 염기의 순서를 화학적으로 읽어서 염기서열해독과정을 수행한다. 시퀀싱기법은 생명체가 가지고 있는 전체 유전체를 해독하는 방법이며, 이를 통해 서로 다른 개체들간의 특이적인 변이를 찾거나 질환 특이적인 변이를 찾는데 유용하게 적용되고 있다. 시퀀싱 기법의 응용 예는 다음과 같다.
시퀀싱 기법의 응용 예는 무엇이 있는가? 시퀀싱 기법의 응용 예는 다음과 같다. 질병진단을 위한 Maker 개발에 활용 가 능한 DNA Marker, 유전체 전체 지도 구축과 양적 형질 연구, HapMap construction & GWAS, 돌연변이에 대한 연구(Mutation Research), 개체의 진화와 타개체간의 진화연구(Evolution Stury)에 응용되고 있다. 대표적인 시퀀싱 기법중의 하나인 Sanger 기법은 생물체(대장균, 박 테리아 등)을 증폭하여 순차적인 촬영과 이미지를 판독하여 상대적으로 긴 Read를 사용한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. Keun-Ho Lee, "A Method of Defense and Security Threats in U-Healthcare Service", Journal of the Korea Convergence Society, Vol. 3, No. 4, pp. 1-5, 2012. 

  2. Eun-Hee Park, Hye-Suk Kim, Ja-Ok Kim, "The Effect of Convergence Action Learning techniques in Simulation Class", Journal of the Korea Convergence Society, Vol. 6, No. 5, pp. 241-248, 2015. 

  3. P. Tamayo et al., Interpreting patterns of gene expression with self-organizing maps: methods and application to hematopoietic differentiation, PNAS 96: 2907-12, 1999. 

  4. A. Alizadeh et al., Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling, Nature 403: 503-11, 2000. 

  5. E. Furlong et al., Patterns of Gene Expression During Drosophila Development, Science 293: 1629-33, 2001. 

  6. Evanno, Guillaume, Sebastien Regnaut, and Jerome Goudet. "Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study." Molecular ecology 14.8 (2005): 2611-2620. 

  7. Oja, Merja, Samuel Kaski, and Teuvo Kohonen. "Bibliography of self-organizing map (SOM) papers: 1998-2001 addendum." Neural computing surveys 3.1 (2003): 1-156. 

  8. Wang, K. et al. Monitoring gene expression profile changes in ovarian carcinomas using cDNA microarray. Gene 229, 101-108 (1999). 

  9. Eisen, M. B., Spellman, P. T., Brown, P. O. & Botstein, D. Cluster analysis and display of genome-wide expression patterns. Proc. Natl Acad. Sci. USA 95, 14863-14868 (1998). 

  10. Nakamura, Yasukazu, Takashi Gojobori, and Toshimichi Ikemura. "Codon usage tabulated from international DNA sequence databases: status for the year 2000." Nucleic acids research 28.1 (2000): 292-292. 

  11. Crick, Francis HC. "Codon-anticodon pairing: the wobble hypothesis." Journal of molecular biology 19.2 (1966): 548-555. 

  12. Ikemura, Toshimichi. "Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes: a proposal for a synonymous codon choice that is optimal for the E. coli translational system." Journal of molecular biology 151.3 (1981): 389-409. 

  13. Wellmer, Frank, and Jose Luis Riechmann. "Gene network analysis in plant development by genomic technologies." International Journal of Developmental Biology 49.5/6 (2005): 745. 

  14. Jobson, J. (1992) Applied Multivariate Data Analysis: Categorical and Multivariate Methods (Springer, NewYork). 

  15. Hartigan, J. (1975) Clustering Algorithms (Wiley, New York). 

  16. Gordon, A. E. (1981) Classification: Methods for the Exploratory Analysis of Multivariate Data (Chapman & Hall, New York). 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로