$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

Fisher Criterion을 이용한 Gene Set Enrichment Analysis 기반 유의 유전자 집합의 검출 방법 연구
Identifying Statistically Significant Gene-Sets by Gene Set Enrichment Analysis Using Fisher Criterion 원문보기

電子工學會論文誌. Journal of the Institute of Electronics Engineers of Korea. CI, 컴퓨터, v.45 no.4 = no.322, 2008년, pp.19 - 26  

김재영 (경북대학교 정보통신학과) ,  신미영 (경북대학교 전자전기컴퓨터학부)

초록
AI-Helper 아이콘AI-Helper

Gene set enrichment analysis (GSEA)는 두 개의 클래스를 가지는 마이크로어레이 실험 데이터 분석을 위해 생물학적 특징을 기반으로 구성된 다양한 유전자-집합 중에서 두 클래스의 발현값들이 통계적으로 중요한 차이를 나타내는 유의한 유전자-집합을 추출하기 위한 분석 방법이다. 특히, 유전자에 대한 다양한 생물학적인 정보를 지닌 유전자 주석 데이터베이스(Cytogenetic Band, KEGG pathway, Gene Ontology 등)를 이용하여 마이크로어레이 실험에 사용된 전체 유전자 중 특정 기능을 가지는 유전자들을 그룹화하여 다양한 유전자-집합을 발굴하고, 각 유전자-집합 내에서 두 클래스간에 발현값의 차이를 참조하여 유의한 유전자들을 결정하여, 이를 기반으로 통계적으로 유의한 유전자-집합들을 최종 검출하는 방법이다. 본 논문에서는 GSEA 분석 과정에서 현재 주로 사용되고 있는 signal-to-noise ratio 기반 유전자 서열화(gene ranking) 방법 대신에, Fisher criterion을 이용한 유전자 서열화 방법을 적용함으로써 기존의 GSEA 방법에서 추출하지 못한 생물학적으로 의미 있는 새로운 유의 유전자-집합을 추출하는 방법을 제안하고자 한다. 또한, 제안한 방법의 성능을 고찰하기 위하여 공개된 Leukemia 관련 마이크로어레이 실험 데이터 분석에 적용하였으며, 기존의 알려진 결과와 비교 분석함으로써 제안한 방법의 유용성을 검증하고자 하였다.

Abstract AI-Helper 아이콘AI-Helper

Gene set enrichment analysis (GSEA) is a computational method to identify statistically significant gene sets showing significant differences between two groups of microarray expression profiles and simultaneously uncover their biological meanings in an elegant way by employing gene annotation datab...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 이러한 문제를 해결하기 위하여 Fisher criterion[4'6]°fl 기반한 유전자 서열화 방법을 적용함으로써 어느 한 클래스에서의 발현값이 다른 클래스에 비해 높거나 낮은 것 중 하나를 선택하기보다는 두 클래스에서 나타나는 발현값의 차이가 통계적으로 의미를 나타내는 유전자들을 대상으로 유의한 유전차- 집합을 검출하고자 한다. 데이터 분석 실험을 위해 Golub et al.
  • 본 실험에서는 DNA 마이크로어레이 실험을 통해 획득한 Leukemia 관련 유전자 발현 프로파일을 이용하여 AML과 ALL을 구분할 수 있는 유의한 유전자-집합 및 유전자들을 검출하기 위해, 유전자 서열화 방법으로 SNR을 사용한 GSEA와 Fisher oiterion을 사용한 GSEA를 비교 분석하고자 하였다. 이를 위하여, 먼저 KEGG Pathwa产成嘻 이용하여 旳개의 유전자-집합을 구성하였고, 이 중 AML과 ALL 두 클래스에서 중요한 발현값의 차이를 나타내는 유의한 유전자-집합을 찾아내고 이들의 패스웨이 기능을 분석하였다.
  • 이 방법은 두 개의 클래스를 가지는 마이크로 어레이 비교 분석 실험에서 특정 생물학적 공통 요소를 지닌 유전자들로 구성된 다양한 유전자-집합(gene-set) 을 생성하고, 이 중에서 두 클래스 간에 발현값의 차이가 유의하게 나타나는 유전자-집합을 통계적 분석을 통해 찾아내는 방법이다. 이것은 기존의 유의 유전자 추출 방법들이 다른 생물학적인 정보를 고려하지 않고 수치적인 발현 데이터에만 의존하여 분석함으로써 생물학적 메커니즘을 이해하기 위해 추가적인 별도의 생물학적 분석과정이 필요했던 것과는 달리, 유의 유전자 집합을 추출하기 위한 자체 분석과정에서 생물학적인 정보를 발현 프로파일과 함께 고려하여 유의성을 판단함으로써 이전의 문제를 해결하고자 하였다.
  • 이상에서와 같이 본 논문에서는 GSEA 분석을 위한 유전자 서열화 방법으로서 일반적으로 사용되는 SNR 방법 대신 Fisher Criterion을 이용하는 방법을 제안하고, 이의 유용성을 백혈병 관련 실험 분석을 통해 살펴보았다. 실험 결과에 의하면 SNR 기반 유전자 서열화 방법을 이용한 경우 백혈병의 두 클래스인 AML과 ALL에서 중요한 발현값의 차이를 보이는 유의한 패스 웨이로서 실제 생물학적으로 관련성이 밝혀진 총 5개의 패스 웨이 중 2개만을 찾아낼 수 있었다.
본문요약 정보가 도움이 되었나요?

참고문헌 (22)

  1. A. Subramanian et al., "Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles.", Proc. Natl Acad Sci USA 102: 15545-50, Sep 2005 

  2. E. Taskesen, "Sub-typing of model organisms based on gene expression data." Bioinformatics technical University of Delft Research Assignment, 2006 

  3. S. Monti et al., "Molecular profiling of diffuse large B-cell lymphoma identifies robust subtypes including one characterized by host inflammatory response.", Blood. 2005 Mar 1;105(5):1851-61, Nov 2004 

  4. C. Bishop, "Neural Networks for Pattern Recognition", Oxford University Press, Oxford, 1995 

  5. A. Blum et al., "Selection of relevant features and example in machine learning", Artificial intelligence, 97:245-271, 1997 

  6. P. Bradley et al., "Feature selection via mathematical programming", Technical report to appear in INFORMS Journal on computing, 1998 

  7. A. Zhang, "Advanced analysis of gene expression microarray data", World Scientific, 2006 

  8. S. Dudoit et al., "Multiple Testing Procedures and Applications to Genomics", Springer, 2007 

  9. G. J. McLachlan et al., "ANALYZING MICROARRAY GENE EXPRESSION DATA", WILEY-INTERSCIENCE John Wiley & Sons, 2004 

  10. S. Dudoit et al., "Multiple Hypothesis Testing in Microarray Experiments", Statistical Science, 18: 71-103, 2003 

  11. Y. Ge et al., "Resampling-based multiple testing for microarray data analysis", Technical Report 633, Department of Statistics, University of California, Berkeley, 2003 

  12. V. G. Tusher et al., "Significance analysis of microarrays applied to the ionizing radiation response", Proc Natl Acad Sci. 24;98(9):5116-21, Apr 2001 

  13. R. Gentleman et al., "Bioinformatics and Computational Biology Solutions Using R and Bioconductor", Springer, 2005 

  14. J. Verzani, "Using R for Introductory Statistics" Chapman & Hall/CRC, Boca Raton, FL, 2005 

  15. T. R. Golub et al., "Molecular classification of cancer: class discovery and class prediction by gene expression monitoring", Science (Wash. DC), 286: 531.537, 1999 

  16. KEGG: Kyoto Encyclopedia of Genes and Genomes , http://www.genome.ad.jp/kegg/ 

  17. M. Kanehisa et al., "The KEGG databases at GenomeNet, Nucleic Acids Res.", 30:42-46, 2002 

  18. S. Kawashima et al., "KEGG API: A Web Service Using SOAP/WSDL to Access the KEGG System", Genome Informatics 14: 673-674, 2003 

  19. I. Dinu et al., "Improving GSEA for analysis of biologicpathways for differential gene expression across a binary phenotype.", Collection of Biostatistics, 2007 

  20. T. Manoli et al., "Group testing for Pathway analysis improves comparability of different microarray datasets", Bioinformatics, 22(20):2500-2506, 2006 

  21. S. Kudsen, "Cancer Diagnostics with DNA Microarrays", John Wiley & Sons, Inc., 2006 

  22. C. Potten et al., "Apoptosis", Cambridge University Press, 2005 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로