$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 유전자집합분석에서 순열검정의 대안
A study on alternatives to the permutation test in gene-set analysis 원문보기

응용통계연구 = The Korean journal of applied statistics, v.31 no.2, 2018년, pp.241 - 251  

이선호 (세종대학교 수학통계학부)

초록
AI-Helper 아이콘AI-Helper

마이크로어레이 자료의 유전자집합분석은 개별유전자분석에 비해 검정력도 높일 수 있고 결과 해석이 쉬워서 이에 대한 연구가 활발히 진행되어 왔다. 표현형에 따라 유의한 차이를 보이는 유전자집합의 검색은 검정통계량들이 유도된 배경에 따라 결과에 차이를 보이지만 대체적으로 t-통계량제곱합을 이용한 순열검정이 제일 무난한 방법으로 여겨진다. 그러나 유전자집합분석에서 다중검정은 필수이고 많은 집합들의 유의성에 변별력을 주기 위해서는 순열검정에서 생성하는 치환표본의 수가 많이 필요하고 시간이 오래 걸린다는 문제점이 있다. 순열검정을 대신할 모수적 방법들을 검토한 결과, 적률을 이용한 근사가 각 집합의 유의확률 계산시간도 훨씬 단축하며 순열검정에서 구한 유의확률과 크기와 순위가 거의 일치함을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

The analysis of gene sets in microarray has advantages in interpreting biological functions and increasing statistical powers. Many statistical methods have been proposed for detecting significant gene sets that show relations between genes and phenotypes, but there is no consensus about which is th...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 앞에서 언급한 경쟁귀무가설에서는 집합에 속하는 유전자들을 임의로 바꿔주는 순열검정을 실시하고 자립귀무가설에서는 각 표본들의 표현형을 임의로 배정하는 순열검정을 한다. 그런데 유전자 치환의 경우에는 유전자들 사이의 상관관계, 특히 같은 집합에 속해 있는 유전자들 간의 관계가 무시된다는 맹점이 있고 본 연구에서는 관심 집합에 속한 유전자들의 발현 형태가 표현형과 연관성이 있는지에 초점을 맞추고 있기 때문에 표본의 표현형을 치환하는 것을 위주로 논하겠다.
  • 그러므로 어떤 방법이 좋은지에 대한 답은 어떤 측면을 고려하는가에 따라 달라질 것이다. 본 연구에서는 유전자집합의 표현형에 따른 유의한 차이를 어떻게 재는가 보다는 유의성 정도를 나타내는 유의확률을 빨리 구하는 방법을 찾는 것이 목적이다.
  • 질병의 진단이나 치료에 관여하는 바이오마커를 찾아내기 위한 마이크로어레이 자료 분석은 표본의 표현형(암 또는 정상, 돌연변이 발생 여부나 병기 등)에 따라 발현의 차이를 보이는 특이발현 유전자나 유전자집합을 추출하는데 목적이 있다. 이때 사용되는 유전자집합은 동일한 기능의 대사경로에 참여하였거나 염색체 위치가 같은 유전자들, 또는 전장유전체연관분석에서 밝혀진 특정 형질과 관련된 유전자들의 모임이며, 어떤 집합이 질병의 발생에 관련이 있는지에 대한 판단은 표현형에 따라 발현 형태에 유의한 차이가 있는지 검정한 결과에 따른다.

가설 설정

  • 이에 비해 M5는 ∑t2g가 수정된 형태의 카이제곱분포를 따른다고 가정하고 유의 확률을 계산하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
마이크로어레이 자료 분석의 목적은 무엇인가? 질병의 진단이나 치료에 관여하는 바이오마커를 찾아내기 위한 마이크로어레이 자료 분석은 표본의 표현형(암 또는 정상, 돌연변이 발생 여부나 병기 등)에 따라 발현의 차이를 보이는 특이발현 유전자나 유 전자집합을 추출하는데 목적이 있다. 이때 사용되는 유전자집합은 동일한 기능의 대사경로에 참여하였거나 염색체 위치가 같은 유전자들, 또는 전장유전체연관분석에서 밝혀진 특정 형질과 관련된 유전자들의 모임이며, 어떤 집합이 질병의 발생에 관련이 있는지에 대한 판단은 표현형에 따라 발현 형태에 유의한 차이가 있는지 검정한 결과에 따른다.
자립귀무가설이란? 이때 검정은 비교대상을 어떻게 정의하는가에 따라 두 가지의 귀무가설이 가능하다 (Tian 등, 2005). 경쟁귀무가설(competitive null hypothesis)은 유전자집합과 표현형 사이의 연관성을 비슷한 크기의 다른 유전자집합과 비교하고 자립귀무가설(self-contained null hypothesis)은집합에속한유전자들로부터만들어낼수있는우연한관계의연관성들과비교하는것이다.
순위를 이용한 정규점수변환 과정의 장점은? 순위를 이용한 정규점수변환 과정을 거치면 표본별 꼬리 부분 유전자들의 특별한 현상까지 제거된다는 지적도 있었지만 Bolstad 등 (2003)은 실증적으로 아무런 문제가 없음을 보였다. 또한 Tan 등 (2006)는 모의실험과 실제 자료분석을 통하여 순위를 이용한 분석이 표본크기가 작거나 발현값의 잡음이 많거나 변이가 큰 경우에 Significance Analysis of Microarrays (SAM) (Tusher 등, 2001)보다 훨씬 더 효율적임을 보였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (19)

  1. Ackermann, M. and Strimmer, K. (2009). A general modular framework for gene set enrichment analysis, BMC Bioinformatics, 10, 47. 

  2. Benjamini, Y. and Hochberg, Y. (1995). Controlling the false discovery rate: a practical and powerful approach to multiple testing, Journal of the Royal Statistical Society. Series B (Methodological), 57, 289-300. 

  3. Bolstad, B. M., Irizarry, R. A., Astrand, M., and Speed, T. P. (2003). A comparison of normalization methods for high density oligonucleotide array data based on variance and bias, Bioinformatics, 19, 185-193. 

  4. Bonferroni, C. (1936). Teoria statistica delle classi e calcolo delle probabilita, Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 8, 3-62. 

  5. Chiaretti, S., Li, X., Gentleman, R., Vitale, A., Vignetti, M., Mandelli, F., Ritz, J., and Foa, R. (2004). Gene expression pro?le of adult T-cell acute lymphocytic leukemia identi?es distinct subsets of patients with di?erent response to therapy and survival, Blood, 103, 2771-2778. 

  6. Chiaretti S., Li, X., Gentleman, R., Vitale, A., Wang, K. S., Mandelli, F., Foa, R., and Ritz, J. (2005). Gene expression pro?les of B-lineage adult acute lymphocytic leukemia reveal genetic patterns that identify lineage derivation and distinct mechanisms of transformation, Clinical Cancer Research, 11, 7209-7219. 

  7. Efron, B. and Tibshirani, R. (2007). On testing the signi?cance of sets of genes, The Annals of Applied Statistics, 1, 107-129. 

  8. Irizarry R. A., Wang, C., Zhou, Y., and Speed, T. P. (2009). Gene set enrichment analysis made simple, Statistical Methods in Medical Research, 18, 565-575. 

  9. Kim, S.-Y. and Volsky, D. J. (2005). PAGE: Parametric analysis of gene set enrichment, BMC Bioinformatics, 6, 144. 

  10. Larson, J. L. and Owen, A. B. (2015). Moment based gene set tests, BMC Bioinformatics, 16, 132. 

  11. Mooney, M. A. and Wilmot, B. (2015). Gene set analysis: a step-by-step guide, American Journal of Medical Genetics. Part B, Neuropsychiatric Genetics, 168, 517-527. 

  12. Mootha, V. K., Lindgren, C. M., Eriksson, K. F., et al. (2003). PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes, Nature Genetics, 34, 267-273. 

  13. Rahmatallah, Y., Emmert-Streib, F., and Glazko, G. (2014). Gene sets net correlations analysis (GSNCA): a multivariate di?erential coexpression test for gene sets, Bioinformatics, 30, 360-368. 

  14. Subramanian, A., Tamayo, P., Mootha, V. K., et al. (2005). Gene set enrichment analysis: a knowledge- based approach for interpreting genome-wide expression pro?les. In Proceedings of the National Academy of Sciences, 102, 15545-15550. 

  15. Tan, Y. D., Fornage, M., and Fu, Y. X. (2006). Ranking analysis of microarray data: a powerful method for identifying di?erentially expressed genes, Genomics, 88, 846-554. 

  16. Tian, L., Greenberg, S. A., Kong, S. W., Altschuler, J., Kohane, I. S., and Park, P. J. (2005). Discovering statistically signi?cant pathways in expression pro?ling studies. In Proceedings of the National Academy of Sciences, 102, 13544-13549. 

  17. Tusher, V. G., Tibshirani, R., and Chu, G. (2001). Signi?cance analysis of microarrays applied to the ionizing radiation response. In Proceedings of the National Academy of Sciences, 98, 5116-5121. 

  18. Yekutieli, D. and Benjamini, Y. (1999). Resampling based false discovery rate controlling multiple test procedure for correlated test statistics, Journal of Statistical Planning and Inference, 82, 171-196. 

  19. Zahn, J., Sonu, R., Vogel, H., et al. (2006). Transcriptional pro?ling of aging in human muscle reveals a common aging signature, PLoS Genetics, 2, e115. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로