$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 서포트 벡터 머신 알고리즘을 활용한 연속형 데이터의 다중인자 차원축소방법 적용
Support vector machine and multifactor dimensionality reduction for detecting major gene interactions of continuous data 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.21 no.6, 2010년, pp.1271 - 1280  

이제영 (영남대학교 통계학과) ,  이종형 (영남대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

인간의 질병과 가축의 특성에 영향을 주는 유전자들의 상호작용을 규명하는 방법으로 전통적인 통계방법들이 사용되었지만, 유전자와 같은 고차원의 데이터에는 적합하지 않았다. 따라서 다중인자 차원축소방법이 제안되었다. 다중인자 차원축소방법은 모형에 대한 가정이 필요하지 않는 비모수적 방법으로 이분형 자료에 적용 가능 하지만, 연속형 데이터에는 적용할 수 없는 단점이 있다. 따라서 본 연구에서는 일반화 분류 성능이 뛰어난 서포트 벡터 머신 알고리즘을 통해 연속형 자료를 가공하여 다중인자 차원축소방법에 적용하였다. 아울러 한우의 6번 염색체내 6개의 후보 단일염기다형성을 대상으로 연속형 자료인 실제 한우의 경제형질에 서포트 벡터 머신을 이용한 다중인자 차원축소방법을 적용함으로써 한우의 경제형질에 연관된 우수 유전자 상호작용의 조합을 규명하였다.

Abstract AI-Helper 아이콘AI-Helper

We have used multifactor dimensionality reduction (MDR) method to study genegene interaction effect of statistical model in general. But, MDR method could not be applied in the continuous data. In this paper, continuous-type data by the support vector machine (SVM) algorithm are proposed to the MDR ...

Keyword

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 또한 고차원데이터에서도 잘 적합할 수 있어 차원 문제를 피해 갈 수 있다. 이와 같은 SVM의 특성을 고려해 연속형 데이터를 변환함으로써 MDR방법의 적용이 가능해 지는 것이다. 본 논문의 구성은 다음과 같다.
  • 제 2장에서는 본 연구에서 사용된 분류 기술인 SVM 알고리즘에 대해서 소개한다. 아울러 유전자의 상호작용 규명을 위한 방법인 MDR방법에 대해서 간단하게 소개한다. 제 3장에서는 SVM 알고리즘을 통해서 연속형 데이터가 어떻게 MDR에 적용되는가에 대해서 자세히 묘사하고자 한다.
  • 이러한 비선형의 문제는 커널 함수 (Kernel function)를 이용함으로써 해결이 가능하다 (Shim 등, 2009; Cho, 2010). 이 절에서는 위와 같은 문제 해결을 위한 비선형의 의사결정 경계를 갖는 자료에 SVM을 적용하는 방법을 기술한다. 본래의 좌표 공간 x에 있는 데이터를 선형 의사결정 경계를 사용할 수 있는 공간으로 변화시키는 것이다.
  • 이 장에서는 연속형 데이터를 MDR에 적용시키기 위해서 SVM알고리즘을 이용하고자 한다. 높은 이분형 분류 성능을 가진 SVM의 특징을 이용해 연속형 데이터를 변환하여, MDR에 적용하고자 하는 것이다. 간단한 절차는 다음과 같다.
  • 하지만 이분형 자료에만 적용이 가능하다는 단점이 있다. 따라서, 우리는 본 연구에서 연속형 자료를 MDR방법에 적용시키고자 SVM 알고리즘을 소개하였다. SVM알고리즘은 높은 분류성능을 가진 분류알고리즘으로써 특히 이분형 자료의 경우게 일반화의 효율이 높은 것이 특징이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
SVM은 장점을 바탕으로 어떠한 분류에서 사용되는 2 클래스 분류기법인가? SVM은 고차원 공간의 데이터를 선형회귀 함수로 재구성함으로써 비선형회귀 문제까지도 해결이 가능한 장점을 가지고 있다. 이러한 장점을 바탕으로 텍스트 분류나, 사진, 영상에서의 인식은 물론 Bio informatics 분야의 Protein 분류, Cancer 분류에서도 사용되는 효과적인 2 클래스 분류기법이다. SVM의 기본적인 아이디어는 최대 마진 초평면 (maximal margin hyperplane) 이다.
SVM은 어떤 장점을 가지고 있는가? SVM은 고차원 공간의 데이터를 선형회귀 함수로 재구성함으로써 비선형회귀 문제까지도 해결이 가능한 장점을 가지고 있다. 이러한 장점을 바탕으로 텍스트 분류나, 사진, 영상에서의 인식은 물론 Bio informatics 분야의 Protein 분류, Cancer 분류에서도 사용되는 효과적인 2 클래스 분류기법이다.
SVM의 기본적인 아이디어는 무엇인가? 이러한 장점을 바탕으로 텍스트 분류나, 사진, 영상에서의 인식은 물론 Bio informatics 분야의 Protein 분류, Cancer 분류에서도 사용되는 효과적인 2 클래스 분류기법이다. SVM의 기본적인 아이디어는 최대 마진 초평면 (maximal margin hyperplane) 이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (13)

  1. Cho, D. (2010). Mixed-effects LS-SVM for longitudinal data. Journal of Korean Data & Information Science Society, 21, 363-369. 

  2. Cristianini, N. and Shawe-Taylor, J. (2000). An introduction to support vector machines and other kernelbased learning methods, Cambridge University Press. 

  3. Efron, B. and Tibshirani, R. (1993). An introduction to the bootstrap, Chapman & Hall/CRC. 

  4. Lee, H. G. (2009). Power of multifactor dimensionality reduction with dummy variable and detecting best gene interaction. M.S. Thesis, 1-53. 

  5. Lee, J. Y., Kwon, J. C. and Kim, J. J. (2008). Multifactor dimensionalit reduction (MDR) analysis to detect single nucleotide polymorphisms associated with a carcass trait in a Hanwoo population. Asian-Australasian Journal of Animal Science, 6, 784-788. 

  6. Lee, J. Y., Lee, J. H. and Lee, H. G. (2010). Power of expanded multifactor dimensionality reduction with CART algorithm. Journal of Korea Statistical Society, 17, 667-678. 

  7. Lee, Y. S. (2009). Study on the identification of candidate genes and their haplotypes that are associated with growth and carcass traits in the QTL region of BTA6 in a Hanwoo population, Ph. D. Thesis, 1-94. 

  8. Lim, S. Y., Baek, J. S. and Kim, M. S. (2010). Video character recognition improvement by support vector machines and regularized discriminant analysis. Proceedings of Journal of Korean Data & Information Science Society May 28-29 , 2010, 1-10. 

  9. Ritchie, M. D., Hahn, L. W., Roodi, N., Bailey, L. R., Dupont, W. D., Parl, F. F. and Moore, J. H. (2001). Multifactor-dimensionality reduction reveals high-order interactions among estrogen- metabolism genes in sporadic breast cancer. American Journal of Human Genetics, 69, 138-147. 

  10. Scholkopf, B. and Smola, A. J. (2001). Learning with kernels: Support vector machines, regularization, optimiaztion, and beyond, MIT Press. 

  11. Shim, J., Park, H. and Seok, K. H. (2009). Variance function estimation with LS-SVM for replicated data. Journal of Korean Data & Information Science Society, 20, 925-931. 

  12. Tan, P., Steinbach, M. and Kumar V. (2006). Introduction to data mining, Addison-Wesley. 

  13. Vapnik, V. (1998). Statistical learning theory, John wiley & sons, New York. 

저자의 다른 논문 :

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로