$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

혼합회귀모형에서 콤포넌트 및 설명변수에 대한 벌점함수의 적용
Joint penalization of components and predictors in mixture of regressions 원문보기

응용통계연구 = The Korean journal of applied statistics, v.32 no.2, 2019년, pp.199 - 211  

박종선 (성균관대학교 통계학과) ,  모은비 (성균관대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

주어진 회귀자료에 유한혼합회귀모형을 적합하는 경우 적절한 성분의 수를 선택하고 선택된 각각의 회귀모형에서 의미있는 예측변수들의 집합을 선택하며 동시에 편의와 변동이 작은 회귀계수 추정치들을 얻는 것은 매우 중요하다. 본 연구에서는 혼합선형회귀모형에서 성분의 개수와 회귀계수에 벌점함수를 적용하여 적절한 성분의 수와 각 성분의 회귀모형에 필요한 설명변수들을 동시에 선택하는 방법을 제시하였다. 성분에 대한 벌점은 성분들의 로그값에 SCAD 벌점함수를 적용하였고 회귀계수들에는 SCAD와 더불어 MCP 및 Adplasso 벌점함수들을 사용하여 가상자료와 실제자료들에 대한 결과를 비교하였다. SCAD-SCAD 벌점함수 조합과 SCAD-MCP 조합의 경우 기존의 Luo 등 (2008)의 방법에서 문제가 되었던 과적합 문제를 해결함과 동시에 선택된 성분의 수와 회귀계수들을 효과적으로 선택하였으며 회귀계수들의 추정치에 대한 편의도 크지 않았다. 본 연구는 성분의 수가 알려져 있지 않은 회귀자료에서 적절한 성분의 수와 더불어 각 성분에 대한 회귀모형에서 모형에 필요한 예측변수들을 동시에 선택하는 방법을 제시하였다는데 의미가 있다고 하겠다.

Abstract AI-Helper 아이콘AI-Helper

This paper is concerned with issues in the finite mixture of regression modeling as well as the simultaneous selection of the number of mixing components and relevant predictors. We propose a penalized likelihood method for both mixture components and regression coefficients that enable the simultan...

주제어

표/그림 (10)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 가 포함되어 있으며 이들 모수의 적절한 선택은 매우 중요하다. 본 연구에서는 과적합을 방지하기 위하여 BIC를 최적화하는 조율모수들을 선택하였다. BIC는
  • 본 연구에서는 성분과 회귀계수에 직접 벌점함수를 적용하여 적절한 성분의 수와 모형에 필요한 회귀계수들을 동시에 선택하는 방법을 제시하였다. 성분에 대한 벌점은 성분들의 로그값에 SCAD 벌점을 주는 Huang 등 (2017)의 방법을 적용하였고 회귀계수들에는 SCAD 이외에 다양한 벌점함수들을 적용하여 가상자료와 실제자료에 대하여 비교하였다.
  • 이 절에서는 전통적인 EM 알고리즘을 M-step에 적용한 수정된 EM 알고리즘을 소개한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
유한혼합모형이란? Pearson (1894)에 의해 처음 제안된 유한혼합모형(finite mixture model)은 사전에 알려진 수의 모집단으로부터 얻어진 표본을 모형화하는 방법으로 생물학, 유전학, 마케팅 등 여러 분야에 사용되고 있다. 유한혼합회귀모형(finite mixture of regression; FMR)은 유한혼합모형의 관측치를 설명하는 예측변수들(predictors)을 포함하며 금융과 사회과학의 여러 분야에 적용 (Wedel과 Kamukura, 2000; Skron-dal과 Rabe-Hesketh, 2004)되고 있다.
유한혼합모형의 단점은? Chen (1995)에 의하면 유한혼합모형에서 성분의 수를 모르는 경우 최적 수렴비가 느려지는 것으로 알려져 있으며 과도하게 많은 수의 성분을 사용하면 자료의 과적합(over tting)에 따라 해석이 어려워질 수 있다. 반대의 경우에는 실제 내재하는 자료의 구조를 적절하게 파악하지 못하게 되며 이는 유한혼합회귀모형에서도 동일하게 적용된다.
AIC, BIC 방법의 문제점은? 유한혼합모형에서 성분의 수를 결정하는 다양한 검정방법(McLachlan과 Peel, 2000)이 있었으나 유한혼합모형의 성분 수의 결정과 변수 선택의 방법으로 주로 전통적인 Akaike information criterion (AIC) (Akaike, 1973)와 Bayes information criterion (BIC)(Schwarz, 1978) 방법 등이 사용되었다. 그러나 이러한 방법들 또한 주어진 자료로부터 가능한 모든 후보 모형을 고려하여 최적 모형을 찾아주기 때문에 고차원(high dimension) 자료의 경우에 많은 연산 시간과 비용을 소요하는 문제가 있다. 이러한 문제를 피하는 방법으로 벌점함수를 적용하는 방법이 있다.
질의응답 정보가 도움이 되었나요?

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로