$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

초록
AI-Helper 아이콘AI-Helper

본 연구에서는 혼합모형의 추론을 위한 벌점-최대우도추정량의 빠른 계산절차를 제안하다. 제안된 절차는 벌점-최대우도추정량을 위한 추정방정식에서 헷시안 행렬을 화살촉형태를 지닌 희소행렬을 통하여 근사 시킴으로써 계산속도의 향상을 가져왔다. 두 가지 가상실험을 통하여 제안된 근사식을 사용함으로써 얻게되는 계산시간의 감소와 동시에 이를 위하여 지불하여야 하는 근사오차에 대하여 살펴보았다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we study an approximate procedure to evaluate a penalized maximum likelihood estimator (MLE) for a mixed effects model. The procedure approximates the Hessian matrix of the penalized MLE with a structured sparse matrix or an arrowhead type matrix to speed its computation. In this pape...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 논의한 화살촉행렬을 이용한 희소행렬계산에 대한 생각은 Therneau와 Grambsch (2000)의 교재에서 언급이 되었듯이 이미 연구자들에 의하여 실제로 종종 쓰이는 계산기법이고 본 연구에서는 여러 가상실험을 통하여 해당 근사를 통하여 얻을 수 있는 계산시간의 절약과 이에 대한 비용으로 지불하여야 하는 근사오차에 대하여 이해하여 보고자 한다.
  • 마지막으로 본 논문의 수정 원고를 준비함에 있어 근사오차와 관련하여 두 분 심사위원들의 의미 있는 의견이 있었고 또한 본 논문에서는 보고되지 않은 근사오차와 관련한 가상실험의 일부 결과를 독자들과 공유하며 논문을 마치고자 한다. 본 연구에서 제안한 희소행렬을 이용한 근사의 근사오차는 2절의 후반부에서 살펴보았듯이 헷시안 행렬의 오차인 M 자체보다는 헷시안의 역행렬에서의 발생하는 오차를 결정하게 되는 QMQ 행렬을 통하여 살펴볼 수 있고 여기서 행렬 Q는 랜덤효과의 분산에 정비례하는 항으로 랜덤효과의 분산이 커지면 근사오차 또한 커짐을 예측하여 볼 수 있다.
  • 본 실험에서는 Fleming과 Harrington (2005)에서 보고된 만성육아종병 환자 자료를 10배로 복제한 자료에 대하여 논문에서 제안된 희소행렬근사 방법을 적용하여 보고 이를 통하여 계산시간의 변화와 함께 실제 모수 추정량 값들에의 영향에 대하여도 살펴본다. 만성육아종병 자료는 총 203개의 관측치로 구성되어 있는데 본 원고에서는 차원이 큰 행렬을 얻기 위해 이 자료를 10번 복제하여 총 2,030개의 관측치를 가진 자료를 만들었다. 감염까지 걸린 기간을 종속변수로 하였으며 설명변수는 모두 11개로 각각 처치 종류(treatment, β1), 성별(β2), 나이(β3), 키(β4), 몸무게(β5), 유전적 특질(β6), 스테로이드제 및 예방 목적 항생제(prophylactic antibiotics) 사용 여부(β7, β8), 병원 구분 변수(β9, β10, β11) 등을 포함한다.
  • 본 논문에서는 ν의 차원이 큰 경우(또는 동등하게 q가 p에 비하여 상당히 큰 경우) 희소행렬을 이용한 추정방정식 (1.3)의 근사계산에 대하여 살펴본다.
  • 본 메모에서는 K의 역행렬에 대한 계산 효율성을 지닌 수리적 식을 제시하고자 한다. 제시한 식은 우리가 무심코 지나친 여러 회귀분석 교재의 분할행렬의 역행렬식에 기반하고 있고 희소-가우스소거법과 같이 O(max(pq, p3))의 계산복잡성(computational complexity)을 지닌다.
  • 본 실험에서는 Fleming과 Harrington (2005)에서 보고된 만성육아종병 환자 자료를 10배로 복제한 자료에 대하여 논문에서 제안된 희소행렬근사 방법을 적용하여 보고 이를 통하여 계산시간의 변화와 함께 실제 모수 추정량 값들에의 영향에 대하여도 살펴본다. 만성육아종병 자료는 총 203개의 관측치로 구성되어 있는데 본 원고에서는 차원이 큰 행렬을 얻기 위해 이 자료를 10번 복제하여 총 2,030개의 관측치를 가진 자료를 만들었다.
  • 혼합모형에서 최대우도추정량의 계산은 Pinheiro와 Bates (2000)의 책을 통하여 알 수 있듯이 통계학에서 오랜 기간 연구되어 왔으나 현재까지도 어려움을 겪고 있는 문제 중 하나이다. 본 연구에서는 최대 우도추정량을 근사적으로 계산하는 절차를 제시하고 이의 계산효율성과 근사계산의 정확성에 대하여 살펴보았다. 본 연구에서 제안한 희소행렬을 이용한 근사절차는 (본 논문의 제한된 실험 하에서) 높은 계산효율성과 정확도를 보여주어 실제 많은 랜덤효과를 지니고 있는 모형들의 추정에 있어 유용하게 사용될 수 있으리라 사료된다.

가설 설정

  • 고정효과 β와 랜덤효과 ν에 대응하는 설명변수 벡터를 각각 x와 z라 하고 이에 대응하는 반응변수 값을 Y 라 하면 혼합모형은 ν가 주어진 상태에서 Y 의 확률분포 f(Y |ν; β, θ)를 가정한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
혼합모형이란 무엇인가 혼합모형(mixed effects model)은 설명변수들의 반응변수에 대한 상관도를 나타내는 고정효과(fixed effect)와 궁극적으로는 반응변수들 간의 상호의존성을 결정짓는 랜덤효과(random effect)를 동시에 포함한 모형으로 유전학, 공학, 뇌과학 등 다양한 의학 자료에 널리 사용되는 모형이다 (Beckmann 등, 2003; Sohn 등, 2007; Yoon과 Sohn, 2007). 혼합모형을 조금 더 수리적으로 살펴보면 다음과 같다.
최대우도추정량의 계산의 문제점을 해소하기 위해서 본 연구에서 제안한 방법은 무엇인가 본 연구에서는 최대 우도추정량을 근사적으로 계산하는 절차를 제시하고 이의 계산효율성과 근사계산의 정확성에 대하여 살펴보았다. 본 연구에서 제안한 희소행렬을 이용한 근사절차는 (본 논문의 제한된 실험 하에서) 높은 계산효율성과 정확도를 보여주어 실제 많은 랜덤효과를 지니고 있는 모형들의 추정에 있어 유용하게 사용될 수 있으리라 사료된다.
혼합모형은 어디에 사용되는 모형인가 혼합모형(mixed effects model)은 설명변수들의 반응변수에 대한 상관도를 나타내는 고정효과(fixed effect)와 궁극적으로는 반응변수들 간의 상호의존성을 결정짓는 랜덤효과(random effect)를 동시에 포함한 모형으로 유전학, 공학, 뇌과학 등 다양한 의학 자료에 널리 사용되는 모형이다 (Beckmann 등, 2003; Sohn 등, 2007; Yoon과 Sohn, 2007). 혼합모형을 조금 더 수리적으로 살펴보면 다음과 같다.
질의응답 정보가 도움이 되었나요?

참고문헌 (12)

  1. Beckmann, C. F., Jenkinson, M. and Smith, S. M. (2003). General multilevel linear modeling for group analysis in FMRI, NeuroImage, 20, 1052-1063. 

  2. Demmel, J. W. (1997). Applied Numerical Linear Algebra, SIAM, Philadelphia, PA. 

  3. Fleming, T. R. and Harrington, D. P. (2005). Counting Processes and Survival Analysis, John Wiley & Sons, Inc., Hoboken, NJ. 

  4. Ha, I. D., Lee, Y. J. and Song, J.-K. (2001). Hierarchical likelihood approach for frailty models, Biometrika, 88, 233-243. 

  5. Hager, W. W. (1989). Updating the inverse of a matrix, SIAM Review, 31, 221-239. 

  6. Lee, Y. and Oh, H.-S. (2014). A new sparse variable selection via random-effect model, Journal of Multivariate Analysis, 125, 89-99. 

  7. Park, S. (2007). Regression Analysis, 3/e, Minyoungsa, Seoul. 

  8. Pinheiro, J. C. and Bates, D. M. (2000). Mixed Effects Model in S and S-PLUS, Springer, New York. 

  9. Sohn, S., Chang, I. and Moon, H. (2007). Random effects Weibull regression model for occupational lifetime, European Journal of Operational Research, 179, 124-131. 

  10. Therneau, T. M. and Grambsch, P. M. (2000). Modeling Survival Data: Extending the Cox Model, Springer, New York. 

  11. Yoon, K. and Sohn, S. Y. (2007). Finding the optimal CSP inventory level for multi-echelon system in Air Force using random effects regression model, European Journal of Operational Research, 180, 1076-1085. 

  12. Zhu, J. and Hastie, T. (2004). Classification of gene microarrays by penalized logistic regression, Biostatistics, 5, 427-443. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로