$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

가우시안 코플라를 이용한 반복측정 이변량 자료의 조건부 결합 분포 추정
Estimation of the joint conditional distribution for repeatedly measured bivariate cholesterol data using Gaussian copula 원문보기

응용통계연구 = The Korean journal of applied statistics, v.30 no.2, 2017년, pp.203 - 213  

곽민정 (영남대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

우리는 이변량 경시적 자료의 조건부 결합 분포를 추정하기 위하여 회귀 모형코플라 모형을 연구하였다. 주변 분포의 추정을 위하여 시변 변환 모형을 고려하였고, 이변량 반응변수 각각에 대한 주변 분포를 가우시안 코플라를 이용하여 결합하여 조건부 결합 분포를 추정하였다. 우리가 제안한 모형은 조건부 평균 모형만으로 자료를 설명하기 어려운 경우에 적용될 수 있다. 시변 변환 모형과 가우시안 코플라 모형을 결합한 본 논문의 방법은 반복 측정된 이변량 경시적 자료에 대한 모형화가 용이하며 해석하기 쉬운 장점이 있다. 우리는 본 논문의 방법을 반복 측정된 이변량 콜레스테롤 자료를 분석하는데 적용하여 보았다.

Abstract AI-Helper 아이콘AI-Helper

We study estimation and inference of joint conditional distributions of bivariate longitudinal outcomes using regression models and copulas. We consider a class of time-varying transformation models and combine the two marginal models using Gaussian copulas to estimate the joint models. Our models a...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 가우시안 코플라 함수 외에도 많이 사용되는 코플라 함수로는 아르키메디안 코플라 함수(Archimedean copula), 극단값 코플라 함수(extreme value copula) 등이 있으며, 실제로 많은 종류의 코플라 함수들 중에서 어떤 코플라 함수를 적용하는 것이 좋은지에 대해서는 적합성 검정(goodness-of-fit test)을 실시하여 적절한 코플라 함수를 선택할 수 있다. 본 논문의 결과를 바탕으로 다음 연구에서는 추정량의 편향 정도를 유도하고 부드러운 곡선을 구하기 위한 서로 다른 평활방법의 비교 분석등을 고려하고자 한다.
  • 일반적으로 많이 사용되는 코플라 함수로는 아르키메디안 코플라 함수(Archimedean copula models), 극단값 코플라 함수(extreme value copulas) 등이 있다. 본 연구에서는 모수를 이용한 함수형태로 표시되는 모수적 코플라를 이용하여 이변량 반응변수의 결합분포를 최대우도 추정법으로 추정하고자 한다. 코플라 모수의 ρ 추정치 \(\hat\rho\)는 다음과 같은 유사 로그 우도 함수(pseudo log-likelihood function)를 최대로 하는 \(\hat\rho\)으로 정의된다.

가설 설정

  • 시점 t에서 공변량 X(t)가 x(t)로 주어졌을때 일변량 반응변수 Yk(t), k = 1, 2의 주변 조건부 분포를 Fkt(yk|x) =Pr[Yk(t) ≤ yk(t)|X(t) = x(t)]로 정의한다. 용어의 편의상 yk(t)을 yk로 표기할 때, 우리는 다음의 시변 전환 모형(time-varying transformation model)을 가정한다.
  • 우리는 시간에 따라 반복 측정된 n명의 독립적인 개체들로 이루어진 경시적 자료를 가정하며 i번째 개체에서 ni개의 관측치가 tij ∈ T , j = 1, . . . , ni 시점에서 얻어진다고 가정한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
경시적 자료는 언제 발생하는가? 경시적 자료(longitudinal data)는 각 개인에게서 관측치가 시간에 따라 반복적으로 얻어지는 경우에 발생한다. 연구에 참여한 각각의 개인들에 대해 시간의 흐름에 따라 규칙적으로 혹은 불규칙적으로 관측치가 얻어지며, 동일한 개체에서 관측치가 여러번 얻어지므로 관측치들이 서로 독립이라는 가정이 성립하지 않는다.
가우시안 코플라의 장점은 무엇인가? 코플라 함수를 규정하는 모수에 대한 추정은 위의 로그 우도함수를 ρ에 대해 미분하여 ρ에 대한 최대우도 추정치 \(\hat\rho\)를 구할 수 있다. 가우시안 코플라는 그 형태가 비교적 많이 알려져 있으며 이변량 변수간의 상관성을 상관계수로 나타내므로 해석이 용이한 장점이 있어 실제 자료 분석에 많이 사용된다. 이변량의 경우 가우시간 코플라는 Sklar (1959) 정리에 의하여 일변량 균등분포를 따르는 두 확률변수 U1, U2 ∈ [0, 1]에 대하여 C(U1, U2) = Φ2[Φ−1(U1), Φ−1(U2)|ρ]로 나타내어 진다.
경시적 자료를 분석할 때 함께고려해야 할 다변량 자료와 시계열 자료의 특성으로 무엇이 있는가? 이러한 경시적 자료를 분석함에 있어서는 다변량 자료의 특성과 시계열 자료의 특성을 함께 고려하여야 한다. 첫째, 경시적 자료가 다변량 자료와 다른 특징은 관측치들이 시간에 따라 순서가 정해져 있다는 점이고, 둘째로 시계열 자료와 다른 특징은 시계열 자료와는 달리 한 개체에서 얻어지는 측정 시점들의 숫자가 상대적으로 적다는 점이다. 의학 통계에서 경시적 자료의 예로는 임상 시험에 있어서 두 가지의 서로 다른 치료법을 같은 환자에게 처리하여 반응변수의 변화를 관측하게 되는 교차설계에서 얻어지는 비교적 단순한 경시적 자료부터, 정기적으로 병원에 방문하여 동일한 환자에 대하여 각종 임상적 수치를 반복하여 관측, 기록하는 다소 복잡한 경시적 자료에 이르기까지 매우 다양하다.
질의응답 정보가 도움이 되었나요?

참고문헌 (13)

  1. Anderson, K. M., Castelli, W. P., and Levy, D. (1987). Cholesterol and mortality: 30 years of follow-up from the Framingham study, Journal of American Medical Association, 257, 2176-2180. 

  2. Cheng, S. C., Wei, L. J., and Ying, Z. (1995). Analysis of transformation models with censored data, Biometrika, 82, 835-845. 

  3. Diggle, P. J., Liang, K. Y., and Zeger S. L. (1994). Analysis of longitudinal data, Oxford University Press, Oxford. 

  4. Genest, C., Ghoudi, K., and Rivest, L. P. (1995). A semiparametric estimation procedures of dependence parameters in multivariate families of distributions, Biometrika, 82, 543-552. 

  5. Genest, C. and MacKay, J. (1986). A joy of copulas: bivariate distributions with uniform marginals, The American Statistician, 40, 280-283. 

  6. Joe, H. (1993). Parametric families of multivariate distributions with given margins, Journal of Multivariate Analysis, 46, 262-282. 

  7. Lindsey, J. K. (1993). Models for Repeated Measurements, Oxford University Press, Oxford. 

  8. Molenberghs, G. and Verbeke, G. (2005). Models for Discrete Longitudinal Data, Springer, New York. 

  9. National Heart, Lung, and Blood Institute Growth and Health Research Group (NGHSRG) (1992). Obesity and cardiovascular disease risk factors in black and white girls: the NHLBI growth and health study, American Journal of Public Health, 82, 1613-1620. 

  10. National High Blood Pressure Education Program Working Group on High Blood Pressure in Children and Adolescents (NHBPEP Working Group) (2004). The fourth report on the diagnosis, evaluation, and treatment of high blood pressure in children and adolescents, Pediatrics, 114, 555-576. 

  11. Oakes, D. (1986). Semiparametric inference in a model for association in bivariate survival data, Biometrika, 73, 353-361. 

  12. Sklar, A. (1959). Fonctions de repartition a n dimensions et leurs marges, Publications de l'Institut Statis- tique de l'Universite de Paris, 8, 229-231. 

  13. Wu, C. O. and Tian, X. (2013). Nonparametric estimation of conditional distribution functions and rank- tracking probabilities with time-varying transformation models in longitudinal studies, Journal of the American Statistical Association, 108, 971-982. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로