[국내논문]Monte-Carlo expectation-maximaization 방법을 이용한 무응답 모형 추정방법 An estimation method for non-response model using Monte-Carlo expectation-maximization algorithm원문보기
각종 선거를 앞두고 여러 여론조사 기관들은 다양한 방법으로 선거 결과를 예측한다. 조사를 통한 선거 예측을 수행하는 데 있어서 발생할 수 있는 문제점 중 하나는 무응답이며 무응답 대체 방법에 따라 예측 결과는 완전히 다른 결과를 생산해 낼 수 있다. 본 연구에서는 무응답 대체의 방법으로 모형을 기반으로 한 대체 방법에 대하여 연구하였다. 특히, 최대 우도 추정 방법을 적용했을 때 무시할 수 없는 무응답 (non-ignorable non-response) 체계 하에서 발생할 수 있는 변방 값 문제를 해결하기 위해 Wei와 Tanner (1990)가 제안한 Monte Carlo EM 알고리즘을 적용하였다. 모의 실험을 통하여 MCEM 방법과 기존의 최대 우도 추정 방법, 베이지안 추정 방법 사이의 비교 연구를 진행하였고 그 결과 MCEM 방법이 기존 방법들에 대한 대안 방법으로 이용될 수 있음을 보였다. 또한 2012년에 시행된 제18대 대통령 선거 당일의 출구조사 자료를 적용하여 실증 분석을 수행하였다. 예측 결과를 비교하기 위해 Bautista 등 (2007)이 제안한 MWPE (modified within precinct error)를 이용하였다.
각종 선거를 앞두고 여러 여론조사 기관들은 다양한 방법으로 선거 결과를 예측한다. 조사를 통한 선거 예측을 수행하는 데 있어서 발생할 수 있는 문제점 중 하나는 무응답이며 무응답 대체 방법에 따라 예측 결과는 완전히 다른 결과를 생산해 낼 수 있다. 본 연구에서는 무응답 대체의 방법으로 모형을 기반으로 한 대체 방법에 대하여 연구하였다. 특히, 최대 우도 추정 방법을 적용했을 때 무시할 수 없는 무응답 (non-ignorable non-response) 체계 하에서 발생할 수 있는 변방 값 문제를 해결하기 위해 Wei와 Tanner (1990)가 제안한 Monte Carlo EM 알고리즘을 적용하였다. 모의 실험을 통하여 MCEM 방법과 기존의 최대 우도 추정 방법, 베이지안 추정 방법 사이의 비교 연구를 진행하였고 그 결과 MCEM 방법이 기존 방법들에 대한 대안 방법으로 이용될 수 있음을 보였다. 또한 2012년에 시행된 제18대 대통령 선거 당일의 출구조사 자료를 적용하여 실증 분석을 수행하였다. 예측 결과를 비교하기 위해 Bautista 등 (2007)이 제안한 MWPE (modified within precinct error)를 이용하였다.
In predicting an outcome of election using a variety of methods ahead of the election, non-response is one of the major issues. Therefore, to address the non-response issue, a variety of methods of non-response imputation may be employed, but the result of forecasting tend to vary according to metho...
In predicting an outcome of election using a variety of methods ahead of the election, non-response is one of the major issues. Therefore, to address the non-response issue, a variety of methods of non-response imputation may be employed, but the result of forecasting tend to vary according to methods. In this study, in order to improve electoral forecasts, we studied a model based method of non-response imputation attempting to apply the Monte Carlo Expectation Maximization (MCEM) algorithm, introduced by Wei and Tanner (1990). The MCEM algorithm using maximum likelihood estimates (MLEs) is applied to solve the boundary solution problem under the non-ignorable non-response mechanism. We performed the simulation studies to compare estimation performance among MCEM, maximum likelihood estimation, and Bayesian estimation method. The results of simulation studies showed that MCEM method can be a reasonable candidate for non-response model estimation. We also applied MCEM method to the Korean presidential election exit poll data of 2012 and investigated prediction performance using modified within precinct error (MWPE) criterion (Bautista et al., 2007).
In predicting an outcome of election using a variety of methods ahead of the election, non-response is one of the major issues. Therefore, to address the non-response issue, a variety of methods of non-response imputation may be employed, but the result of forecasting tend to vary according to methods. In this study, in order to improve electoral forecasts, we studied a model based method of non-response imputation attempting to apply the Monte Carlo Expectation Maximization (MCEM) algorithm, introduced by Wei and Tanner (1990). The MCEM algorithm using maximum likelihood estimates (MLEs) is applied to solve the boundary solution problem under the non-ignorable non-response mechanism. We performed the simulation studies to compare estimation performance among MCEM, maximum likelihood estimation, and Bayesian estimation method. The results of simulation studies showed that MCEM method can be a reasonable candidate for non-response model estimation. We also applied MCEM method to the Korean presidential election exit poll data of 2012 and investigated prediction performance using modified within precinct error (MWPE) criterion (Bautista et al., 2007).
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
설문조사로 수집된 자료로 분석할 경우 가장 먼저 부딪치는 문제는 결측 값 또는 무응답 문제라고 할 수 있다. 각종 여론조사, 설문조사를 할 경우 무응답이 발생하지 않는 경우는 매우 드물기 때문에 본 논문은 예측의 정확도를 높이는 중요한 관건이라고 할 수 있는 무응답처리 문제를 다루고자 한다.
결론적으로 MCEM 방법이 변방값 문제를 해결하기 위한 새로운 대안 방법으로 이용될 수 있을 것이다. 또한, 실제 자료를 이용한 결과를 바탕으로 무응답 모형의 가정에 따른 예측력을 비교함으로써 무응답 체계에 대한 가정을 점검해 보고자 하였다. 이를 위하여 2012년 대선 출구조사의 자료를 이용하여 전국 204개 중 최대 우도 추정에서 변방값 문제를 발생시키는 94개 선거구에 대해서 모형 적합을 시도한 후 방법별 예측결과를 평가하기 위해서 MWPE 통계량을 이용하여 비교 분석을 진행하였다.
본 연구에서는 적절한 무응답 체계에 대한 가정에 따른 무응답 모형을 설정하고 이 무응답 모형을 이용한 무응답 대체 방법에 대한 연구를 진행하였다. 무응답 모형을 통해 무응답을 대체 하는 방법으로 EM 알고리즘에 기반을 둔 최대 우도 추정방법을 이용하였다.
본 연구의 첫 번째 목적은 무응답이나 결측이 발생하였을 때 무응답 대체를 수행하기 위한 것이다. 특히 무응답 체계에 대한 여러 가정 가운데 비임의 결측 (무시할 수 없는 무응답) 체계를 가정하였을 때 직면할 수 있는 변방값 문제를 해결하기 위하여 MCEM 방법을 제안하였다.
제안 방법
따라서 지지후보에 대한 변수에 대해서만 무응답을 가지게 되므로 무응답 지시변수는 한개만 존재하게 되며 무응답 지시변수와 관찰된 변수의 상호작용 효과의 설정에 따라 완전임의 결측 (MCAR), 임의 결측 (MAR) 혹은 비임의 결측 (NMAR) 체계에 대한 무응답 모형을 모두 고려할 수 있다. 모의실험의 결과 MCEM 방법이 최대 우도 추정 방법이나 베이지안 추정 방법에 비하여 나쁘지 않은 결과를 보였기 때문에 세가지 무응답 모형에 대하여 MCEM 방법을 적용하여 모형 추정을 진행하였다.
본 연구는 기본적으로 다차원 분할표 형태로 정리된 자료의 분석 기법을 다루고 있다. 다차원 분할표의 차원이 증가하거나 범주의 수가 증가하는 경우 추정하여야 하는 모수의 수가 급격하게 증가하게 되고 추정에 어려움이 따르게 된다.
본 연구의 첫 번째 목적은 무응답이나 결측이 발생하였을 때 무응답 대체를 수행하기 위한 것이다. 특히 무응답 체계에 대한 여러 가정 가운데 비임의 결측 (무시할 수 없는 무응답) 체계를 가정하였을 때 직면할 수 있는 변방값 문제를 해결하기 위하여 MCEM 방법을 제안하였다. 제안된 방법의 성능을 확인하기 위하여 모의실험을 통하여 무시할 수 없는 무응답 체계 가정 하에서 최대 우도 추정 방법, 베이지안 추정 방법간의 비교 실험을 진행하였다.
대상 데이터
본 연구는 Kwak과 Choi (2014)에서 이용된 자료를 가지고 분석을 진행하였다. 자료 분석으로 사용하기 위해 19대 국회의원 선거구에 맞춰 204개의 선거구별로 재조정하여 분석에 이용하였다. 출구 조사 때 같이 조사된 성별과 연령 중 성별은 고려하지 않고 연령대 변수만 이용하였다.
자료 분석으로 이용된 자료는 2012년 12월 치러진 18대 대통령 선거 당일 수행된 출구조사의 자료로써 지역 (광역자치단체), 시·군·구 (기초 자치단체), 성별 (남, 여), 연령 (20대, 30대, 40대, 50대, 60대 이상), 지지후보 (새누리당 후보, 민주통합당 후보, 기타, 무응답) 등이 집계되었다. 출구 조사를 시행할 때에 성별, 연령, 지지후보를 자기기입식으로 유권자가 조사를 거부할 경우에는 나이와 성별만 기재하여 지지후보만 무응답을 가지게 된다.
총 204개의 국회의원 선거구 자료에 대하여 모형 추정을 진행하여 추정된 결과를 살펴보았다. 지면 절약을 위하여 본 논문에서는 제시되지 않았으나 각 개별 선거구별 예측결과는 Kwak과 Choi (2014)의 결과와 큰 차이를 보이지 않았다.
데이터처리
모의실험 결과를 살펴보면 응답과 무응답값의 응답 패턴 차이의 크기에 상관없이 최대 우도 추정 결과보다 MCEM이나 베이지안 결과가 좋음을 확인할 수 있다. MCEM 결과와 베이지안 결과간의 차이를 비교하기 위하여 추정된 통계량들을 가지고 짝진표본 t-검정을 수행하였다. Table 3.
그 결과 변방값 문제가 발생한 94개 자료를 이용하여 다시 임의 결측과 비임의 결측 체계하에서 MCEM 방법을 적용하여 모형을 재 적합 하였다. 각각의 결과에 대하여 MWPE 값을 계산한 후에 짝진표본 t-검정을 수행하였다. 수행한 결과는 Table 4.
본 모의실험은 무시할 수 없는 무응답 모형에 대해 무응답 비율, 응답패턴, 초모수의 할당방법 등 총 32가지의 시나리오를 가지고 모의실험을 하였던 Park과 Choi (2010)의 모의실험 결과를 기초 자료로 하여 본 연구에서 적용한 EM 알고리즘 기법인 Monte Carlo EM 알고리즘과 Yoo (2015)의 결과를 함께 비교 하였다. 가능한 모든 무응답 모형을 고려하지 않고 본 모의 실험에서는 비임의결측 체계를 가정한 무시할 수 없는 무응답 모형에 대해서만 모의실험을 진행하였다.
그러나 일부 경우에 있어서는 MCEM의 결과가 평균제곱오차에서 더 작은 결과를 보여주고 있다. 세 결과 간의 통계적 유의성 여부를 검증하기 위하여 반복측정 분산분석을 실시하였다. Table 3.
또한, 실제 자료를 이용한 결과를 바탕으로 무응답 모형의 가정에 따른 예측력을 비교함으로써 무응답 체계에 대한 가정을 점검해 보고자 하였다. 이를 위하여 2012년 대선 출구조사의 자료를 이용하여 전국 204개 중 최대 우도 추정에서 변방값 문제를 발생시키는 94개 선거구에 대해서 모형 적합을 시도한 후 방법별 예측결과를 평가하기 위해서 MWPE 통계량을 이용하여 비교 분석을 진행하였다. 실제 데이터 분석에서는 무응답 체계에 대한 가정은 임의 결측과 비임의 결측으로 나누어 모형 적합을 수행하였고 모두 MCEM 방법을 적용하여 무응답 모형 추정을 수행하였다.
특히 무응답 체계에 대한 여러 가정 가운데 비임의 결측 (무시할 수 없는 무응답) 체계를 가정하였을 때 직면할 수 있는 변방값 문제를 해결하기 위하여 MCEM 방법을 제안하였다. 제안된 방법의 성능을 확인하기 위하여 모의실험을 통하여 무시할 수 없는 무응답 체계 가정 하에서 최대 우도 추정 방법, 베이지안 추정 방법간의 비교 실험을 진행하였다. 모의 실험 결과 변방값 문제가 발생하는 경우 베이지안 추정 방법이나 MCEM의 방법이 최대 우도 추정 방법에 비하여 평균제곱오차와 편향에서 모두 좋은 결과를 보였으며 베이지안 추정 방법과 MCEM 방법 간에는 유의한 차이를 보이지 않았다.
이와 같이 모수를 할당한 후 다항분포를 따르는 표본을 추출하였는데 표본 추출의 결과로 변방값이 발생하는 경우와 발생하지 않은 경우로 나누어 각각 1,000 셋트의 표본을 추출하였다. 추출된 표본에 대한 모형 적합으로 본 연구에서 소개한 MCEM 방법으로 모형 추정을 시도 하였고 그 결과를 Park과 Choi (2010)이 수행한 최대추도추정 (ML)과 베이지안 방법을 이용한 추정 (Type III)과 비교하였다.
이론/모형
전체 204개 선거구 가운데 비임의 결측 체계 즉 무시할 수 없는 무응답 모형을 적용하여 먼저 최대 우도 추정을 진행하였다. 그 결과 변방값 문제가 발생한 94개 자료를 이용하여 다시 임의 결측과 비임의 결측 체계하에서 MCEM 방법을 적용하여 모형을 재 적합 하였다. 각각의 결과에 대하여 MWPE 값을 계산한 후에 짝진표본 t-검정을 수행하였다.
단계2: EM 알고리즘의 E step에서 수행하는 조건부 우도 함수의 기대값을 계산하는 대신에 수치 적분을 수행하기 위한 Monte Carlo 방법을 사용하여 다음과 같이 정의한다.
본 연구에서는 적절한 무응답 체계에 대한 가정에 따른 무응답 모형을 설정하고 이 무응답 모형을 이용한 무응답 대체 방법에 대한 연구를 진행하였다. 무응답 모형을 통해 무응답을 대체 하는 방법으로 EM 알고리즘에 기반을 둔 최대 우도 추정방법을 이용하였다. 최대 우도 추정 방법에서 발생할 수 있는 문제를 Wei 와 Tanner (1990)가 제안한 방법을 적용하여 로그 선형모형의 모수에 직접 사전 분포를 할당하는 계층적 베이지안 방법으로 MCEM (Monte Carlo Expectation and Maximization)방법을 이용하였다.
출구 조사를 시행할 때에 성별, 연령, 지지후보를 자기기입식으로 유권자가 조사를 거부할 경우에는 나이와 성별만 기재하여 지지후보만 무응답을 가지게 된다. 본 연구는 Kwak과 Choi (2014)에서 이용된 자료를 가지고 분석을 진행하였다. 자료 분석으로 사용하기 위해 19대 국회의원 선거구에 맞춰 204개의 선거구별로 재조정하여 분석에 이용하였다.
또한 전술한 바와 같이 무시할 수 없는 무응답 가정하에서는 변방값 문제가 발생할 수 있다. 본 연구에서는 이와 같은 문제를 해결하기 위하여 Wei와 Tanner (1990)에 의해서 제안된 MCEM 알고리즘 (Monte Carlo EM algorithm)을 이용하고자 하였다. 이 알고리즘은 EM 알고리즘의 E-Step에서 Monte Calro 방법으로 기댓값을 계산하여 불완전한 자료로부터 모수를 추정할 수 있도록 하는 방법이다.
이를 위하여 2012년 대선 출구조사의 자료를 이용하여 전국 204개 중 최대 우도 추정에서 변방값 문제를 발생시키는 94개 선거구에 대해서 모형 적합을 시도한 후 방법별 예측결과를 평가하기 위해서 MWPE 통계량을 이용하여 비교 분석을 진행하였다. 실제 데이터 분석에서는 무응답 체계에 대한 가정은 임의 결측과 비임의 결측으로 나누어 모형 적합을 수행하였고 모두 MCEM 방법을 적용하여 무응답 모형 추정을 수행하였다. 그 결과 임의 결측 가정에 의한 무시할 수 있는 무응답 모형에서 더 좋은 예측 결과를 보였다.
무응답 모형을 통해 무응답을 대체 하는 방법으로 EM 알고리즘에 기반을 둔 최대 우도 추정방법을 이용하였다. 최대 우도 추정 방법에서 발생할 수 있는 문제를 Wei 와 Tanner (1990)가 제안한 방법을 적용하여 로그 선형모형의 모수에 직접 사전 분포를 할당하는 계층적 베이지안 방법으로 MCEM (Monte Carlo Expectation and Maximization)방법을 이용하였다. MCEM 알고리즘은 EM 알고리즘의 E-단계의 기댓값 계산과정을 Monte Carlo 방법으로 해결하여 무응답 자료를 구하고 이로부터 M-단계를 통하여 모수를 추정하는 방법이다.
지면 절약을 위하여 본 논문에서는 제시되지 않았으나 각 개별 선거구별 예측결과는 Kwak과 Choi (2014)의 결과와 큰 차이를 보이지 않았다. 추정된 결과를 이용하여 예측 결과의 정확도를 비교하기 위하여 Bautista 등 (2007)이 제안한 MWPE (modified within precinct error)를 이용하였다. 선거 예측결과 이기 때문에 최종 선거가 치뤄진 이후에 실제 후보간의 지지율을 구할 수 있다.
성능/효과
그 결과 임의 결측 가정에 의한 무시할 수 있는 무응답 모형에서 더 좋은 예측 결과를 보였다. 결론적으로 보았을 때 우리나라 선거 예측에 있어서는 무시할 수 있는 무응답 모형을 이용하여 예측을 수행하는 것이 더 적절하다 할 수 있겠다.
제안된 방법의 성능을 확인하기 위하여 모의실험을 통하여 무시할 수 없는 무응답 체계 가정 하에서 최대 우도 추정 방법, 베이지안 추정 방법간의 비교 실험을 진행하였다. 모의 실험 결과 변방값 문제가 발생하는 경우 베이지안 추정 방법이나 MCEM의 방법이 최대 우도 추정 방법에 비하여 평균제곱오차와 편향에서 모두 좋은 결과를 보였으며 베이지안 추정 방법과 MCEM 방법 간에는 유의한 차이를 보이지 않았다. 이에 반하여 변방값 문제가 발생하지 않은 경우 편향에서는 최대 우도 추정 방법이 가장 좋은 결과를 보였으며 평균제곱오차에서는 MCEM이 가장 좋은 결과를 보였다.
괄호안의 값이 편향을 나타낸다. 모의실험 결과를 살펴보면 응답과 무응답값의 응답 패턴 차이의 크기에 상관없이 최대 우도 추정 결과보다 MCEM이나 베이지안 결과가 좋음을 확인할 수 있다. MCEM 결과와 베이지안 결과간의 차이를 비교하기 위하여 추정된 통계량들을 가지고 짝진표본 t-검정을 수행하였다.
모의 실험 결과 변방값 문제가 발생하는 경우 베이지안 추정 방법이나 MCEM의 방법이 최대 우도 추정 방법에 비하여 평균제곱오차와 편향에서 모두 좋은 결과를 보였으며 베이지안 추정 방법과 MCEM 방법 간에는 유의한 차이를 보이지 않았다. 이에 반하여 변방값 문제가 발생하지 않은 경우 편향에서는 최대 우도 추정 방법이 가장 좋은 결과를 보였으며 평균제곱오차에서는 MCEM이 가장 좋은 결과를 보였다. 결론적으로 MCEM 방법이 변방값 문제를 해결하기 위한 새로운 대안 방법으로 이용될 수 있을 것이다.
후속연구
이에 반하여 변방값 문제가 발생하지 않은 경우 편향에서는 최대 우도 추정 방법이 가장 좋은 결과를 보였으며 평균제곱오차에서는 MCEM이 가장 좋은 결과를 보였다. 결론적으로 MCEM 방법이 변방값 문제를 해결하기 위한 새로운 대안 방법으로 이용될 수 있을 것이다. 또한, 실제 자료를 이용한 결과를 바탕으로 무응답 모형의 가정에 따른 예측력을 비교함으로써 무응답 체계에 대한 가정을 점검해 보고자 하였다.
두 결과 모두 매우 작은 t-통계량을 보이고 있으며 통계적으로 유의한 차이가 없다. 이 결과를 바탕으로 최대 우도 추정을 적용한 결과 변방값 문제가 발생한다면 MCEM 방법을 이용하는 것이 또 다른 대안이 될 수가 있을 것이다. 이 결과는 Yoo (2015)의 결과를 일부 참조한 것이다.
Dahinden 등 (2010)과 Nardi와 Rinaldo (2012)는 고차원 분할표에 대한 분해기법과 LASSO 방법을 적용하여 로그 선형 모형에 적용하여 고차원 분할표의 추정 문제를 다루었다. 추후 연구로 이와 같은 기법을 적용하여 고차원 분할표에서의 무응답 모형 추정에 대한 연구를 진행하고자 한다.
질의응답
핵심어
질문
논문에서 추출한 답변
MCEM 알고리즘이란?
최대 우도 추정 방법에서 발생할 수 있는 문제를 Wei 와 Tanner (1990)가 제안한 방법을 적용하여 로그 선형모형의 모수에 직접 사전 분포를 할당하는 계층적 베이지안 방법으로 MCEM (Monte Carlo Expectation and Maximization)방법을 이용하였다. MCEM 알고리즘은 EM 알고리즘의 E-단계의 기댓값 계산과정을 Monte Carlo 방법으로 해결하여 무응답 자료를 구하고 이로부터 M-단계를 통하여 모수를 추정하는 방법이다. 본 연구에서는 모의실험을 통해 MCEM 알고리즘에 대해 알아본 후 실제 자료에 적용하였다.
Little과 Rubin이 제시한 무응답의 발생 체계에 따른 3가지 구분은?
Little과 Rubin (2002)은 무응답을 발생 체계에 따라 크게 세 가지로 구분하였다. 첫 번째는 완전임의 결측 (missing completely at random; MCAR)으로 무응답의 발생 여부가 무응답을 가지고 있는 변수나 함께 조사된 다른 변수들에 아무 영향을 받지 않았을 경우이다. 두 번째는 임의 결측 (missing at random; MAR)으로 무응답의 발생 여부가 조사된 변수들 중에서 무응답을 가지고 있지 않은 관찰된 자료에 의해서만 영향을 받았을 경우이다. 이 두 가지의 가정은 무응답의 발생 여부가 무응답 자체에 영향을 받는 것이 아니므로 무시할 수 있는 무응답 (ignorable nonresponse)이라 한다. 세 번째는 비임의 결측 (not missing at random; NMAR)으로 무응답 발생 여부가 관찰된 자료 중에서 무응답을 가지고 있는 변수에서만 영향을 받았을 경우이다. 비임의 결측은 무응답의 발생 여부가 무응답 자체의 영향을 받으므로 무시할 수 없는 무응답 (non-ignorable non-response)이라 한다. 예를 들어 출구조사 시 자신의 지지하는 후보를 밝히지 않았을 때 특별한 이유가 없다면 무시할 수 있는 무응답이라고 할 수 있고 자신의 지지 후보가 그 지역의 열세 후보이기 때문에 밝히지 않았다면 무시할 수없는 무응답이라고 할 수 있다.
Crespi의 연구에서 무응답 대체 방법은 어떤 것들이 있는가?
무응답 처리를 포함한 예측 문제에 대하여 국내외에 많은 연구가 진행되어 왔다. Crespi (1988)의 연구에서는 무응답 대체 방법으로 주요 2개 후보에게 비례 배분하는 방법, 주요 2개 후보에게 반으로 나누어 배분하는 방법, 현직 후보자가 있다면 그 외의 도전자 후보에게 배분하는 방법, 무응답을 버리고 후보자들의 득표율을 재계산하는 방법 등 4가지 방법을 제시하였고, 그 가운데 비례배분이 가장 좋다는 의견을 제시하였다. Cho 등 (2008)과 Lee와 Kang (2012)은 설문조사에서 발생하는 무응답에 대한 종류와 대체 방법을 소개하였다.
참고문헌 (27)
Baker, S. G. and Laird, N. M. (1988). Regression analysis for categorical variables with outcome subject to nonignorable nonresponse. Journal of American Statistical Association, 83, 62-69.
Bautista, R., Callegaro, M., Vera, J. A. and Abundis, F. (2007). Studying nonresponse in mexican exit pollsm. international Journal of Public Opinion Research, 19, 492-503.
Cho, Y. S., Chun, Y. M. and Hwang. D. Y. (2008). An imputation for nonresponses in the survey on the rural living indicators. Korean Journal of Applied Statistics, 21, 95-107.
Choi, B., Choi, J. W. and Park, Y. S. (2009). Bayesian methods for an incomplete two-way contingency table with application to the Ohio (Buckeye state polls). Survey Methodology, 35, 37-51.
Choi, B. and Kim, K. M. (2012). A model selection method using em algorithm for missing data. Journal of the Korean Data Analysis Society, 14, 767-779.
Choi, B., Park, Y. S. and LEE, D. H. (2007). Election forecasting using pre-election survey data with nonignorable nonresponse. Journal of the Korean Data Analysis Society, 9, 2321-2333.
Crespi, I. (1988). Pre-election polling: Sources of accuracy and error, Russel Sage, New York.
Dahinden, C., Kalisch, M. and Buhlmann, P. (2010).Decomposition and model selection for large contingency tables. Biometrical Journal, 52, 233-252.
Hong, N. R. and Huh, M. H. (2001). A post-examination of forecasting surveys for the 16th general election. Survey Research, 2, 1-35.
Ibrahim, J. G., Zhu, H. and Tang, N. (2008). Model selection criteria for missing-data problems using the EM algorithm. Journal of American Statistical Association, 103, 1648-1658.
Kim, Y. W. and Kwak, E. S. (2010). A total survey error analysis of the exit polling for general election 2008 in Korea. Survey Research, 11, 33-55.
Kwak, E. S., Kim, J. Y. and Kim, Y. W. (2013). Analysis of forecasting error of the exit poll for the general election of 2012 in Korea. Survey Research, 14, 1-7.
Kwak, J. A. and Choi, B. (2014). A comparison study for accuracy of exit poll based on nonresponse model. Journal of the Korean Data & Information Science Society, 25, 53-64.
Lee, J. H., Kim. J. and Lee, K. J. (2006). Missing imputation methods using the spatial variable in sample survey. Korean Journal of Applied Statistics, 19, 57-67.
Park, T. S. and Lee, S. Y. (1998). General research papers : analysis of categorical data with nonresponses. Korean Journal of Applied Statistics, 11, 83-95.
Park, Y. S. and Choi, B. (2010). Bayesian analysis for incomplete multi-way contingency tables with nonignorable nonresponse. Journal of Applied Statistics, 37, 1439-1453.
Park, Y. S., Kim, K. W. and Choi, B. (2013). Dynamic Bayesian analysis for irregularly and incompletely observed contingency tables. Journal of the Korean Statistical Society, 42, 277-289.
Shim, M. S. and Choi, H. C. (1997). Studies on non-response cases of election polls. The Journal of Communication Science, 14, 137-162.
Wei, G. C. G. and Tanner, M. A. (1990). A Monte Carlo implementation of the EM algorithm and the poor man's data augmentation algorithms. Journal of American Statistical Association, 85, 699-704.
Yoo, H. S. (2015). A model selection method for non-response model based on empirical Bayesian method, Master Thesis, Daegu University, Gyeongbuk.
Yoon, Y. H. and Choi, B. (2012). Model selection method for categorical data with non-response. Journal of the Korean Data & Information Science Society, 23, 627-641.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.