2007년 12월의 대통령선거 과정에서 행해진 수많은 전화 여론조사에서 이명박 후보가 일관되게 앞자리를 지켰다. 많은 수의 여론조사가 시행되는 경우 개별 여론조사의 표본추출오차는 상쇄되어 소멸한다. 그러나 일정한 편향은 많은 수의 조사가 실행된다 하더라도 잔존하므로 중요한 문제가 아닐 수 없다. 우리나라의 전화조사는 지역, 성과 연령대를 고려한 할당추출(quota sampling)을 사용하며 대부분 전화번호부를 표집 틀로 한다. 조사 거절률도 높은 편이다. 이에 따라 조사표본들이 할당변인 외의 인구사회적 속성에서 모집단을 잘 대표하지 못할 수 있다. 이 연구의 목적은 허명회 등 (2004)의 연구 방법른을 2007년에 수행된 대통령선거 여론조사 L8개 사례에 적용하여 다음 물음에 답하는 데 목적이 있다. - 물음 1. 각후보에 대한 선호도 또는 지지율에 체계적 편향이 있지 않았는가? - 물음 2. 편향이 있었다면, 그 원인이 어디에 있는가? 첫째 물음에 답하기 위하여 2007년 11월 이후 시행된 11개 사례 자료에 지역, 성과 연령대 외에 직업과 학력까지 고려한 반복비례가중법(rim weighting)을 적용해보았다. 그 결과, 이명박 후보의 지지율이 평균 1.4%P 과다 추정되었던 것으로 나타났다. 반면, 정동영 후보의 지지율은 평균 0.6%P 과소 추정되었고 이에 따라 두 후보간 지지율 차이가 2.0%P (= 1.4+0.6) 과다하게 추정되었던 것으로 보여진다. 둘째 물음에 답하기 위하여 위의 11개 사례 자료에서 이명박 후보 지지를 종속변수로 하는 로지스틱 회귀 분석을 하였다. 그 결과, 전화조사 표본에서의 저학력자 과소 및 가정주부의 과다가 이명박 편향의 원인이 되는 것으로 밝혀졌다.
2007년 12월의 대통령선거 과정에서 행해진 수많은 전화 여론조사에서 이명박 후보가 일관되게 앞자리를 지켰다. 많은 수의 여론조사가 시행되는 경우 개별 여론조사의 표본추출오차는 상쇄되어 소멸한다. 그러나 일정한 편향은 많은 수의 조사가 실행된다 하더라도 잔존하므로 중요한 문제가 아닐 수 없다. 우리나라의 전화조사는 지역, 성과 연령대를 고려한 할당추출(quota sampling)을 사용하며 대부분 전화번호부를 표집 틀로 한다. 조사 거절률도 높은 편이다. 이에 따라 조사표본들이 할당변인 외의 인구사회적 속성에서 모집단을 잘 대표하지 못할 수 있다. 이 연구의 목적은 허명회 등 (2004)의 연구 방법른을 2007년에 수행된 대통령선거 여론조사 L8개 사례에 적용하여 다음 물음에 답하는 데 목적이 있다. - 물음 1. 각후보에 대한 선호도 또는 지지율에 체계적 편향이 있지 않았는가? - 물음 2. 편향이 있었다면, 그 원인이 어디에 있는가? 첫째 물음에 답하기 위하여 2007년 11월 이후 시행된 11개 사례 자료에 지역, 성과 연령대 외에 직업과 학력까지 고려한 반복비례가중법(rim weighting)을 적용해보았다. 그 결과, 이명박 후보의 지지율이 평균 1.4%P 과다 추정되었던 것으로 나타났다. 반면, 정동영 후보의 지지율은 평균 0.6%P 과소 추정되었고 이에 따라 두 후보간 지지율 차이가 2.0%P (= 1.4+0.6) 과다하게 추정되었던 것으로 보여진다. 둘째 물음에 답하기 위하여 위의 11개 사례 자료에서 이명박 후보 지지를 종속변수로 하는 로지스틱 회귀 분석을 하였다. 그 결과, 전화조사 표본에서의 저학력자 과소 및 가정주부의 과다가 이명박 편향의 원인이 되는 것으로 밝혀졌다.
For 2007 Korea presidential election, most polls by telephone surveys indicated Lee Myung-Bak led the second runner-up Jung Dong-Young by certain margin. The margin between two candidates can be estimated accurately by averaging individual poll results, provided there exists no systematic bias in te...
For 2007 Korea presidential election, most polls by telephone surveys indicated Lee Myung-Bak led the second runner-up Jung Dong-Young by certain margin. The margin between two candidates can be estimated accurately by averaging individual poll results, provided there exists no systematic bias in telephone surveys. Most Korean telephone surveys via telephone directory are based on quota samples, with the region, the gender and the age-band as quota variables. Thus the surveys may result in certain systematic bias due to unbalanced factors inherent in quota sampling. The aim of this study is to answer the following questions by the analytic methods adopted in Huh et al. (2004): Question 1. Wasn't there systematic bias in estimates of support rates. Question 2. If yes, what was the source of the bias? To answer the questions, we collected eighteen surveys administered during the election campaign period and applied the iterated proportional weighting (the rim weighting) to the last eleven surveys to obtain the balance in five factors - region, gender, age, occupation and education level. We found that the support rate of Lee Myung-Bak was over-estimated consistently by 1.4%P and that of Jung Dong-Young was underestimated by 0.6%P, resulting in the over-estimation of the margin by 2.0%P. By investigating the Lee Myung-Bak bias with logistic regression models, we conclude that it originated from the under-representation of less educated class and/or the over-representation of house wives in telephone samples.
For 2007 Korea presidential election, most polls by telephone surveys indicated Lee Myung-Bak led the second runner-up Jung Dong-Young by certain margin. The margin between two candidates can be estimated accurately by averaging individual poll results, provided there exists no systematic bias in telephone surveys. Most Korean telephone surveys via telephone directory are based on quota samples, with the region, the gender and the age-band as quota variables. Thus the surveys may result in certain systematic bias due to unbalanced factors inherent in quota sampling. The aim of this study is to answer the following questions by the analytic methods adopted in Huh et al. (2004): Question 1. Wasn't there systematic bias in estimates of support rates. Question 2. If yes, what was the source of the bias? To answer the questions, we collected eighteen surveys administered during the election campaign period and applied the iterated proportional weighting (the rim weighting) to the last eleven surveys to obtain the balance in five factors - region, gender, age, occupation and education level. We found that the support rate of Lee Myung-Bak was over-estimated consistently by 1.4%P and that of Jung Dong-Young was underestimated by 0.6%P, resulting in the over-estimation of the margin by 2.0%P. By investigating the Lee Myung-Bak bias with logistic regression models, we conclude that it originated from the under-representation of less educated class and/or the over-representation of house wives in telephone samples.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
조사표본의 불균형을 바로 잡기 위해 가중치 보정을 하는 경우 각 후보의 지지율이 얼마나 어떻게 달라지는가를 보자. 표 3.
제안 방법
로지스틱 회귀계수에 대한 해석을 쉽게 하기 위하여 일본의 수량화 방법 1처럼 원 계수를 요인별로 중심화하여 제시하였다. 즉 A:개 범주를 갖는 한 요인에 대한 범주별 원 계수를 b1, .
앞 절에서 나타난 이명박 지지율 추정치가 갖는 체계적 편향의 원인을 알아보기 위해 이명박 지지를 종속 변수로 하고 지역, 성별, 연령대, 학력, 직업을 설명 변수로 하는 로지스틱 회귀모형을 적합해 보기로 한다.
성별.연령대 칸 가중치를 적용해 얻은 조사기관들의 추정치와 비교해 보았다. 그 결과, 조사기관들의 이명박 후보의 지지율이 1.
대상 데이터
12월까지 실시한 18개의 대통령선거관련 전화조사 자료를 수집하였다. 18개 표본의 크기는 705에서 5, 327 사이였고 그 중 각 정당후보가 확정된 11월과 12월에 조사된 사례가 11개였다.
2는 2000년과 2005년 인구주택 총조사에 의한 모집단의 인구사회적 속성을 나타내는 표이다. 2007년도 현재, 19세 이상에 선거권이 주어지므로 모집단을 19세 이상의 한국인 남녀로 정의할 수 있다. 단, 직업에 관해서는 인구주택 총조사 보고서에서 19세 이상에 대한 자료를 구할 수 없었기 때문에 20세 이상에 대한 통계로 대체하였다.
본 연구를 위해 우리나라의 조사업계를 주도하는 5개 조사전문기관(G, H, K, M, T)에서 2007년 3월부터 12월까지 실시한 18개의 대통령선거관련 전화조사 자료를 수집하였다. 18개 표본의 크기는 705에서 5, 327 사이였고 그 중 각 정당후보가 확정된 11월과 12월에 조사된 사례가 11개였다.
조사표본의 대표성을 평가하기 위하여는 모집단의 인구사회적 분포를 정확히 해둘 필요가 있다. 이 연구에서는 모집단 수치를 2005년 인구주택 총조사에서 구하였다. 이때 직업 분류가 가장 문제가 되는데, 현재 통계청에서 사용하고 있는 직업분류는 취업자를 (1) 의회의원, 고위임직원 및 관리자, (2) 전문가, (3) 기술공 및 준전문가, (4) 사무 종사자, (5) 판매 종사자, ⑹ 농업, 임업 및 어업 숙련 종사자, (7) 기능원 및 관련기능 종사자, (8) 장치, 기계조작 및 조립 종사자, (9) 단순 노무 종사자, (10) 기타 등으로 나눈다.
데이터처리
6%P 과소 추정되었던 것으로 나타났다. 둘째 물음에 답하기 위하여 위의 11개 사례 자료에서 이명박 후보 지지를 종속변수로 하는 로지스틱 회귀 분석을 하였다. 그 결과, 조사표본에서의 저학력자 과소와 가정주부의 과다가 이명박 편향의 원인이 된 것으로 밝혀졌다.
이론/모형
성별.연령대 외에 학력과 직업까지 균형을 맞추기 위해 반복비례기중법 (iterative proportional weighting, rim weighting)-2] 가중치를 적용하여 최종 추정치를 구하였다 (허명회 등, 2005). 이것을 지역.
이런 물음들에 답하기 위하여 2007년 대통령선거 과정에서 시행된 여론조사 18개 사례의 조사자료를 수집하여 선행연구인 허명회 등 (2004)의 메타분석 방법론을 적용하기로 한다. 수집된 총 18개 조사자료 중 각 정당 후보자가 확정된 마지막 11개 조사자료에는 지역.
성능/효과
연령대 칸 가중치를 적용해 얻은 조사기관들의 추정치와 비교해 보았다. 그 결과, 조사기관들의 이명박 후보의 지지율이 1.4%P 과다 추정되었고 반면 정동영 후보의 지지율이 0.6%P 과소 추정되었던 것으로 나타났다. 둘째 물음에 답하기 위하여 위의 11개 사례 자료에서 이명박 후보 지지를 종속변수로 하는 로지스틱 회귀 분석을 하였다.
둘째 물음에 답하기 위하여 위의 11개 사례 자료에서 이명박 후보 지지를 종속변수로 하는 로지스틱 회귀 분석을 하였다. 그 결과, 조사표본에서의 저학력자 과소와 가정주부의 과다가 이명박 편향의 원인이 된 것으로 밝혀졌다.
본 연구의 조사표본과 2005년의 모집단 간 5개 인구사회적 속성 각각의 구성비율의 차이를 선행연구의 조사표본과 2000년의 모집단 간 구성비율의 차이와 비교해 보면, 선행연구에 비해 본 연구에서 연령별 할당이 잘 되지 않았음을 알 수 있다. 그 사이에 젊은 층의 재택시간이 줄어든 데 원인이 있는 것으로 보인다.
참고문헌 (6)
강현철, 한상태, 김지연, 정용찬, 허명회 (2008). RDD 전화조사와 주요 결과, 9, 1-22
※ AI-Helper는 부적절한 답변을 할 수 있습니다.