지역별 계층별 주거실태 파악을 위한 주거 실태 및 수요조사의 새로운 표본설계는 전국 16개 시도별로 조사결과의 독립추계가 가능하도록 설계하는 것을 원칙으로 하여 총 45개의 층으로 층화한다. 조사의 표본오차 관리 대상 변수로 주택사용면적, 가구소득, 가구주 소득, 가구 생활비 등을 고려하여 표본규모를 결정한다. 각 지역의 표본크기는 기존조사의 결과 중 상대표준오차를 이용하여 결정하고 세부 층에 대한 표본배정은 가구 수의 제곱근비례 배정방법을 적용한다. 표본조사구의 추출은 조사구의 크기에 비례한 확률비례계통추출법으로 추출하고 계통추출에 있어서는 추출단위를 분류지표에 따라 정렬한 후 추출한다. 주택의 재건축, 재개발 등의 변화를 반영하기 위해 신규 아파트 단지를 고려하되 주택은 멸실에 대한 자료를 얻기 어렵기 때문에 신규 주택은 고려하지 않는다. 가중값은 설계가중값, 무응답 조정, 사후층화 조정의 과정을 통해 추정량과 분산 추정량에 이용한다. 추정의 효율을 살펴보기 위해 분산추정량의 설계효과를 계산한다.
지역별 계층별 주거실태 파악을 위한 주거 실태 및 수요조사의 새로운 표본설계는 전국 16개 시도별로 조사결과의 독립추계가 가능하도록 설계하는 것을 원칙으로 하여 총 45개의 층으로 층화한다. 조사의 표본오차 관리 대상 변수로 주택사용면적, 가구소득, 가구주 소득, 가구 생활비 등을 고려하여 표본규모를 결정한다. 각 지역의 표본크기는 기존조사의 결과 중 상대표준오차를 이용하여 결정하고 세부 층에 대한 표본배정은 가구 수의 제곱근비례 배정방법을 적용한다. 표본조사구의 추출은 조사구의 크기에 비례한 확률비례계통추출법으로 추출하고 계통추출에 있어서는 추출단위를 분류지표에 따라 정렬한 후 추출한다. 주택의 재건축, 재개발 등의 변화를 반영하기 위해 신규 아파트 단지를 고려하되 주택은 멸실에 대한 자료를 얻기 어렵기 때문에 신규 주택은 고려하지 않는다. 가중값은 설계가중값, 무응답 조정, 사후층화 조정의 과정을 통해 추정량과 분산 추정량에 이용한다. 추정의 효율을 살펴보기 위해 분산추정량의 설계효과를 계산한다.
In new sample design for Korea Housing Survey to research about housing policy, total strata are forty five because individual results of sixteen regions are estimated. The sample size is determined by sample errors of several variables which are the living area, family income, householder income, a...
In new sample design for Korea Housing Survey to research about housing policy, total strata are forty five because individual results of sixteen regions are estimated. The sample size is determined by sample errors of several variables which are the living area, family income, householder income, and living expenses. The sample size of each region is determined by relative standard error of existing result, and the strata sample size is to use the square root proportion allocation. Enumeration districts are sampled by the probability proportion to size systematic sampling in proportion to the enumeration district size, and the systemic sampling to use assortment characteristics. We considered a new apartment complex because of variation reflections which are rebuilder and redevelopment of houses. To get estimators of mean and variance, we used the design weighting, non-response adjusting, and post-stratification. In order to consider estimation efficiency, we calculate the design effect using estimators of variance.
In new sample design for Korea Housing Survey to research about housing policy, total strata are forty five because individual results of sixteen regions are estimated. The sample size is determined by sample errors of several variables which are the living area, family income, householder income, and living expenses. The sample size of each region is determined by relative standard error of existing result, and the strata sample size is to use the square root proportion allocation. Enumeration districts are sampled by the probability proportion to size systematic sampling in proportion to the enumeration district size, and the systemic sampling to use assortment characteristics. We considered a new apartment complex because of variation reflections which are rebuilder and redevelopment of houses. To get estimators of mean and variance, we used the design weighting, non-response adjusting, and post-stratification. In order to consider estimation efficiency, we calculate the design effect using estimators of variance.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
대표적인 주거관련 통계인 통계청의 인구주택총조사 및 사회통계조사는 조사주기가 길고 조사항목이 제한적이어서 자료의 활용에 한계가 있어 전국을 대상으로 하는 상시적인 주거관련 조사가 필요하다. 본 연구노트에서는 조사대상 가구의 특성과 거주하고 있는 주택의 특성을 표본설계에 반영하여 대표성 높은 표본을 추출함으로써 주거 실태 및 수요조사의 목적을 달성할 수 있도록 합리적이고 효율적인 표본설계 방안을 제안한다.
제안 방법
새로운 표본설계는 조사대상, 공표범위, 조사결과의 활용성 등을 고려하여 2005년 인구주택총조사와 2008년 주거실태조사 결과 분석을 통해 조사모집단의 특성을 파악하여 표본설계에 반영한다. 표본추출을 위한 모집단과 추출틀(sampling frame)을 결정하고 정도가 높은 표본을 추출하기 위한 표본설계방법을 제시한다.
새로운 표본설계는 조사대상, 공표범위, 조사결과의 활용성 등을 고려하여 2005년 인구주택총조사와 2008년 주거실태조사 결과 분석을 통해 조사모집단의 특성을 파악하여 표본설계에 반영한다. 표본추출을 위한 모집단과 추출틀(sampling frame)을 결정하고 정도가 높은 표본을 추출하기 위한 표본설계방법을 제시한다.
주거 실태 및 수요조사는 전국 16개 시 · 도별로 조사결과의 독립추계가 가능하도록 설계하는 것을 원칙으로 한다.
조사모집단은 2005년 인구주택총조사의 일반조사구 중 섬조사구와 특수사회시설조사구를 제외한 조사구 내의 전체 주택 및 가구이다. 조사의 목적상 모집단 자료는 표본설계 시점에서 사용 가능한 2005년 인구주택총조사 결과 중 주거 실태와 연관성이 높은 주택유형, 점유형태, 주택규모 등을 감안한 조사구 특성자료를 활용하여 분류한 조사구명부를 추출틀로 사용한다.
새로운 표본설계에서는 각 시 · 도별 통계생산을 위해서 7개 특별 · 광역시와 9개 도 지역으로 1차 층화하고, 서울시의 경우에는 주택문제의 중요성을 고려하여 4개 권역(북동, 남동, 남서, 북서)으로, 광주와 대전을 제외한 4개 광역시와 9개 도 지역에 대해서는 동부, 읍부, 면부로 2차 층화하였다.
새로운 표본설계에서는 앞서 구성한 45개 층에서 동지역은 조사구 특성(일반조사구, 아파트 조사구), 공동주택(아파트, 연립주택)의 비율, 자가주택 비율, 가구주 연령, 가구주학력 순으로, 읍·면 지역은 조사구 특성, 공동주택비율, 비농림어가 비율, 가구주 연령, 가구주 학력 순으로 조사구들을 정렬한 후에 조사구 내의 가구 수에 비례하는 확률비례계 통추출법을 적용하여 표본 조사구를 추출한다.
주거 실태 및 수요조사의 통계작성 단위는 각 시 · 도 단위이므로 각 시 · 도의 가구 수에 따라 목표정도에 차등을 둔다. 조사의 표본오차 관리 대상 변수로 주택 사용면적, 가구소득, 가구주 소득, 가구 생활비 등을 고려하여 표본규모를 결정하고 표본규모는 기존의 주거 실태 및 수요조사 결과를 기초하여 산정한다. 평균 주택 사용면적의 상대표준오차는 2% 이내, 월평균 가구당 소득과 월평균 가구주 소득의 상대표준오차는 1%~3%, 월평균 생활비의 상대표준오차는 1.
각 시 · 도별 통계의 목표 상대표준오차는 <표 7>과 같다. 각 지역별 최종 표본크기는 앞서 정한 목표 상대표준오차를 만족하도록 표본조사구 수를 정하는 것을 원칙으로 하여 일부 조정한 것이다. 각 지역별 표본조사구 수는 앞서 제시한 표본오차 관리 대상 변수인 주택 사용면적, 가구소득, 가구주 소득, 가구 생활비에 대해서 각각 목표상대표준오차를 만족하도록 구한 표본 조사구 수의 평균으로 정하되, 전체 조사 가구 수가 30,000가구라는 점과 각 지역별 가구 수 등을 고려하여 일부 조정하여 결정한다.
표본조사구의 추출은 조사구의 크기에 비례해 추출하는 확률비례계통추출법(Probability Proportional to Size Systematic Sampling)에 의해 추출한다(Dodds & Fryer 1971). 계통추출은 추출단위를 분류지표에 따라 정렬한 후 추출하는 방법이므로 조사구를 분류하기 위하여 45개 층별로 주택의 유형, 점유형태, 주택의 규모 등의 각종 기초자료를 집계하여 분류지표를 산출한다. 지역 내 조사구 정렬은 서울 및 광역시의 경우에는 조사구 특성(일반조사구, 아파트 조사구), 공동주택 비율, 자가주택 비율, 가구주 평균 연령, 가구주 대졸 이상비율 순으로 하였다.
새로운 표본설계에서 1차 추출단위는 조사구이고, 2차 추출단위는 가구이다. 원칙적으로 표본으로 추출된 조사구에서는 15개의 표본가구를 계통추출하거나 단순임의추출하여 조사하는 것을 원칙으로 한다. 표본대체는 추출된 표본조사구가 조사시점 차이로 인한 유고상태(재건축, 재개발, 기타 사유 등) 또는 특성변경(예: 주택에서 상가지역으로 개발된 경우)으로 조사가 불가능할 때에는 표본추출 당시 분류지표가 동일한 지역의 조사구로 대체한다.
주택의 재건축, 재개발 등의 변화를 반영하기 위해 신규 아파트 단지를 고려한다. 주택의 멸실에 대한 자료를 얻기 어려움으로 신규 주택에 대해서는 고려하지 않는다.
최종 가중값은 조사가 실시된 후 무응답을 조정하고 사후 층별(9) × 거처형태(6) × 점유형태(6)의 324개의 셀의 가구 수 정보를 이용하여 사후층화 보정한다.
36개 층에 대해 제곱근 비례배정을 실시하여 최종 층별 표본크기를 배정한다. 추출은 가구 수에 비례하는 확률비례계통추출을 이용하고 지역 내 단지 정렬은 단지 평균 30평 이상, 30평 미만 순으로 한다.
주거 실태 및 수요조사에서의 추정은 최종 가중값을 고려하여 가중평균을 통해 추정한다. 조사단위를 고려하여 지역별 통계생산이 가능하도록 추정하고 가중평균 추정량에 대한 분산추정량과 상대표준오차를 추정한다. 모평균에 대한 추정량 및 분산추정량, 상대표준오차는 다음과 같이 계산된다.
분석을 위한 조사대상 단위는 가구로 표본으로 추출된 조사구에서는 15개의 표본가구를 계통추출하여 조사하는 것을 원칙으로 하였다. 표본대체는 추출된 표본조사구가 조사시점차이로 인한 유고상태(재건축, 재개발, 기타사유 등) 또는 특성변경(예: 주택에서 상가지역으로 개발된 경우)으로 조사가 불가능 한 경우에는 표본추출 당시 분류지표가 동일한 지역의 조사구로 대체하였다.
실사단계에서 응답자 부재가구가 발생할 경우 총 3차에 걸쳐 방문하도록 하고 계속 부재중인 경우는 최종 3차에 저녁 방문을 통해 응답을 얻도록 하였다. 조사 불응가구(거절)나 조사 불가능가구(계속 부재, 빈집, 주택소멸)가 발생하여 응답을 얻지 못하는 경우 동일한 조사구 내 다른 가구로 대체하였다.
실사단계에서 응답자 부재가구가 발생할 경우 총 3차에 걸쳐 방문하도록 하고 계속 부재중인 경우는 최종 3차에 저녁 방문을 통해 응답을 얻도록 하였다. 조사 불응가구(거절)나 조사 불가능가구(계속 부재, 빈집, 주택소멸)가 발생하여 응답을 얻지 못하는 경우 동일한 조사구 내 다른 가구로 대체하였다.
복합표본설계가 추정량의 분산에 미치는 영향을 알아보기 위해 설계효과(design effect)룰 이용하였다. 설계효과는 복합설계를 고려한 가중값을 이용한 추정량의 분산과 단순무작위추출을 가정한 추정량의 분산의 비로 계산하였다.
새로운 표본설계에서는 각 시 · 도별 통계생산을 위해서 7개 특별․광역시와 9개 도 지역으로 1차로 층화하고, 서울시의 경우에는 주택문제의 중요성을 고려하여 4개 권역(북동, 남동, 남서, 북서)으로 광주와 대전을 제외한 4개 광역시와 9개 도 지역에 대해서는 동부, 읍부, 면부로 2차 층화하였다.
4%를 만족하도록 표본크기를 결정하였다. 그리고 인구주택총조사 이후 주택의 재건축, 재개발 등의 변화를 반영하기 위해 신규 아파트 단지를 고려하여 별도로 설계하였다. 표본조사구의 추출은 서울 및 광역시의 경우에는 조사구 특성(일반조사구, 아파트 조사구), 공동주택 비율, 자가주택 비율, 가구주 평균 연령, 가구주 대졸이상 비율 순으로 하였고, 도 지역의 동 지역에 대해서는 서울 및 광역시와 동일한 방법으로 정렬하고, 읍․면부 지역은 조사구 특성, 공동주택비율, 비농림어가 비율, 가구주 평균연령, 가구주 대졸 이상 비율 순으로 정렬하여 지역별 조사구의 크기에 비례하여 추출하는 확률비례계통추출법에 의해 추출하였다.
그리고 인구주택총조사 이후 주택의 재건축, 재개발 등의 변화를 반영하기 위해 신규 아파트 단지를 고려하여 별도로 설계하였다. 표본조사구의 추출은 서울 및 광역시의 경우에는 조사구 특성(일반조사구, 아파트 조사구), 공동주택 비율, 자가주택 비율, 가구주 평균 연령, 가구주 대졸이상 비율 순으로 하였고, 도 지역의 동 지역에 대해서는 서울 및 광역시와 동일한 방법으로 정렬하고, 읍․면부 지역은 조사구 특성, 공동주택비율, 비농림어가 비율, 가구주 평균연령, 가구주 대졸 이상 비율 순으로 정렬하여 지역별 조사구의 크기에 비례하여 추출하는 확률비례계통추출법에 의해 추출하였다.
대상 데이터
<표 2>는 2005년 인구주택총조사 결과를 정리한 것으로 조사모집단 현황이다. 전체 모집단 조사구 수는 265,350개이고, 가구 수는 15,887,128호이다. 지역별 현황을 보면 경기도와 서울시는 각각 전체 조사구의 20.
한편, 새로운 표본설계에서는 표본 조사구에서 15가구 내외의 표본가구를 조사하는 것을 원칙으로 하므로 표본설계의 표본 조사구 수는 2,000개이다. 다만 신규아파트를 고려하여 설계하기 위해 실제 2,000개의 조사구에서 14가구 내지 15가구를 조사하는 것으로 하여 일반 조사구에서 28,500개 가구 이상, 신규아파트 1,500가구 이상 조사하여 총 30,000가구이상 조사하는 것으로 한다.
2005년 인구주택총조사를 모집단으로 사용하기 때문에 신규 아파트 모집단은 2006년, 2007년에 새로 건설되어 등록된 아파트로 정의한다. 신규 아파트의 조사모집단은 1,307개 단지, 565,365가구이다.
조사구가 없기 때문에 1차 추출단위는 아파트 단지이고 목표 표본크기는 186단지이고 총 가구 표본크기는 1,503가구이다. 층화는 서울(4)은 4개 권역으로 나누고 광역시(10)는 동부와 읍·면부로 나누고 도지역(27)은 동부, 읍부, 면부로 총 41개 층으로 층화한다.
사후 층은 서울, 광역시(인천, 대전 제외), 인천, 대전, 도 지역(제주 제외) 동부, 도 지역(제주 제외) 읍부, 도 지역(제주 제외) 면부, 제주 동부, 제주 읍·면부의 9개, 거처형태는 단독, 아파트, 연립주택, 다세대주택, 오피스텔/영업용, 기타의 6개, 점유형태는 자가, 전세, 보증금 있는 월세, 보증금 없는 월세, 사글세, 무상의 6개이다.
데이터처리
주거 실태 및 수요조사의 주요항목인 거처형태와 점유형태의 추정값과 표준오차를 SAS의 복합설계자료분석 프로그램을 이용하여 추정하였다. 이것은 복합설계 추정방법 중 선형화 방법(Taylor method)에 의해 계산된다.
이론/모형
서울시의 경우에는 4개의 권역(북서, 북동, 남서, 남동)으로 세부 층화하였다. 각 지역에서 세부 층에 대한 표본배분은 가구 수의 제곱근비례 배정방법을 적용한다. 제곱근비례 배정방법을 적용한 것은 각 지역에서 동부와 읍부 및 면부의 통계작성이 필요할 경우에 이를 반영하기 위한 것이다.
표본조사구의 추출은 조사구의 크기에 비례해 추출하는 확률비례계통추출법(Probability Proportional to Size Systematic Sampling)에 의해 추출한다(Dodds & Fryer 1971).
주거 실태 및 수요조사의 설계는 복합설계이므로 추정값을 계산하기 위해서는 가중값을 이용해야 한다. 복합표본설계가 추정량의 분산에 미치는 영향을 알아보기 위해 설계효과(design effect)룰 이용하였다. 설계효과는 복합설계를 고려한 가중값을 이용한 추정량의 분산과 단순무작위추출을 가정한 추정량의 분산의 비로 계산하였다.
성능/효과
본 조사의 통계작성 단위는 각 시 · 도 단위이며, 각 시 · 도의 가구 수에 따라 목표정도에 차등을 두었고, 평균 주택 사용면적의 상대표준오차는 2% 이내, 월평균 가구당 소득과 월평균 가구주 소득의 상대표준오차는 1%~3%, 월평균 생활비의 상대표준오차는 1.0%~2.4%를 만족하도록 표본크기를 결정하였다.
새로운 표본설계에 의한 실사 결과를 보면, 거처형태별 조사 부적격률은 비거주용 건물내 주택을 제외하고 모두 1% 이하로 낮게 나타났다. 이는 조사구가 부적격한 경우, 최초 표본조사구에서 바로 대체하였기 때문에 낮게 나타난 것으로 파악된다.
복합표본설계가 분산 추정량에 미치는 영향을 알아보기 위해 설계효과를 이용하여 살펴본 결과, 주거 실태 및 수요조사의 복합설계 가중값을 이용한 추정값의 표준오차는 단순임의추출법의 표준오차보다 대체로 더 크게 나타나, 단순임의추출을 가정하여 분석할 경우 추정량의 분산이 과소 추정되어 문제가 될 수 있음을 보였고, 복합표본설계에서는 가중값을 반영하여 추정해야 함을 보였다.
질의응답
핵심어
질문
논문에서 추출한 답변
주거 실태 및 수요조사의 목적은?
주거 실태 및 수요조사는 지역별․계층별 주거실태를 파악하고 정부정책 수립 및 관련분야 연구를 위한 조사로 주거 및 주거환경, 주거이동 및 주택 구입계획, 가구특성․생활실태 및 구매력 등 3개 분야에 대해 조사한다(<표 1> 참조). 주택정책의 중심이 주택공급의양적인 문제에서 주거환경․복지 등 질적 문제로 이동함에 따라 현실성 있는 정책수립을 위해서는 주거실태를 효과적으로 파악할 수 있어야 한다.
주거 실태 및 수요조사 분야는?
주거 실태 및 수요조사는 지역별․계층별 주거실태를 파악하고 정부정책 수립 및 관련분야 연구를 위한 조사로 주거 및 주거환경, 주거이동 및 주택 구입계획, 가구특성․생활실태 및 구매력 등 3개 분야에 대해 조사한다(<표 1> 참조). 주택정책의 중심이 주택공급의양적인 문제에서 주거환경․복지 등 질적 문제로 이동함에 따라 현실성 있는 정책수립을 위해서는 주거실태를 효과적으로 파악할 수 있어야 한다.
거처형태별 조사 부적격률이 비거주용 건물내 주택을 제외하고 모두 1% 이하로 낮게 나타난 이유는?
새로운 표본설계에 의한 실사 결과를 보면, 거처형태별 조사 부적격률은 비거주용 건물내 주택을 제외하고 모두 1% 이하로 낮게 나타났다. 이는 조사구가 부적격한 경우, 최초 표본조사구에서 바로 대체하였기 때문에 낮게 나타난 것으로 파악된다. 그리고 가구 응답률은 전체 응답률이 42.
이 논문을 인용한 문헌
저자의 다른 논문 :
활용도 분석정보
상세보기
다운로드
내보내기
활용도 Top5 논문
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다. 더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.