최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
DataON 바로가기다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
Edison 바로가기다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
Kafe 바로가기주관연구기관 | 사단법인 한국인구학회 |
---|---|
연구책임자 | 김석호 |
참여연구자 | 강정한 , 강현철 , 박민규 , 송순관 |
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 | 한국어 |
발행년월 | 2015-12 |
주관부처 | 통계청 |
사업 관리 기관 | 통계청 National Statistical Office Republic of Korea |
등록번호 | TRKO201600015831 |
DB 구축일자 | 2016-12-17 |
키워드 | 총조사,순환센서스,조사방법론,순환표본조사 |
제1장 연구배경 및 구성
1. 연구의 배경
인구주택총조사는 1925년 처음 도입된 이후로 매5년마다 실시되는 조사로,인구·가구·주택부문에 있어서 국가통계의 기반이 되어 왔다. 인구주택총조사는 전수조사(short-form)와 표본조사(long-form)라는 두 개의 방식으로 진행되어 왔는데, 조사환경이 변화됨에 따라 새로운 대안의 모색이 요구되고 있다. 이에 통계청은 인구주택총조사 패러다임의 전환을 모색하면서 다양한 방식의 연구를 수행하게 되었다. 먼저, 5년마다 대규모로 진행되던 인구주택총조사는 2016년부터 전수 부문은
제1장 연구배경 및 구성
1. 연구의 배경
인구주택총조사는 1925년 처음 도입된 이후로 매5년마다 실시되는 조사로,인구·가구·주택부문에 있어서 국가통계의 기반이 되어 왔다. 인구주택총조사는 전수조사(short-form)와 표본조사(long-form)라는 두 개의 방식으로 진행되어 왔는데, 조사환경이 변화됨에 따라 새로운 대안의 모색이 요구되고 있다. 이에 통계청은 인구주택총조사 패러다임의 전환을 모색하면서 다양한 방식의 연구를 수행하게 되었다. 먼저, 5년마다 대규모로 진행되던 인구주택총조사는 2016년부터 전수 부문은 등록센서스 방식을 도입하였으며, 등록센서스가 공표할 수 없는 항목을 포함한 기존 10% 표본조사 대신 20% 표본조사가 실시하고 있다. 또한 2021년 이후에는 표본조사를 5년에 한번 실시하는 것이 아닌, 매월 표본을 균등 분할하여 실시하는 순환센서스 방식 도입을 검토 중이다. 그러나 순환센서스 방식을 이행하기 위해서는 복잡한 표집 및 모형 기술, 우량의 표본틀이 필수적이며, 센서스가 제공해온 전체 모집단에 대한 일정 시점의 스냅샵이 더 이상 존재하지 않는다는 점이 고려되어야 한다. 이러한 문제의식을 바탕으로 통계청은 2012년부터 순환센서스 도입을 위한 다양한 연구를 수행하여 왔다. 특히, 한국인구학회에 의뢰하여 2014년 5월부터 2014년 12월까지 약 8개월 간 ‘순환센서스 추정 및 분석 방안에 대한 연구’를 실시한 바 있다. 그러나 이 연구는 순환센서스와 기존 센서스 및 등록센서스와의 관계, 순환센서스 디자인, 모수추정 방법론, 순환센서스 활용방안 등에 대한 기초 연구에 그쳤다. 이에 본 연구에서는 2014년도의 연구성과를 토대로 보다 심도 있는 연구를 수행하는데 목적을 두고 있다. 본 연구는 순환센서스를 도입하기 위해서는 모집단 구축과 표본설계, 모수 작성과 추정, 결과 분석 등을 중점적으로 검토할 필요가 있음을 강조한다. 이에 본 연구는 2014년 연구 결과를 바탕으로 실제적인 표본설계와 추정 및 결과 분석을 수행하고 있다.
제2절 연구의 구성
본 연구는 ‘인구주택총조사 표본규모할당 및 추정방법’, ‘순환표본조사 시행을 위한 표본설계 및 추정방안 연구’, ‘시험조사 자료의 심층 분석’, 그리고 ‘한국에서의 순환센서스 기능’ 등 크게 4개 부문으로 구성되어 있으며, 각 부문별 주요 연구내용은 다음과 같다.
제2장의 ‘인구주택총조사 표본규모할당 및 추정방법’은 크게 3개의 연구내용으로 구성되어 있다. 먼저, 제1절에서는 표본규모 할당방법에 대한 연구를 수행하였는데, 조사방법의 변화에 부응하기 위하여 정확도 높은 추정을 위한 표본설계의 기본방향을 제시한다. 제2절에서는 추정가중치 산정을 위한 시험조사 자료를 분석하였다. 제3절은 가중치 산정 절차를 제시하였다. 인구주택총조사의 승수 산정 방법은 읍면동을 부차모집단(sub-population)으로 하고, 부차모집단을 조사구 특성에 따라 층화(아파트조사구 및 일반조사구)하여, 가구인구 및 주택부문으로 나누었다. 그런 후에, 가중치산정 방법들을 검토하여 새로운 조사방법을 도입하는 인구주택총조사의 추정에 있어서 정확도를 높일 수 있는 방법을 제안하였다.
제3장은 ‘순환표본조사 시행을 위한 표본설계 및 추정방안 연구’로서, 제1절에서는 연구의 전체적인 연구내용을 개괄하고 있다. 그리고 제2절에서는 순환표 본조사를 위한 표본설계 방안을 제시하였다. 제3절에서는 모수추정방안을 제시하였다. 먼저, 기간추정(Multi-year estimation or estimation for period) 개념에 대한 정의를 하고, 정의된 기간추정의 개념 하에서 모수 추정을 위한 가중치 작성내용을 우선적으로 다루었다. 추가적으로 추정 시 필요한 내용들도 검토하였다.제4절에서는 기간 추정을 위한 기타 고려사항들을 제안하였다.
제4장은 ‘시험조사 자료의 심층 분석’을 실시하였다. 인천광역시 연수구와 경상남도 거창군의 시험조사 자료를 심층 분석함으로써 주요 항목별 변화 추이 및 시험조사에서의 무응답 현황 등 문제점을 살펴보았다.
제5장은 순환센서스의 인구사회학적, 정책적, 학문적 기능을 어떻게 극대화시킬 수 있는지 모색하였다. 이를 위해 우선 이러한 기능을 성공적으로 수행하고 있는 미국의 순환센서스, ACS부터 검토하였다. 이와 더불어 다양한 사회조사를 순환센서스에 통합시킬 경우 어떻게 통합조사할 수 있는지에 대한 예시를 제시하였다. 이를 위해 통계청의 ‘사회조사’와 ‘지역별 고용조사’, ‘한국종합사회조사’ 및 OECD의 각종 사회지표를 검토하였다.
제6장은 ‘향후 순환센서스 연구를 위한 제언’에 해당되며, 각 장별 연구를 통해 도출된 함의들을 정리하고 2016년 이후의 순환센서스 연구를 위한 정책적 제언과 향후 과제들을 제시하였다.
제2장 인구주택총조사 표본규모할당 및 추정방법
제1절 표본규모 할당방법
과거 인구주택총조사는 조사방법이 전수와 표본을 혼합했었는데, 2015년 인구주택총조사는 일부 조사항목은 행정센서스 자료를 이용하고 나머지 조사항목은 표본조사를 하는 혼합형 조사방법으로 전환된다. 이 장은 정확도 높은 추정을 위한 표본규모 할당방법들을 검토하여 표본설계 기본방향을 제시하고자 하는데 그 목적이 있다.
표본설계자는 모집단의 특성, 표본틀의 구성여부, 조사예산 및 추정의 정확도를 고려하여 표본설계 방법 및 표본규모를 결정하는 것이 일반적이다. 인구주택 총조사는 전체 표본조사구가 사전에 설정되어 있으므로, 부차모집단으로 정의한 시도/시군구/읍면동으로 표본을 가장 합리적으로 할당하여 부차모집단의 추정치의 정확도를 향상시킬 수 있는 방법을 모색해야 한다.
표본조사가 생산하는 주요 통계치는 읍면동 부차모집단의 추정의 정확도를 고려한 설계를 요구한다. 읍면동별 높은 정확도가 요구되는 주요 통계치는 읍면동별 교육정도별 인구수, 혼인상태별 인구수, 가구원수별 가구수 및 거처종류별 가구수 등이다. 과거 인구주택총조사가 공표한 통계치는 시군구를 기준으로 하였는데, 2015년 조사는 읍면동 수준으로 통계치를 작성하는 것을 기본목표로 삼고있다.
전체표본 조사구수를 행정구역별로 할당하는 방법은 크게 읍면동 직접 할당법 및 간접 할당법으로 구분된다. 읍면동 직접 할당법은 시도 및 시군구의 지역을 고려하지 않고 읍면동을 부차모집단(subpopulation)으로 지역층화하여 전체 표본조사구수를 읍면동에 직접 할당하고, 시군구 및 시도는 할당된 읍면동 표본조사구수를 누적하는 방법으로 간접적으로 표본규모를 계산한다. 읍면동 간접 할당법은 전국을 시도의 일차 부차모집단(first subpopulation)으로 지역층화하여 전체표본조사구수를 먼저 시도에 할당하고, 할당된 시도의 표본 조사구수를 기초로 각 시도내의 시군구를 이차 부차모집단(second subpopulation)으로 지역층화 한다. 이를 통해 시군구의 표본규모를 할당한 다음, 각 시군구내의 읍면
동을 삼차부차모집단(third subpopulation)을 지역층화하여 읍면동에 표본조사구수를 할당한다.
이 장은 부차모집단의 분산 정도를 이용하여 표본규모를 부차모집단에 할당할 수 있는 네이만 배분법과, 부차모집단의 분산에 관계없이 사용할 수 있는 동등배분법(Equal allocation), 비례배분법(Proportional allocation), 제곱근배분법(Square root allocation), 거듭제곱배분법(Power allocation), 키쉬배분법(Kish allocation) 등의 적합성 여부를 검토하였다.
가령, 네이만 배분법은 특정 조사 항목을 설계변수로 선정하고, 과거 조사 자료를 이용하여 분산을 구한다. 이 방법의 적용을 위해서는 인구주택총조사에서 어떠한 항목들을 설계변수로 선정하고 변수의 분산에 따라 표본규모를 배분하는 문제가 중요하기 때문에 조사항목수 및 설계항목의 분산에 구애받지 않고 사용할 수 있는 표본배분법이 중점적으로 검토되어야 한다. 동등배분법, 비례배분법, 제곱근배분법, 키쉬배분법의 특성을 살펴보면, 전국/시도/시군구 추정에 중점을 두면 비례배분법이 적합하고, 읍면동만 추정에 초점을 맞추면 등등배분법이 적합함을 알 수 있었다.
가상적인 자료를 이용한 분석에서는, 상대적으로 규모가 작은 읍면동은 동등배분법이 효율적인 방법인 반면, 비례배분법은 효율성이 상대적으로 떨어지는 방법으로 판단된다. 또한 상대적으로 규모가 큰 동읍면은 이와 반대의 결론이 나타났다. 이러한 규모의 양극화 현상을 중립적인 방향으로 효율성을 조정할 수 있는 방법을 강구하는 것이 필요해 보인다.
시군구의 표본규모는 상대적으로 크기 때문에, 그 추정치가 일정한 오차의 범위 이내에서 정확도를 확보하는 것에 큰 문제는 없어 보인다. 읍면동 추정정도에 설계 초점을 맞추는 표본규모 할당 방법인 읍면동 직접 할당법이 설계의 기본방향으로 설정되어야 한다. 규모가 큰 동읍면의 추정 정확도를 중시해야 하는지 아니면 규모가 작은 동읍면의 추정 정확도를 중시해야 하는지는 쉽게 결정하기 어려운 문제이다.
추정의 정확도는 표본크기가 클수록 높아지기 때문에, 표본 크기로 인한 정확도의 양극화 현상을 표본설계를 통해 일정 정도 완화할 수 있다. 본 절에서는 부차 모집단인 읍면동의 추정치와 시군구의 추정치의 상대적 중요성에 대한 고려가 이론적으로 견고하며 조사항목이 많은 방법에 적합한 키쉬방법이 표본규모 할당방법으로 제안되었다.
제2절 추정가중치 산정을 위한 시험조사 자료분석
본 절은 항목별 응답상태 및 응답특성을 고려하여 가중치 계산절차에 적용할 가구의 무응답 변수 도출방법을 결정하고, 가구수 추정을 자료의 출처별로 비교하여 행정센서스의 벤치마킹자료의 조정여부에 판단할 자료를 제공하고자한다.이를 위해 시험조가 자료를 분석하였다.
시험조사는 5개 읍면동의 전체 1,063 조사구중 220개 조사구를 표본으로 선정하여 7,380가구를 대상으로 수행되었다. 해당 자료는 가구명부, 가구부분, 인구부분, 주택부분 등으로 구성되어 있다. 원래 선정된 표본과 시험조사 간 차이가 나는 가구수는 309(4.2%)개인데, 이는 시험조사 과정에서 가구가 추가로 작성되어 조사 되었기 때문이다. 면 지역은 그 차이가 근소하고(1%미만), 동/읍 지역은 3%이상의 차이가 나는 것으로 나타났다. 이는 면 지역 조사와 동/읍 지역 조사의 시점이 다른 관계로 나타나는 현상이다.
거처종류를 무응답으로 처리한 가구는 551가구로 전체의 7.2%를 차지하는데,거처종류는 가구 혹은 주택의 승수산정에 층화 변수로 사용이 가능한 변수이므로, 무응답부분은 반드시 대체값(imputation)으로 처리해야 층화 변수로 이용이 가능하다. 조사항목의 무응답의 형태를 분석하여 조사가구의 응답상태를 도출할 수 있었는데, 빈집여부 및 조사상태의 보고를 이용하여 결정 하도록 정리하였다.
시험조사를 시행한 읍면동을 등록센서스의 가구수와 표본으로 추정된 가구수와 2010년 인구총조사의 가구수와 비교하였다. 용운동, 면목동, 금왕읍은 표본추정값에 근접하고, 청하면은 등록센서스 값에 근접하며, 오천면은 등록센서스와 표본추정 중간값에 접근하는 것을 발견할 수 있었다. 용운동을 제외하고, 등록센서스가 표본추정 가구수보다 크게 집계 되었음이 자료분석 결과 드러났다. 일반적으로 면지역에서는 등록센서스가 표본추정보다 더 많이 집계되었다. 이는 주민등록은 있고 실제는 거주하지 않은 인구가 면지역에 더 많기 때문으로 판단된다.동지역은 면지역과 반대 현상으로 표본추정이 더 많이 집계되었다. 이는 주민등록은 없고 실제는 거주하는 인구가 동지역에 많기 때문으로 추정된다.
등록센서스의 일부 가구는 부적격 가구가 있을 것이라는 가정 하에, 표본으로 추정된 적격가구 비율을 이용하여 등록센서스의 적격 가구수를
추정해 보면,오천면은 여전히 등록센서스와 표본추정 간 큰 차이가 있고, 청하면은 부적격가구의 비율이 높아 표본추정 가구 수가 조정된 등록센서스 가구 수보다 큰 것으로 나타났다. 면목동과 금왕읍은 표본추정치 등록센서스 및 인구총조사의 추정가구수가 유사한 것으로 집계되었다.
표본틀 작성을 위한 기초조사는 행정자료를 기반으로 시행한 조사이므로 등록센서스와 기초조사의 결과는 상관관계가 있을 것이라는 가정 하에, 적격가구 비율을 표본으로 추정함과 동시에 이를 근거로 등록센서스의 자료를 조정하여,등록센서스 자료를 벤치마킹 자료로 이용할 수 있는지 여부를 살펴보았으나, 명확한 결론에 도달할 수 있는 근거를 시험조사 분석으로 도출하지 못하였다. 벤치마킹을 위한 등록센서스자료의 조정 여부는 좀 더 신중한 연구가 요구된다.
제3절 가중치 산정 절차
이 절의 목적은 인구주택총조사의 읍면동을 부차모집단으로 하여, 가구, 인구, 주택 통계를 반영한 가중치 산정 방법들을 검토함으로써 인구주택총조사의 추정 정확성을 높일 수 있는 방법을 제안하는 것이다.
표본추출 가중치는 표본 설계 가중치라 하는데, 이 가중치의 산정은 표본 조사구 추출 확률의 역수로 표시하기도 한다. 인구주택총조사의 표본틀은 조사구별로 가구 수 정보가 제공되는데, 여기에서는 모집단 조사구의 가구 수와 추출된 표본 조사구의 추정 가구 수 정보를 이용하여, 표본 조사구의 추출 가중치를 조정함으로써 추정 정확도를 향상 시킬 수 있는 방안을 살펴보았다.
조사가 시행된 후에는 무응답 가구에 대한 처리가 불가피한데, 이 절에서는 조사로 도출된 가구응답 상태를 이용하여 가구 무응답에 대한 가중치를 적용해 조정을 할 수 있도록 하였다. 2010년 인구주택총조사는 가구 및 주택 분야는 전수조사로 시행되었으므로, 인구분야의 표본조사부문인 인구의 가중치는 조사된 총인구수를 벤치마크로 하여 사후층화 방법으로 승수를 산정하였다. 하지만 2015년 인구주택총조사는 가구 인구 및 주택 모두가 표본조사로 자료를 수집하는 관계로 벤치마크는 행정센서스 자료가 사용 가능하다. 이에 이 절에서는 가구, 개인, 주택으로 분리하여 각각 사후층화 방법으로 승수를 산정할 수 있는 방법을 제시하였다.
사후층화로 추정의 정확도를 향상시키기 위해서는 층화변수의 선택과 더불어 층화변수의 카테고리 결정도 가중치 산정의 중요한 사항이다. 층화변수는 추정에 중요한 역할을 할 수 있는 변수를 선택하여야 하고, 변수의 카테고리는 적당한 크기의 표본단위가 할당할 정도의 카테고리를 결정하여야 한다.
인구는 성별 및 5세 연령그룹, 가구는 가구원수, 주택은 거처의 종류를 각각 사후 층화변수로 제안하였다. 표본으로 조사된 층화변수의 카테고리와 등록센서스의 층화변수의 카테고리가 일치하지 않는 경우는 두 자료 간 카테고리의 매칭을 위하여 카테고리를 통합하는 방식으로 진행하였다.
인구와 가구의 추정 정확도를 향상시킬 수 있는 한 방법으로는, 동일가구에 속하는 모든 가구원들은 가구단위의 추정가중치와 인구단위의 추정가중치를 동일하게 부여하는 방법인, 가구·인구 통합 가중치방법(Lemaitre and Dufour:Integrated person-household weighting method)을 논의하였다. 인구의 사후 층화방법과 통합 가중치 방법의 비교를 위해 모의실험을 통한 각 방법의 추정 결과를 비교 검토하였다.
모의실험방법은 2010년 인구주택총조사 충청북도 원시자료를 모집단으로 하고 정의된 모집단으로부터 추정 항목들의 모수를 계산하고, 정의된 모집단에서 20% 조사구를 30회에 걸친 표본 조사구 무작위 추출에 의해 진행하였으며, 각 표본으로부터 사후층화 및 통합가중치 방법의 추정치를 모집단 모수와 비교하여 두 방법들 간 효율성을 비교하였다.
모의실험 추정항목으로는 전수조사 항목에 포함된 교육수준, 혼인상태, 가구주와의 관계를 선정하였고, 표본조사 항목으로는 사례수가 충분한 취업자, 실업자, 아동보육(부모), 활동제약(없음), 고령자생활비원천(부부직업) 등을 선정하였다. 방법 간 효율성 비교는 전수 항목에서는 읍면동별 상대 표본오차를 표본 항목에서는 시군구별 상대 표본오차를 계산하여 비교하였다.
분석결과, 전체적으로 통합가중치 방법이 사후 가중치 방법보다는 보다 효과적인 방법으로 드러났다. 그러나 분석 과정에서 가중치 분포를 살펴보면, 통합 가중치 방법으로 산출된 가중치가 일부 표본가구에1 작은 가중치가 할당되는 경우도 나타났다. 이는 표본이론으로 설명이 불가능한 부분으로 이러한 가중치는 사전에 계산 과정에서 방지하여야 한다. 이를 방지하기 위해서는 정형화된 프로그램 도입이 전제 조건이므로 이 분야는 향후 연구 분야로 제안하였다.
본 장은 실제적인 시험조사 자료의 변수를 이용하여 제안한 사후층화 가중치 계산 절차 및 사후층화 변수 카테고리 자동통합 방법을 위해 알고리즘을 적용하여 정형화된 SAS 매크로 프로그램을 작성하였다. 이러한 정형화된 프로그램을 2015년 인구주택총조사에서 직접 이용 할 수 있도록 제시하였다.
제3장 순환표본조사 시행을 위한 표본설계 및 추정방안 연구
제1절 서론
본 장에서는 순환표본조사를 위한 표본설계 그리고 추정의 방안에 대한 내용을 다루었다. 순환표본조사를 위한 구체적인 표본설계 및 추정 방안에 대한 주요이슈들을 정리하고 시험조사 결과에 적용하여 그 결과들을 살펴보았다. 본 연구내용의 결과 및 필요한 추가 연구사항들 그리고 현재의 문제점 등을 정리하면 다음과 같다.
제2절 순환표본조사를 위한 표본설계
순환센서스에서는 모집단의 대표성을 유지할 수 있는 표본을 추출함과 동시에 매 공표시점 기준 실제 공표가 가능한 공표 수준의 결정을 위한 표본설계가 이루어져야 한다.
통계청에서 현재 고려하고 있는 순환센서스는 프랑스의 순환센서스와는 다른 구조를 갖기 때문에 각 시점 별 조사를 위한 표본의 구성을 위하여 확률적 표본설계와 비확률적 표본설계를 중복적으로 사용하는 것은 바람직하지 않을 것으로 판단된다.
각 시점 별 조사 대상 표본을 구성하기 위한 가능한 안으로는 읍면동 단위의 통계 생산 및 등록센서스의 보완을 목적으로 사전에 충분한 연구가 진행된 2015년 인구주택총조사의 표본조사를 위한 표본설계 방안을 이용하는 것이 바람직하다. 가령, 5년 주기로 조사가 진행될 표본을 추출하고 이를 60개월로 균등하게 분할하는 방안을 고려할 수 있을 것이다.
균등분할의 기준에 대한 연구는 추후에 추가적으로 이루어져야 하나 기본적으로 조사구 추출의 경우, 5년 동안 조사된 조사구를 추출하기 위하여 정렬된 조사구 리스트로부터 60개의 가능한 계통추출표본을 구축하고 이를 이용하는 방안을 고려할 수 있다. 이 때 균형 표본의 정의를 위하여 각 조사구의 추가적인 정보를 고려한다면 정렬기준에 이를 추가한 후 서로 겹치지 않는 계통추출을 통한 표본을 얻을 수 있을 것이다.
이에 대한 이론적 근거는 반복분산추출법 중 비복원 랜덤그룹화 방안에 있으며 공표수준의 결정을 위해서는 각 조사시점 별 읍면동 포함 비율 등의 내용들을 함께 검토해야 한다.
현 시험조사 결과를 이용한 표본설계의 타당성 연구는 제한적일 수밖에 없으며 2015년 인구주택총조사의 표본조사 결과를 이용한 분석이 추 후 이루어져야할 것으로 판단된다.
제3절 모수추정방안
본 절에서는 순환표본조사 결과를 이용하여 산출되는 추정량의 대응 모수에 대한 정의를 하였으며 이에 근거하여 기간추정량의 개념을 정립하였다. 기간추정량은 특정시점 기준의 추정량으로 이해할 수 없으며, 모수의 정의를 통해서 판단한다면 기간의 중간 시점에 대한 추정량으로도 언급할 수 있으나 이 역시 모순이 있는 해석이다. 따라서 공표 시 특정 기준 시점을 정의하는 것은 이론적으로 타당하지 않다.
기간추정에 맞는 조사항목을 새롭게 구성할 필요가 있으며 인플레이션과 같이 타당한 기준이 있을 경우 이에 근거하여 조사된 값의 수정이 추정보다 우선적으로 이루어져야 한다. 추정량의 계산은 다른 조사자료의 분석에서와 마찬가지로 가중치 산출을 통해 이루어지며, 이 과정은 설계가중치, 무응답 조정 그리고 벤치마킹을 통한 최종 가중치 산출의 단계를 거친다.
본 절에서는 시험조사 자료를 이용하여 각 가구원에 부여되는 설계가중치 및 사후층화를 통한 최종가중치를 산출하고 그 결과를 비교하였다. 시험조사의 결과를 볼 때, 20%의 조사구가 조사된 12개월 통합자료를 사용할 경우, 적어도 시군구 통계작성은 가능한 것으로 판단되나 시험조사를 위한 표집틀은 평균 60가구로 구성된 조사구의 리스트로 조사구 크기가 일정하지 않고 조사구 내 가구추출로 인한 가중치의 변동이 있어, 실제 30가구 기준의 조사구 추출이 이루어질 추후 조사들에 대한 추론을 하는 것에는 한계가 있을 것으로 판단된다.
제4장 시험조사 자료의 심층 분석
제1절 서론
통계청은 2012년 8월 순환센서스 도입을 검토하기 위해 경상남도 거창군 시험조사 계획을 수립하여 2012년 10월부터 시험조사를 실시하였고, 2013년 3월부터 인천광역시 연수구의 5개동에 대해 시험조사를 실시하였다.
이 장에서는 인천광역시 연수구와 경상남도 거창군의 시험조사 자료를 심층분석함으로써 주요 항목별 변화 추이 및 시험조사에서의 무응답 현황 등 문제점을 살펴보고자 한다. 또한 시험조사 자료를 대상으로 표본 비율(5%, 10%, 15%,20%)별 주요 항목의 추정치 및 상대표준오차를 분석함으로써 시군구 및 읍면동단위의 시기별 공표 가능한 수준을 파악하고자 한다.
제2절 2010년 센서스 표본조사와 시험조사의 결과 비교
이 절에서는 2010년 인구주택총조사 10% 표본조사와 인천 연수구 및 경남거창군의 시험조사의 주요 결과를 비교함으로써 항목별 변화 추이와 시험조사에서의 무응답 현황 등을 살펴보고자 한다.
1. 인구 부문
○ 성별: 시험조사의 경우 추계인구(가중치 적용 후)에 비하여 여자의 비율이 약간 높고 남자의 비율이 약간 낮다.
○ 나이: 통계청 인구총조사과의 분석에 의하면 인천광역시 연수구와 경상남도 거창군의 경우 2010년 인구주택총조사와 시험조사 자료의 5세 구간별 인구구조에 있어서 시차에 따라 고령화 되는 모습을 보이고 있다.
○ 교육정도: 시지역인 연수구가 군지역인 거창군에 비해서는 ‘대학원 박사이상’의 빈도수가 약간 많기는 하지만, 전체적으로 ‘대학원 이상’ 특히 ‘박사 이상’의 빈도수가 상대적으로 매우 적다.
○ 1년 전 거주지: ‘현 거주지’인 경우가 대부분을 차지하고 있으며, 인구이동지표는 2010년 대비 감소한 것으로 나타났다.
○ 통근․통학 여부: ‘안함’이 전체의 50% 정도를 차지하고 있다. 거창군 시험조사의 경우 가중치 적용 전과 후의 비율에 약간의 차이가 있다. 1차년도 무응답은 연수구 614개, 거창군 209개로 높은 수준이다.
○ 경제활동상태: ‘주로 일하였음’과 ‘일하지 않음’이 대부분을 차지하고 있다. 거창군 시험조사의 경우 가중치 적용 전과 후의 비율에 약간의 차이가 있다. 1차년도 무응답은 연수구 140개, 거창군 468개로 높은 수준이다.
○ 혼인상태: ‘미혼’과 ‘배우자 있음’이 대부분을 차지하고 있으며, 미혼율은 2010년 대비 약간 감소하였다. 거창군 시험조사의 경우 가중치 적용 전과후의 비율에 약간의 차이가 있다. 1차년도 무응답은 연수구 1,474개, 거창군 2,528개로 매우 높은 수준이다.
○ 총 출생아수: 4인 이하가 대부분을 차지하고 있으며, 평균 출생아수는 2010년 대비 약간 감소하였다.
2. 가구 부문
○ 가구 구분: ‘가족’과 ‘1인 가구’가 대부분을 차지하고 있다. 연수구와 거창군 시험조사의 모두 가중치 적용 전과 후의 비율에 약간의 차이가 있다.1인 가구의 비율은 2010년 대비 약간 높아졌다.
○ 거주 기간: 시지역인 연수구의 경우 단기 거주 비율이 높고 장기 거주의 비율은 낮다. 반면, 군지역인 거창군의 경우는 25년 이상 장기 거주의 비율이 매우 높으며, 25년 이상 장기 거주의 비율은 2010년 대비 상당히 감소하였다. 거창군 시험조사의 경우 가중치 적용 전과 후의 비율에 약간의 차이가 있다.
○ 사용 방 수: 잠을 자는 방의 수는 1~3개의 경우가 대부분을 차지하고 있으며, 2010년에 비하여 잠을 자는 방의 수는 상당히 감소하였다. 거창군시험조사의 경우 가중치 적용 전과 후의 비율에 약간의 차이가 있다.
○ 난방 시설: 시지역인 연수구의 경우 도시가스의 비율이 대부분을 차지지하고 있는 반면, 군지역인 거창군의 경우는 기름보일러의 비율이 매우 높다. 거창군의 경우 2010년과 비교하여 난방 시설에 대한 변화가 큰 편이며, 거창군 시험조사의 경우 가중치 적용 전과 후의 비율에 약간의 차이가 있다.
○ 점유 형태: 시지역인 연수구의 경우 자가의 비율이 가장 높으나 전세와 월세의 비율도 상당히 높은 편인 반면, 군지역인 거창군의 경우는 자가가 대부분을 차지하고 있다. 거창군 시험조사의 경우 가중치 적용 전과 후의 비율에 약간의 차이가 있다.
제3절 시·군 단위의 시험조사 결과 분석
이 절에서는 인천광역시 연수구의 시험조사를 대상으로 표본 비율(5%, 10%,15%, 20%)별 주요 항목의 추정치 및 상대표준오차를 분석함으로써 시군구 단위의 시기별 공표 가능한 수준을 살펴보고자 한다. 참고로 경상남도 거창군의 경우는 20% 표본 자료에 대한 결과를 제시하였다.
제4절 동·읍 단위의 시험조사 결과 분석
이 절에서는 인천광역시의 시험조사 대상 동 중 가장 작은 규모인 연수3동의 시험조사를 대상으로 표본 비율(5%, 10%, 15%, 20%)별 주요 항목의 추정치 및 상대표준오차를 분석함으로써 읍면동 단위의 시기별 공표 가능한 수준을 살펴보고자 한다.
제5장 한국에서의 순환센서스 기능
제1절 순환센서스의 사회적 기능
순환센서스는 각 지역의 변화를 정기적으로 측정하고 비교하는 기록으로서의 의미를 가진다. 순환센서스의 주요한 목적은 각 지역의 특성을 파악하고 비교함으로써 더 나은 공동체를 구축할 수 있는 토대를 만드는 것이라고 할 수 있다.각 지방 정부가 정책을 수립하고 또한 시행하고 있는 정책의 효과를 평가하고 함의를 도출하는 데에 순환센서스는 보다 빠르고 정확한 자료를 통합적으로 제공하는 역할을 할 수 있다. 순환센서스를 조사하는 과정에서 시간에 따른 전출입에 의한 모집단의 변화를 파악하는 등 주기적인 조사에 지자체와의 협조가 매우 중요하기 때문에, 지자체가 정책을 평가하고 새로운 정책을 수립하는 데에 원활히 반영할 수 있도록 자료를 통합하고 가공해서 제공하는 것이 필요하다.
오늘날 세계적인 수준의 사회과학 저널들에서는 기존의 개인 위주의 서베이자료보다는 실험의 기법이나 행정 자료를 활용한 연구가 증가하고 있다. 순환센서스는 기존의 행정 자료가 제공하던 정보의 질과 폭을 크게 넓힘으로써 학문적인 발전에 기여할 뿐만 아니라 정책적 함의가 높은 연구들을 양산해 낼 수 있을 것으로 기대된다.
제2절 American Community Survey(ACS) 적용 가능성 검토
1. ACS 조사의 특징
ACS는 2005년부터 미국 전역에 약 290만 가구를 표집하여 조사하는 것으로 시작하여, 2013년에는 약 350만 가구를 표집하는 등 지속적으로 확대되어 왔다.응답률이 낮은 지역이나 에스키모, 인디언 등 소수 민족이 거주하는 지역들은 표집률을 다른 지역보다 높게 설정함으로써 이들의 대표성을 확보할 수 있도록 하고 있다. 한국에서도 현재 인구주택총조사 표집틀에 외국인 비율을 고려하여 취약지역에 추가 조사구를 배분하고 있는데, 다문화 가정이나 외국인 노동자 2세조사 등을 위해 이러한 표집 방식을 적용해야 할 것이다. ACS 2015년의 설문지는 24개의 주거 관련 문항과 48개의 인구 관련 문항으로 구성되어 있다.
CS 개인 원자료는 2000년까지 진행된 센서스와 동일한 방식으로 표집한 PUMS(Public Use Microdata Sample)을 로그인 없이 누구에게나 공개하는 방식으로 제공되고 있다. 2015년 현재에는 2000년부터 2013년까지의 마이크로데이터를 주 별로 1년 자료는 물론, 3년치와 5년치의 누적 자료까지 가구 자료와 개인자료로 나누어서 업로드하였으며, 이 가구 자료와 개인 자료는 별도의 가구별 ID를 통해 병합하는 것도 가능하다. 지역 변수를 PUMA(Public Use Microdata Areas, 총 2,378개)로만 제공하고 각각을 인구 100,000명 이상이 되도록 하고 있다. 한국의 순환센서스도 개인과 가구 단위의 원자료를 사생활을 침해하지 않는 수준에서 공개할 지역 단위를 결정할 필요가 있다.
지역별 집계 자료는 웹사이트(Americana Fact Finder, factfinder.census.org)를 통해서 주제별, 지역별, 인종 및 민족 집단별, 산업별, 직업별로 나누어서 제공된다. 각 지역의 대표성을 확보하기 위해 1년치와 3년치의 추정치는 각각 인구65,000명 이상과 20,000명 이상인 지역 단위에서만 공개한다. 비슷한 원칙을 한국의 순환센서스에 적용한다면 군과 구 단위에는 1년치와 3년치의 자료를, 읍과 면단위에는 5년치의 자료를 공개하는 것과 유사할 것이다.
2. ACS 자료의 학문적, 정책적 활용 및 홍보
ACS 자료를 활용한 학문적 연구들은 크게 (1) ACS를 타 자료의 타당성 검토를 위한 준거 자료로 활용하는 경우, (2) ACS를 추정을 위한 주 자료로 사용하는 경우, (3) ACS를 지역 수준의 변수를 생성하는 데에 사용하는 경우, (4) 개인 수준의 자료를 활용하는 경우 등으로 구분된다. ACS를 보다 적극적으로 활용할수록 연구가 심화되기 때문에, (1)에서 (4)로 갈수록, 즉 분석적인 연구로 갈수록 수준이 높다. 따라서 한국의 순환센서스가 지역 집계자료나 개인 자료를 손쉽게 쓸 수 있도록 제공하는 것이 양질의 풍부한 분석을 활성화시키는 데에 바람직할 것으로 보인다.
ACS의 통계 자료는 특히 뉴욕타임즈(New York Times)가 지금까지 ACS를 인용한 200여 건의 기사에서 다루고 있는 것처럼 여러 언론에서 심도 있게 다루어지고 있다. 기사의 양과 질로 보았을 때 점점 그 중요성이 증가하고 있는데,ACS의 심층적인 언론보도에서 주목할 점은 다양한 주체 간의 연계활동이다. 통계청이 자료를 모으면 미네소타 대학이 자료를 가공하고, 뉴욕시립대학(CUNY)이 시각적 기법 등을 포함한 분석을 하고 뉴욕타임즈 같은 언론이 보도를 하는 것이다. 이러한 연계활동은 한국 순환센서스의 언론보도에도 활용될 수 있을 것이다.
미국의 연방 정부는 연간 총 $40조의 예산을 ACS에 근거해 하위 기관이나 주 정부에 배분하며, 새로운 정책을 수립하거나 기존 정책을 보다 효율적, 효과적으로 집행하기 위해 ACS의 통계를 활용한다. 한국의 순환센서스의 정책 활용도를 높이기 위해서는 자료 제공을 바탕으로 다양하고 심층적인 자료 분석이 선행되어야 할 것이며, 더불어 순환센서스의 언론보도 및 정책적 활용을 추적하여 순환센서스가 사회에 주는 영향력을 누적적으로 파악되고 홍보할 수 있어야 할 것이다. 지금까지 논의된 ACS의 특성을 바탕으로 한국의 순환센서스에 적용할 만한 요소들을 정리하면 아래 표와 같다
제4절 기타 조사의 활용 가능성 검토
순환센서스는 5년 주기로 총 인구의 20%만을 조사하는 대신 면접원이 방문조사를 하며, 좀 더 많은 조사문항을 포함시켜 다양한 사회조사의 기능을 겸할수 있다. 이에 본 절에서는 통계청이 실시하고 있는 조사들 중 ‘사회조사’와 ‘지역별 고용조사’를 주로 참조하여 가능한 문항들을 고려해보았다.
1. 사회조사 문항의 활용 가능성
현재의 사회조사는 2008년부터 매년 5개 부문으로 정착되어 실시되어 왔고,18,000여 가구에서 만 13세 이상의 가구원을 대상으로 하기에 약 37,000여 명이 응답해 왔다. 순환센서스에 활용될만한 문항의 성격은 따라 크게 두 가지로 나눌수 있다. 첫째는 지역별 특성을 보여줄 수 있는 문항으로, 복지, 환경, 안전, 나눔등에 관한 문항들이다. 이들은 시군구(매년 혹은 3년)나 읍면동(5년) 등의 지역단위별로 이들을 대표할 수 있는 지표를 생산하고 비교하는 데에 주로 활용될 수있다. 이러한 문항을 바탕으로 지표를 산출함으로써 각 지방 정부에서의 정책을 위한 기초 자료로서의 역할을 할 수 있을 것이다. 두 번째 범주는 응답자의 태도나 상태에 관한 문항들이다. 주관적 계층 인식이나 계층 이동에 대한 전망을 묻는 문항들은 언론에 기획기사로 보도되기에도 알맞은 주제이다. 예를 들어 2015년 11월 27일 한겨레 신문은 사회조사 계층이동 문항을 분석하여 “국민 10명 중 2명만 ‘계층상승 가능’”이라는 제목(부제: “2009년 36%서 올해 22%로 떨어져”)으로 1면에 기사를 게재했다. 이러한 기사는 2009년부터 격년으로 꾸준히 동일한 태도를 물었기에 가능한 기사이며, 향후 순환센서스에 통합하여 질문할 경우 그 누적적 가치가 지속될 수 있다.
2. 지역별 고용조사 문항의 활용 가능성
지역별 고용조사는 2008년부터 실시되어 시군 단위로 고용 현황과 산업별,지역별 특성을 조사하는 것을 목표로 하는 대규모 조사이며, 연간 조사, 분기 조사를 거쳐 현재는 반기로 조사되어 실업률이나 취업률, 비경제활동인구 등의 고용지표를 산출하는 데에 활용된다. 10,000여 개의 조사구에서 총 190,000 가구를 표집하여 30개 내외의 문항들로 구성된 간단한 설문을 실시하기 때문에 비교적 작은 단위의 지역 범위인 시와 군 수준에서까지 통계를 제시할 수 있다. 순환센서스의 경우 약 두 달치 조사에 해당하는 규모의 조사이다.
3. OECD 지표 모듈 가능성
OECD에서 발표하는 지표들은 다른 국가들과 비교했을 때 한국 사회의 여러단면들을 볼 수 있는 기회를 제공한다. 주요 결과들은 공공성 순위 꼴지, 안전의식 30위, 자살률 1위, 노인빈곤률 1위, 아동 삶의 만족도 꼴지, 스마트폰 보급량 1위, 단기 근로자 비중 OECD 1위, 노동생산성 낮음, 노동시간 2위, 1인당 독서량 꼴지, 중장년 실질 문맹률 최고, 성인 학습의지 꼴지 등으로 나타난다. 전국 수준 혹은 지역 수준에서 국제적으로 비교할 수 있는 지표를 생산하고 장기적으로 이를 개선하는 것은 정책적인 차원에서 중요할 것이며, 자살률 감소를 위한 우울감이나 자살생각 문항, 낮은 노동생산성과 학습의지 등을 개선하기 위한 직장만족도 등에 대한 조사가 가능할 것이다. 더불어 사회조사의 사회 지지망 문항, 사회참여 문항, 한국종합사회조사의 대인신뢰 및 기관에 대한 신뢰 등이 연관성이 높은 문항들이다.
4. 순환센서스 조사 모듈 설계의 예
모듈 항목들 중 고용조사는 동일한 항목을 3달 간격으로 4회까지 조사하며두 회를 합하여 반기별(즉 6개월 단위)로 추정치를 공개한다. 사회조사 항목들은 환경, 나눔, 사회자본 및 계층의 총 세 모듈로 나누어 6개월 간격으로 총 2회 조사하여 연도별로 추정치를 제공한다. OECD 모듈은 지역단위보다 국가단위 추정이 더 유용할 것이므로 1년에 1회만 조사하는 것으로 조사계획을 세웠다. 변동모듈은 주로 연말에 실시하여 국가적으로 혹은 지역적으로 중요한 이슈나 수요를 반영할 수 있도록 한다. 혹은 타 부처나 연구자들로부터 공모나 예산지원을 받아 문항을 구성하는 등의 방안이 가능할 것이다. 국가적인 현황파악의 경우는 향후정규모듈에 편입시키려는 문항이나 모듈을 시범적으로 조사하는데 활용할 수 있을 것으로 보이며, 지자체의 정책 평가의 경우는 향후 순환센서스의 원활한 정착을 위해 지역행정의 협조를 얻는데 유용할 수 있다. 외부의 공모나 예산지원을 받는 경우는 학문적 발전과 센서스 예산 확보에 도움이 될 수 있을 것이다.
제6장 향후 순환센서스 연구를 위한 정책적 제언
제6장에서는 각 장별 연구를 통해 도출된 결과를 토대로 향후 순환센서스 연구를 위한 정책적 제언을 제시하였다. 먼저, 제2장의 ‘인구주택총조사 표본규모할당 및 추정방법’에 대한 연구를 통해 표본규모 할당방법, 추정가중치 산정을 위한 시험조사 자료분석, 그리고 가중치 산정 절차 등에 대한 과제를 제안하였다.
다음으로, 제3장의 ‘순환표본조사 시행을 위한 표본설계 및 추정방안 연구’에서는 시험조사의 목적이 불분명함을 지적함과 동시에 본 연구를 위한 다양한 분석 과정에서 발생한 문제점과 개선사항들을 제시하였다. 또한 순환표본조사를 위한 표본설계 시 유의사항과 순환표본조사 자료를 이용한 모수 추정을 위한 향후과제를 제안하였다. 제4장에서는 ‘시험조사 자료의 심층분석’ 결과를 토대로 경상남도 거창군, 인천 연수구, 그리고 현재 제주도에서 진행 중인 시험조사의 결과분석을 어떻게 수행하여야 하는가, 그리고 시험조사 자료의 철저한 정제와 질 관리의 필요성을 언급하였다. 마지막으로 제5장에서의 ‘한국에서의 순환센서스 기능’과 관련된 연구를 통해 향후 순환센서스를 공동체 연구 활성화를 위한 기초자료로 어떻게 이용할 수 있을 것인지를 제시하였다. 특히, 지역 수준 지표 및 개인자료 활용과 자료를 활용한 정책적․학문적 연구 활성화 가능성을 중심적으로 논의하였다.
과제명(ProjectTitle) : | - |
---|---|
연구책임자(Manager) : | - |
과제기간(DetailSeriesProject) : | - |
총연구비 (DetailSeriesProject) : | - |
키워드(keyword) : | - |
과제수행기간(LeadAgency) : | - |
연구목표(Goal) : | - |
연구내용(Abstract) : | - |
기대효과(Effect) : | - |
Copyright KISTI. All Rights Reserved.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.