$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

층화추출과 계통추출을 이용한 효율적인 보조정보 사용
Efficient Use of Auxiliary Information through the Stratified Sampling and Systematic Sampling Design 원문보기

조사연구 = Survey research, v.10 no.1, 2009년, pp.155 - 168  

김관수 (고려대학교 통계학과) ,  박민규 (고려대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

표본설계 단계에서 이용 가능한 보조정보가 있는 경우 효율적인 표본추출방법으로 층화추출법이 흔히 고려된다. 특별히 층화변수로 이용할 수 있는 변수가 많은 경우 전체 층의 숫자가 커지게 되며, 이때 각 층으로부터 한 단위를 추출하는 층 표본크기가 1인 층화추출이 효율적임이 알려져 있다. 그러나 각 층으로부터 하나의 추출단위를 추출하는 층 표본크기가 1인 층화추출의 경우 불편 분산 추정량의 계산이 불가능하다. 불편 분산 추정량의 계산은 층의 수를 줄이고 각 층으로부터 두 개의 표본추출단위를 표집하는 층 표본크기가 2인 층화추출에서 가능하나 중요 층화변수가 누락될 경우 층 표본크기가 1인 층화추출에 비해 그 효율성이 떨어진다. 본 연구에서는 Park & Fuller(2008)에 의해 제시된 층 표본크기가 2인 균형 층화추출과 호르비츠-톰슨 추정량의 불편 분산 추정량을 살펴보고, 모의실험을 통하여 여러 가지 층화추출법과 계통추출법을 비교한다. 또한 제시된 표본추출법을 2006년 청년패널 자료에 적용하여 그 효율성을 평가한다.

Abstract AI-Helper 아이콘AI-Helper

As an efficient sampling design, stratified random sampling is often used when auxiliary information is available at the designing stage. Although one - per - stratum design is an efficient design that can be used when many auxiliary variables are available, it does not provide any unbiased variance...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 보조정보를 이용한 표본추출방법으로는 층화추출, 계통표집 그리고, 확률비례표집 등 이 있다 층화변수가 많은 경우, 이 중 보조정보를 효율적으로 이용하는 표본추출방법으로 기존에는 층화추출법의 OPS와 TPS가 고려될 수 있다 본 연구에서는 OPS와 비슷한 효율성을 가지면서 또한 TPS처럼 불편 분산 추정량을 구할 수 있는 장점을 갖는 CTPS를 소개했다.

가설 설정

  • SYS는 각 층에서 보조정보를 이용해 오름차순으로 정렬시킨 후 크기가 2인 계통추출 표본을 추출한다 이렇게 추출된 표본으로써 모집단 평균 #에 대한 추정량으로 HT 추정량을 사용한다 SYS 표본은 불편 분산 추정량이 존재하지 않으므로 SYS 표본이 단순임의 추출(simple random sample; SRS)의 표본과 근사하다는 가정 하에 SRS의 분산 추정량을 사용한다(김종호 외 2006). SYS도 CTPS와 동일하게 독립적으로 10,000번 반복실험을 통해 얻은 HT추정량과 SRS분산 추정량에 대한 Monte Carlo 평균과 분산을 계산한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
보조정보를 이용한 표본추출방법으로 무엇이 있는가? 보조정보를 이용한 표본추출방법으로는 층화추출(stratified sampling), 계통추출(systematic sampling: SYS), 확률비례추출(probability proportional sampling) 등이 있다 이 중 보조정보를 이용한 효율적인 표본추출방법으로 층화임의추출법이 흔히 사용된다 이용할 수 있는 층화변수가 많은 경우 가능한 층화추출법으로 층 표본크기가 1인 층화 추출(one-per-stratum design: OPS)과 층 표본크기가 2인 층화추출(two-per-stratum design: TPS)등을 고려할 수 있다 OPS는 가능한 모든 보조정보를 이용한다는 관점에서 가장 효율적인 방법이지만 선형추정량의 불편 분산 추정량을 제공하지 못한다 이웃한 층과 결합하여 분산을 구하는 경우 분산 추정량은 실제 분산보다 과대 추정함이 알려져 있다(Cochran 1977).
보조정보란 무엇인가? 일반적으로 보조정보(auxiliary information)란 현행조사 이외의 자료로부터 얻는 모집 단에 대한 정보로서 관심변수 y의 모수를 추정하기 위해 y와 밀접한 관계를 갖는 보조변수 x가 가지고 있는 정보를 나타낸다(Samdal et al. 1992; 김영원 외).
OPS, TPS, CTPS 그리고 SYS 하에서 HT 추정량의 10.000번 반복 결과 Monte Carlo 평균 및 분산은 어떻게 나타났는가? CTPS, TPS, OPS 그리고 SYS의 추출방법 하에서 HT 추정량은 모집단 평균의 불편 추정량임을 알 수 있다. TPS의 Monte Carlo 분산이 그리고 SYS의 Monte Carlo 분산 보다 상당히 크게 나타나며 이는 TPS 설계 시 보조변수인 연령을 이용하지 않았기 때문으로 고려된다. CTPS, OPS 그리고 SYS의 분산은 비슷하다. 이는 CTPS, OPS 그리고 SYS의 효율성이 비슷함을 나타낸다. 그러나 불편 분산 추정량이 존재하는 CTPS가 다른 표본추출법보다는 선호될 수 있다.
질의응답 정보가 도움이 되었나요?

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로