층화확률추출은 모집단을 어떤 층화기준에 의해 여러 층으로 분할한 다음 각 층으로부터 독립적으로 표본을 임의추출하는 방법으로 여러 가지 장점을 가지고 있어 실제 조사에서 많이 활용되고 있다. 본 연구에서는 대규모 표본조사에서 많이 사용하고 있는 층화확률추출을 사용하여 추출된 표본을 통해 모평균에 대한 붓스트랩 추정량과 신뢰구간 및 가설검정 등 통계적 추론에 대하여 연구하였다. 층화모집단에서의 모평균의 추정량과 관련된 극한 분포이론들을 기초로 붓스트랩 일치성을 근거로 층화 모평균에 대해 표준 붓스트랩 방법, 백분위수 붓스트랩 방법, 스튜던트화 붓스트랩 방법을 활용한 신뢰구간과 붓스트랩 가설검정 방법을 제안하였으며, 모의실험을 통해 신뢰구간 추정 방법들의 유효성을 확인하였다.
층화확률추출은 모집단을 어떤 층화기준에 의해 여러 층으로 분할한 다음 각 층으로부터 독립적으로 표본을 임의추출하는 방법으로 여러 가지 장점을 가지고 있어 실제 조사에서 많이 활용되고 있다. 본 연구에서는 대규모 표본조사에서 많이 사용하고 있는 층화확률추출을 사용하여 추출된 표본을 통해 모평균에 대한 붓스트랩 추정량과 신뢰구간 및 가설검정 등 통계적 추론에 대하여 연구하였다. 층화모집단에서의 모평균의 추정량과 관련된 극한 분포이론들을 기초로 붓스트랩 일치성을 근거로 층화 모평균에 대해 표준 붓스트랩 방법, 백분위수 붓스트랩 방법, 스튜던트화 붓스트랩 방법을 활용한 신뢰구간과 붓스트랩 가설검정 방법을 제안하였으며, 모의실험을 통해 신뢰구간 추정 방법들의 유효성을 확인하였다.
In a stratified sample, the sampling frame is divided into non-overlapping groups or strata (e.g. geographical areas, age-groups, and genders). A sample is taken from each stratum, if this sample is a simple random sample it is referred to as stratified random sampling. In this paper, we study the b...
In a stratified sample, the sampling frame is divided into non-overlapping groups or strata (e.g. geographical areas, age-groups, and genders). A sample is taken from each stratum, if this sample is a simple random sample it is referred to as stratified random sampling. In this paper, we study the bootstrap inference (including confidence interval) and test for a stratified population mean. We also introduce the bootstrap consistency based on limiting distribution related to the plug-in estimator of the population mean. We suggest three bootstrap confidence intervals such as standard bootstrap method, percentile bootstrap method and studentized bootstrap method. We also suggest a bootstrap test method computing the $ASL_{boot}$(Achieved Significance Level). The results of estimation are verified using simulation.
In a stratified sample, the sampling frame is divided into non-overlapping groups or strata (e.g. geographical areas, age-groups, and genders). A sample is taken from each stratum, if this sample is a simple random sample it is referred to as stratified random sampling. In this paper, we study the bootstrap inference (including confidence interval) and test for a stratified population mean. We also introduce the bootstrap consistency based on limiting distribution related to the plug-in estimator of the population mean. We suggest three bootstrap confidence intervals such as standard bootstrap method, percentile bootstrap method and studentized bootstrap method. We also suggest a bootstrap test method computing the $ASL_{boot}$(Achieved Significance Level). The results of estimation are verified using simulation.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 연구에서는 통계적 추론에서 모집단의 분포에 관계없이 보다 효율적으로 소표본에서도 비교적 정확하게 관심모수를 추정할 수 있는 장점을 가진 붓스트랩(bootstrap) 기법을 사용하여 층화확률추출에 대한 각 층별 모평균 및 전체 모평균의 추정량에 대한 붓스트랩 추정량 및 그에 대한 극한분포를 제시하고 대표적인 세 가지 붓스트랩 구간 추정 방법을 제안하고자 한다(Efron, 1979, 1985, 1987; Efron과 Tibshirani, 1986; Hall, 1986, 1988; Martin, 1990; Pons, 2007).
2절에서 소개한 극한분포의 결과들을 기초로 한 붓스트랩의 일치성으로 여러 가지 붓스트랩 신뢰구간을 추정할 수 있다. 본 논문에서는 붓스트랩 점 추정량 뿐만 아니라 구간추정을 위해 표준 붓스트랩 방법, 백분위수 붓스트랩 방법, 스튜던트화 붓스트랩 방법 등 세 가지 방법을 제안하여 층화확률추출의 각 층 및 전체 모평균에 대해 추정에 대해 연구하였다.
본 연구에서는 층화 모집단에서 모평균에 대한 붓스트랩 추정문제와 가설검정 문제를 연구하였다. 붓스트랩 추론을 위한 붓스트랩의 일치성을 연구, 소개하고 이를 기초로 층화 모평균에 대하여 필요한 붓스트랩 알고리즘과 세가지 붓스트랩 신뢰구간 추정방법 그리고 붓스트랩 가설 검정 방법을 제안, 연구하였다.
한편 본 논문에서는 층화 모평균 µ에 대한 가설검정 문제를 붓스트랩 방법을 적용하여 유의확률을 보다 효율적으로 계산하여 유용하게 해결하고자 한다.
가설 설정
다른 통계모형에 대하여 효율적으로 알려진 표준 붓스트랩 방법과 스튜던트화 붓스트랩 방법 그리고 효율성은 떨어지지만 널리 사용되는 백분위수 붓스트랩 방법을 통해 신뢰구간을 계산하였다. 본 모의실험에서는 층화확률추출에서 두 개의 층을 가지고 있는 모집단을 가정하였으며, 왜도를 가지고 있지 않은 정규분포와 왜도의 영향력을 보기 위해 카이제곱분포를 기저분포로 이용하였다. 정규분포는 분산은 같지만 각 층의 평균이 각각 10과 15인 분포와 자유도가 5와 20인 카이제곱분포를 각각 사용하였으며, 해당 분포에서 1000개의 확률표본을 복원추출로 선택하여 그 중 표본의 크기가 각각 20, 50, 100, 200으로 증가시키며 모의실험을 실시하였다.
제안 방법
결론적으로 적당한 붓스트랩 알고리즘 하에서 위에서 설명한 이론적 결과를 기초로 층화 모평균 µ에 대한 가설검정에 필요한 식 (3.5)와 같은 형태의 유의확률을 제안하고자 한다.
또한 층화 모평균에 대하여 표준 붓스트랩 신뢰구간과 백분위수 붓스트랩 신뢰구간 그리고 스튜던트화 붓스트랩 신뢰구간 등 붓스트랩 신뢰구간 추정방법을 연구하였다. 나아가 전체 모평균에 대한 붓스트랩 가설검정 방법을 제안하였다. 4장에서는 정규분포와 카이제곱분포 가정 하에서 모의실험을 실시하여 3장에서 제안한 추정방법들에 대한 유효성을 연구하였다.
먼저 2장에서는 층화확률추출 모형 및 추정량의 극한분포를 설명하였고 3장에서는 층화임의추출에서의 붓스트랩 알고리즘 소개와 붓스트랩 추정량의 극한분포에 대해서 논하였다. 또한 층화 모평균에 대하여 표준 붓스트랩 신뢰구간과 백분위수 붓스트랩 신뢰구간 그리고 스튜던트화 붓스트랩 신뢰구간 등 붓스트랩 신뢰구간 추정방법을 연구하였다. 나아가 전체 모평균에 대한 붓스트랩 가설검정 방법을 제안하였다.
본 절에서는 모의실험을 통해 층화확률추출에 대해 각 층별 및 전체 모평균에 대한 붓스트랩 추정량 및 표준오차를 계산하였다. 다른 통계모형에 대하여 효율적으로 알려진 표준 붓스트랩 방법과 스튜던트화 붓스트랩 방법 그리고 효율성은 떨어지지만 널리 사용되는 백분위수 붓스트랩 방법을 통해 신뢰구간을 계산하였다.
본 연구에서는 층화 모집단에서 모평균에 대한 붓스트랩 추정문제와 가설검정 문제를 연구하였다. 붓스트랩 추론을 위한 붓스트랩의 일치성을 연구, 소개하고 이를 기초로 층화 모평균에 대하여 필요한 붓스트랩 알고리즘과 세가지 붓스트랩 신뢰구간 추정방법 그리고 붓스트랩 가설 검정 방법을 제안, 연구하였다. 또한 두 가지 확률분포 가정하에서 붓스트랩 모의실험을 통해 현실적으로 충분히 활용 가능한 좋은 신뢰구간 추정방법임을 확인하였다.
본 모의실험에서는 층화확률추출에서 두 개의 층을 가지고 있는 모집단을 가정하였으며, 왜도를 가지고 있지 않은 정규분포와 왜도의 영향력을 보기 위해 카이제곱분포를 기저분포로 이용하였다. 정규분포는 분산은 같지만 각 층의 평균이 각각 10과 15인 분포와 자유도가 5와 20인 카이제곱분포를 각각 사용하였으며, 해당 분포에서 1000개의 확률표본을 복원추출로 선택하여 그 중 표본의 크기가 각각 20, 50, 100, 200으로 증가시키며 모의실험을 실시하였다.
데이터처리
본 절에서는 모의실험을 통해 층화확률추출에 대해 각 층별 및 전체 모평균에 대한 붓스트랩 추정량 및 표준오차를 계산하였다. 다른 통계모형에 대하여 효율적으로 알려진 표준 붓스트랩 방법과 스튜던트화 붓스트랩 방법 그리고 효율성은 떨어지지만 널리 사용되는 백분위수 붓스트랩 방법을 통해 신뢰구간을 계산하였다. 본 모의실험에서는 층화확률추출에서 두 개의 층을 가지고 있는 모집단을 가정하였으며, 왜도를 가지고 있지 않은 정규분포와 왜도의 영향력을 보기 위해 카이제곱분포를 기저분포로 이용하였다.
성능/효과
붓스트랩 추론을 위한 붓스트랩의 일치성을 연구, 소개하고 이를 기초로 층화 모평균에 대하여 필요한 붓스트랩 알고리즘과 세가지 붓스트랩 신뢰구간 추정방법 그리고 붓스트랩 가설 검정 방법을 제안, 연구하였다. 또한 두 가지 확률분포 가정하에서 붓스트랩 모의실험을 통해 현실적으로 충분히 활용 가능한 좋은 신뢰구간 추정방법임을 확인하였다.
표 1과 표 2는 정규분포와 카이제곱분포를 기저분포로 사용하여 모의실험을 통해 두 개의 층으로 구성된 층화확률추출에 대한 붓스트랩 추정량 및 신뢰구간을 나타낸 표이다. 전반적으로 각각의 경우에 신뢰구간이 적절히 계산되었고 표본의 크기가 커질수록 붓스트랩 추정량의 표준오차가 작아짐을 알수 있으며, 스튜던트화 방법이 대체적으로 신뢰구간의 폭이 야간 작은 것으로 계산되었다. 하지만 효율적으로 알려진 표준 붓스트랩 방법과 스튜던트화 붓스트랩 방법 그리고 효율성은 떨어지지만 널리 사용되는 백분위수 붓스트랩 신뢰구간을 계산하는 방법 모두 좋은 구간 추정 방법이 될 수 있다고 판단된다.
전반적으로 각각의 경우에 신뢰구간이 적절히 계산되었고 표본의 크기가 커질수록 붓스트랩 추정량의 표준오차가 작아짐을 알수 있으며, 스튜던트화 방법이 대체적으로 신뢰구간의 폭이 야간 작은 것으로 계산되었다. 하지만 효율적으로 알려진 표준 붓스트랩 방법과 스튜던트화 붓스트랩 방법 그리고 효율성은 떨어지지만 널리 사용되는 백분위수 붓스트랩 신뢰구간을 계산하는 방법 모두 좋은 구간 추정 방법이 될 수 있다고 판단된다.
후속연구
물론 더욱 정확한 효율적인 붓스트랩 추론과 관련된 의미 있는 결론은 보다 많은 포괄적인 모의실험이 실행되어야 할 것으로 사료된다.
한편 본 논문에서는 층화 모평균 µ에 대한 가설검정 문제를 붓스트랩 방법을 적용하여 유의확률을 보다 효율적으로 계산하여 유용하게 해결하고자 한다. 붓스트랩 검정방법은 모집단분포의 정규성 문제와 관계없이 이러한 형태의 가설검정문제에 활용할 수 있는 포괄적인 로버스트한 방법으로 보다 효과적이고 편리하게 응용할 수 있을 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
표본조사를 수행하기 위해서 먼저 선행되어야 할 것은?
대부분의 사회조사에서 표본조사를 많이 활용하고 있으며 표본조사는 모집단 전체의 자료를 조사하는 것에 비해 여러 가지 장점을 가지고 있다. 이러한 표본조사를 수행하기 위해서는 모집단을 이용하여 먼저 표본추출이 선행되어야 한다.
본 연구에서 제안한 층화확률추출 방법은?
본 연구에서는 대규모 표본조사에서 많이 사용하고 있는 층화확률추출을 사용하여 추출된 표본을 통해 모평균에 대한 붓스트랩 추정량과 신뢰구간 및 가설검정 등 통계적 추론에 대하여 연구하였다. 층화모집단에서의 모평균의 추정량과 관련된 극한 분포이론들을 기초로 붓스트랩 일치성을 근거로 층화 모평균에 대해 표준 붓스트랩 방법, 백분위수 붓스트랩 방법, 스튜던트화 붓스트랩 방법을 활용한 신뢰구간과 붓스트랩 가설검정 방법을 제안하였으며, 모의실험을 통해 신뢰구간 추정 방법들의 유효성을 확인하였다.
층화확률추출은 무엇인가?
층화확률추출은 모집단을 어떤 층화기준에 의해 여러 층으로 분할한 다음 각 층으로부터 독립적으로 표본을 임의추출하는 방법으로 여러 가지 장점을 가지고 있어 실제 조사에서 많이 활용되고 있다. 본 연구에서는 대규모 표본조사에서 많이 사용하고 있는 층화확률추출을 사용하여 추출된 표본을 통해 모평균에 대한 붓스트랩 추정량과 신뢰구간 및 가설검정 등 통계적 추론에 대하여 연구하였다.
참고문헌 (10)
Bickel, P. J. and Freedman, D. A. (1984). Asymptotic normality and the bootstrap in stratified sampling, Annals of Statistics, 12, 470-482.
Efron, B. and Tibshirani, R. (1986). Bootstrap methods for standard errors, confidence intervals, and other measures of statistical accuracy, Statistical Science, 1, 54-75.
Martin, M. A. (1990). On bootstrap iteration for coverage correction in confidence intervals, Journal of the American statistical Association, 85, 1105-1118.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.