$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

대표성을 위한 R-indicator의 사용과 추정법 연구
Usage and Estimation of R-indicator for Representative 원문보기

응용통계연구 = The Korean journal of applied statistics, v.28 no.3, 2015년, pp.417 - 427  

박현아 (서울대학교 통계학과) ,  이기재 (한국방송통신대학교 정보통계학과)

초록

표본의 대표성을 측정하기 위한 척도로 응답률이 사용된다. 즉 높은 응답률일수록 표본의 대표성을 더 잘 나타낸다고 할 수 있다. 그러나 높은 응답률이라 할지라도 무응답이 존재하는 것이므로 표본의 대표성을 설명하기에는 한계가 있는 경우가 발생한다. 그래서 Schouten 등 (2009)에서는 R-indicator라는 새로운 척도를 제시하여 표본의 대표성을 더 설명할 수 있게 하였다. 본 논문에서는 R-indicator도 표본에 의해 추정되어야 한다는 것에 착안하여 그것에 관한 새로운 추정량을 제시한다. 또한 여러 모의실험하에 R-indicator의 대표성으로써의 설명력과 제안된 추정량의 편향과 효율을 기존의 추정량과 비교분석하며 실제자료에도 제안한 추정량을 적용하여 표본의 대표성을 설명한다.

Abstract AI-Helper 아이콘AI-Helper

Measures in response rate used to measure the representativeness of the sample (the more high response rate) better explain the representativeness of the sample. However, we cannot often explain the representativeness of the sample because there is nonresponse even in the high response rate. Therefo...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 일반적으로 척도라는 것은 표본으로 그 값을 도출해야 하기 때문에 추정이라는 과정을 거쳐야 한다. 그래서 본 연구에서는 R-indicator에 대한 기존의 추정방법보다 편향이 줄어들고 효율이 좋아지는 방법을 제시하였으며 모의실험을 통하여 그와 같은 성질들을 규명하였다.
  • 본 논문에서는 Schouten 등 (2009)에서 제안된 R-indicator의 대표성에 관한 의미와 설명력을 연구하며 R-indicator의 새로운 추정방법을 제시하고자 한다. R-indicator는 본질적으로 응답확률에 기반을 두고 있으므로 그 응답확률 추정이 고려되어야 하며 또한 표본에 기반을 두어 그 값을 계산해야 하므로 모수에 대한 추정이 고려되어야 한다.
  • 본 논문에서는 평균응답확률 추정량과 R-indicator 추정량을 위해 H´ajeck 추정량의 형태를 적용하는 것을 연구한다.
  • 본 연구에서는 연도별 종단면 가중치를 사용하여 R-indicator 값을 계산함으로써 표본의 대표성을 살펴본다. 우선 각 개체별 응답확률 추정값은 로지스틱회귀모형을 적용하고자 응답확률에 영향을 미치는 보조변수들을 선별하는 작업을 실시한다.
  • 본 연구에서는 응답확률의 추정과 표본설계에서의 추출에 의한 추정으로 나누어서 새로운 추정방법을 연구한다. 여러 가지 응답확률 추정방법과 포함확률에 기반을 둔 새로운 R-indicator의 추정기법을 연구하고 다양한 모의실험 하에 R-indicator의 대표성으로써의 설명력과 제안된 추정량의 편향과 효율을 기존의 추정량과 비교분석한다.
  • 여기에서의 추정은 표본설계에 의한 추정과 응답확률의 추정으로 두가지 방향으로 전개 되었는데 응답 확률의 추정문제는 표본조사 분야에서는 무응답 가중치 보정 및 대체에서 많이 연구되어져 왔으며 본 연구에서는 표본의 대표성 척도분야에 그 확률의 추정문제를 확장하여 적용하고자 하였다.
  • 장애인고용패널조사는 급변하는 장애인의 경제활동상태와 관련된 동태적 기초통계를 생산하고, 예를 들어 장애인의 노동시장 참여에 대한 기초자료로 취업자수,실업자수, 비경제활동 인구수 등을 추계하고, 경제활동상태에 영향을 주는 개인적, 환경적 요인을 규명하여 장애인 고용정책 수립 및 평가에 유용한 자료를 제공하는 것을 목적으로 한다. 1차년도인 2008년도 조사에서는 장애인복지법에서 규정하고 있는 15개 유형의 장애를 지니고 있는 등록장애인 5,092명을 대상으로 진행되었고 연도별 패널조사가 계속해서 진행되고 있다.
  • 좋은 추정량이란 기본적으로 불편을 만족하고 효율이 좋은 것을 선호하는 데 본 연구에서는 근사적인 불편을 만족하고 기존의 추정량보다 효율의 증대를 가져올 수 있는 추정량을 제시하고자 한다. 본 논문에서는 평균응답확률 추정량과 R-indicator 추정량을 위해 H´ajeck 추정량의 형태를 적용하는 것을 연구한다.

가설 설정

  • 그러나 이것은 각 개체별 응답확률들을 비교해야 하기 때문에 실제적으로 사용하는 데 제약사항이 있으므로 이것보다 약한 개념을 가지는 대표성 이론을 정의할 수 있다. 그래서 L개의 범주를 가지는 보조변수를 고려하며 그 보조변수는 표본에서 모두 응답함을 가정한다. 각 범주별 모집단의 크기는 Nh (h = 1, .
  • 그리고 위에서 제시된 R-indicator 추정량의 통계적 성질을 다루고자 다음과 같은 조건을 가정한다.
  • 이며 이것은 비추정의 형태를 가지고 있으며 추정된 응답확률이 응답확률과 거의 비슷하다는 가정을 한다면 근사적인 불편성을 만족함을 알 수 있다. 평균응답확률을 추정하기 위해 모집단의 크기 N이 적용되는 곳에 #을 사용한 것은 R-indicator추정량에도 적용하여 다음과 같은 형태를 제시한다.
  • 을 가정하여 10,000개의 자료를 생성한다. 즉 N = 10,000개의 자료를 유한모집단으로 가정한다. 또한 각 모집단의 자료별로 응답확률을 안다는 가정하에 (α0, α1)의 회귀계수를 가지는 로지스틱회귀모형을 통하여 그 확률을 생성한다.
  • 이와같이 정의된 응답확률 개념을 바탕으로 표본자료의 대표성(representativity)은 두 가지 관점으로 정의할 수 있다. 첫째, 표본에 관한 strongly representative에 관한 개념이다. 이것은 모집단의 모든 개체에 대해 응답확률들이 모두 같고, 모든 응답들이 독립인 경우를 말하며 그것을 수식으로 표현하면
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
응답률을 파악함으로써 표본 대표성과 무응답으로 인한 편향을 살피는 것의 한계는? 기존 연구에서는 대개 응답률을 파악함으로써 표본 대표성과 무응답으로 인한 편향을 살펴보고자 하였지만, 응답률을 높이는 것만으로 추정량의 편향을 줄일 수 없다 (Groves, 2006). 이와 같이 응답률이라는 단순한 척도가 표본의 대표성을 완벽하게 설명하는 것이라 할 수 없기 때문에 그것의 대안으로 응답확률을 이용한 산포, 절대편향의 상한값, 제곱근 MSE의 상한값, 부차그룹 응답률의 변동계수 등과 같은 다양한 척도(indicator)들이 연구되어 왔다.
표본의 대표성을 높이기 위해 선행되어야 하는 것은? 모집단에 대한 표본의 대표성은 포함확률이 없는 조사단위의 비율을 줄여서 편향이 없는 추정량을 제시하는 것을 말한다 (Kim, 2005). 실제조사에서 표본의 대표성을 높이기 위해서는 추출틀의 포괄범위율(coverage rate)을 높이는 노력과 함께 완벽한 응답이 이루어져야 하는 데 조사과정에서는 무응답이 발생하게 된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. Ekholm, A. and Laaksonen, S. (1991). Weighting via response modeling in the Finnish household budget survey, Journal of Official Statistics, 7, 325-337. 

  2. Groves, R. M. (2006). Nonresponse rates and nonresponse bias in household surveys, Public Opinion Quarterly, 70, 646-675. 

  3. Horvitz, D. G. and Thompson, D. J. (1952). A generalization of sampling without replacement from a finite universe, Journal of the American Statistical Association, 47, 663-685. 

  4. Iannacchione, V. G. (2003). Sequential weight adjustment for location and cooperation propensity for the 1995 national survey of family growth, Journal of Official Statistics, 19, 31-43. 

  5. Kang, S. and Bang, T. K. (2011). Constructing panel data using repeated cross-sectional survey data: A case of farm household survey and its analysis, Survey Research, 12, 89-112. 

  6. Kim, J. K. (2008). The Sampling Survey, Free Academy, Gyeonggido. 

  7. Kim, J. K. and Park, H. (2006). Imputation using response probability, The Canadian Journal of Statistics, 34, 171-182. 

  8. Kim, K. S. (2005). Representative of sample and efficiency of estimation, Survey Research, 6, 39-62. 

  9. Robins, J. M., Rotnitzky, A. and Zhao, L. P. (1994). Estimation of regression coefficients when some regressors are not always observed, Journal of the American Statistical Association, 89, 846-866. 

  10. Rosenbaum, P. R. (1987). Model-based direct adjustment, Journal of the American Statistical Association, 82, 387-394. 

  11. Schouten, B., Bethlehem, J., Beullens, K., Kleven, O., Loosveldt, G., Luiten, A., Rutar, K., Natalie, S. and Skinner, C. (2012). Evaluating, comparing, monitoring and improving representativeness of survey response through R-indicators and partial R-indicators, International Statistical Review, 80, 382-399. 

  12. Schouten, B., Cobben, F. and Bethlehem, J. (2009). Indicators for the representativeness of survey response, Survey Methodology, 35, 101-113. 

  13. Schouten, B., Shlomo, N. and Skinner, C. (2011). Indicators for monitoring and improving representativeness of response, Journal of Official Statistics, 27, 1-24. 

  14. Shlomo, N., Skinner, C. J. and Schouten, B. (2012). Estimation of an indicator of the representativeness of survey response, Journal of Statistical Planning and Inference, 142, 201-211. 

  15. Son, C. K., Kim, H., Gang, H. and Oh, H. (2014). An evaluation analysis of nonresponse effect for the panel survey, Proceeding of the Korean Association for Survey Research in Fall, 2014, 39-53. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로