최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기응용통계연구 = The Korean journal of applied statistics, v.32 no.6, 2019년, pp.889 - 898
박유성 (고려대학교 통계학과) , 오도영 (고려대학교 통계학과) , 권태연 (한국외국어대학교 국제금융학과)
The problem of missing value imputation for variables in surveys that include item missing becomes complicated if outliers and logical boundary conditions between other survey items cannot be ignored. If there are outliers and boundaries in a variable including missing values, imputed values based o...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
이상치(outlier)가 존재하는 경우는 어떤 문제가 발생하는가? | 설문조사에서 발생한 항목 무응답(item missing)에 대한 대체(imputation)를 위하여 결측치를 포함한 변수에 대하여 충분한 설명력을 갖는 독립변수들이 존재한다면 회귀모형을 이용할 수 있다. 그러나 자료에 이상치(outlier)가 존재하는 경우 일반적인 회귀모형은 붕괴점(breakdown point)이 0%이기 때문에 회귀계수의 추정에 있어 편향(bias)의 문제가 발생하고 (Park 등, 2012) 이러한 편향된 회귀계수의 추정치는 대체값의 편향으로 이어질 수 있다. | |
회귀모형에 근거한 베이지안 다중대체 방법에 기각/채택 절차를 추가하는 방법을 적용하는데 있어 고려된 방법은? | 두 번째로 결측치를 포함한 변수의 한계(boundary)가 있는 무응답 문제를 해결하기 위하여 기존의 회귀모형에 근거한 베이지안 다중대체 방법에 기각/채택 절차를 추가하는 방법을 먼저 적용하였다. 이를 위해 고려된 방법으로는 Little (1988)의 proportioned mean matching method (PMM) 그리고 Schenker과 Taylor (1996)의 local residual draw method (LRD)이다. Kwon과 Park (2015)은 한계가 있는 결측변수에 대하여 이러한 추가적인 절차 없이도 한계조건의 만족을 보장하는 새로운 다중대체방법인 boundary information matching proportioned residual draw method (BIM-PRD)을 제안하였다. | |
이상치가 존재하는 경우의 문제점을 위해 어떤 것을 고려하였는가? | 먼저 이상치가 존재하는 경우 최소제곱법을 사용하는 일반적인 회귀모형(ordinary least square; OLS)에서 발생하는 추정된 모수의 편향을 해결하기 위한 방법으로 다양한 로버스트 회귀 추정량을 고려하였다. 본 논문에서는 높은 붕괴점을 갖는 MM-추정법 (Yohai, 1987), least trimmed square(LTS)-추정법 (Rousseeuw, 1984) 그리고 Park 등 (2012)의 data partition technique and Mestimation (DPM)-추정법을 기존의 OLS 대신 적용하였다. |
Geraci, M. and McLain, A. (2018). Multiple imputation for bounded variables, Psychometrika, 83, 919-940.
Huber, P. J. (1973). Robust regression: asymptotics, conjectures and Monte Carlo, The Annals of Statistics, 1, 799-821.
Kwon, T. Y. and Park, Y. (2015). A new multiple imputation method for bounded missing values, Statistics & Probability Letters, 107, 204-209.
Little, R. J. (1988). Missing-data adjustments in large surveys, Journal of Business & Economic Statistics, 6, 287-296.
Maronna, R. A. and Yohai, V. J. (2000). Robust regression with both continuous and categorical predictors, Journal of Statistical Planning and Inference, 89, 197-214.
Park, Y., Kim, D., and Kim, S. (2012). Robust regression using data partitioning and M-estimation, Communications in Statistics-Simulation and Computation, 41, 1282-1300.
Raghunathan, T. E., Lepkowski, J. M., Van Hoewyk, J., and Solenberger, P. (2001). A multivariate technique for multiply imputing missing values using a sequence of regression models, Survey Methodology, 27, 85-96.
Rousseeuw, P. and Yohai, V. (1984). Robust regression by means of S-estimators. In Robust and Nonlinear Time Series Analysis (pp. 256-272), Springer, New York.
Rousseeuw, P. J. (1984). Least median of squares regression, Journal of the American Statistical Association, 79, 871-880.
Rousseeuw, P. J. and Van Driessen, K. (2000). An algorithm for positive-breakdown regression based on concentration steps. In Data Analysis (pp. 335-346), Springer, Berlin, Heidelberg.
Rubin, D. B. (1987). Multiple Imputation for Nonresponse in Surveys (Vol. 81), John Wiley & Sons.
Salibian-Barrera, M. and Yohai, V. J. (2006). A fast algorithm for S-regression estimates, Journal of computational and Graphical Statistics, 15, 414-427.
Schenker, N., Raghunathan, T. E., Chiu, P. L., Makuc, D. M., Zhang, G., and Cohen, A. J. (2006). Multiple imputation of missing income data in the National Health Interview Survey, Journal of the American Statistical Association, 101, 924-933.
Schenker, N. and Taylor, J. M. (1996). Partially parametric techniques for multiple imputation, Computational Statistics & Data Analysis, 22, 425-446.
Stromberg, A. J. (1993). Computation of high breakdown nonlinear regression parameters, Journal of the American Statistical Association, 88, 237-244.
Yohai, V. J. (1987). High breakdown-point and high efficiency robust estimates for regression, The Annals of Statistics, 15, 642-656.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.