[논문]한계와 이상치가 있는 결측치의 로버스트 다중대체 방법

박유성; 오도영; 권태연

doi:10.5351/kjas.2019.32.6.889

한계와 이상치가 있는 결측치의 로버스트 다중대체 방법
Robust multiple imputation method for missings with boundary and outliers 원문보기

응용통계연구 = The Korean journal of applied statistics, v.32 no.6, 2019년, pp.889 - 898

박유성 (고려대학교 통계학과) , 오도영 (고려대학교 통계학과) , 권태연 (한국외국어대학교 국제금융학과)

초록
AI-Helper

항목 무응답(item missing)이 발생한 설문조사에서 결측이 포함된 변수에 이상치(outlier)의 존재와 다른 설문문항 항목과의 논리적 한계(boundary) 조건들이 유의미하다면 결측치 대체문제는 매우 복잡해진다. 한계가 있는 결측값들을 포함한 변수에 이상치가 존재하는 경우, 기존의 회귀분석에 근거한 결측치 대체방법은 편향된 대체값 그리고 한계를 만족하지 않은 대체값을 제시할 가능성이 있다. 이에 본 논문은 회귀모형에 기반을 두고 결측치들을 대체를 함에 있어 이상치와 논리적 한계조건이 자료에 존재하는 경우, 다양한 로버스트 회귀모형과 다중대체 방법의 조합을 통해 해결점을 모색하고자 한다. 이를 위해 이들 방법들의 최적의 조합을 다양한 시나리오별로 모의실험을 통하여 찾아보고 이에 대하여 논의하였다.

Abstract ▼ AI-Helper

The problem of missing value imputation for variables in surveys that include item missing becomes complicated if outliers and logical boundary conditions between other survey items cannot be ignored. If there are outliers and boundaries in a variable including missing values, imputed values based on previous regression-based imputation methods are likely to be biased and not meet boundary conditions. In this paper, we approach these difficulties in imputation by combining various robust regression models and multiple imputation methods. Through a simulation study on various scenarios of outliers and boundaries, we find and discuss the optimal combination of robust regression and multiple imputation method.

주제어

표/그림 (4)

그림 Figure 4.1. Two outlier scenarios.
표 Table 4.1. Simulation results: Root mean squared error (RMSE) when missing mechanism is MAR
표 Table 4.2. Simulation results: Coverage rate (CR) of 95% conﬁdence interval when missing mechanism is MAR
표 Table 4.3. Simulation results: Average width of 95% conﬁdence interval (AWCI) when missing mechanism is MAR

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

결측메커니즘이 MCAR인 경우의 결과는 관측된 개체들만을 가지고 추정한 결과(OBS)가 MAR에서 문제가 됨을 보이기 위함으로 공간의 제약 때문에 본문에는 제시하지 않았다. 결측 메커니즘이 MCAR이 아닌 MAR이기 때문에 관측치들 만으로 평균을 추정하면(OBS) 추정의 정확성이 좋지 않음을 확인할 수 있다.
본 논문에서는 PMM, LRD, 그리고 BIM-PRD 방법들을 OLS 대신 앞서 제시된 로버스트 회귀모형 추정방법과 결합하여 새로운 결측치 대체방법으로 제안하고 이들의 최적의 조합을 찾고자 한다. 이를 위해 다양한 시나리오별로 생성된 자료에 대하여 모의실험을 실시하였다.
본 논문은 설문조사 자료에서 위와 같은 실질적 문제들이 발생하였을 때 이를 해결하기 위한 방법에 대하여 논의하고자 한다. 항목 무응답이 발생한 경우, 회귀모형에 기반을 두고 이들 결측치들을 대체를 함에 있어 이상치와 논리적 한계조건들이 자료에 존재하는 경우 다양한 로버스트 회귀모형과 베이지안 다중대체 방법의 조합을 통해 해결점을 모색하고자 한다.
본 논문은 회귀모형에 기반을 두고 결측치들을 대체를 함에 있어 이상치와 논리적 한계조건이 자료에 모두 존재하는 경우, 다양한 로버스트 회귀모형과 다중대체 방법의 최적의 조합을 다양한 시나리오별로 모의실험을 통하여 찾아보고 이에 대하여 논의하였다.
에서 MM, LTS, 그리고 DPM에 의한 회귀계수 추정법에 대해 간략하게 논의하고자 한다.
본 논문은 설문조사 자료에서 위와 같은 실질적 문제들이 발생하였을 때 이를 해결하기 위한 방법에 대하여 논의하고자 한다. 항목 무응답이 발생한 경우, 회귀모형에 기반을 두고 이들 결측치들을 대체를 함에 있어 이상치와 논리적 한계조건들이 자료에 존재하는 경우 다양한 로버스트 회귀모형과 베이지안 다중대체 방법의 조합을 통해 해결점을 모색하고자 한다.

제안 방법

회귀모형 추정방법은 OLS, MM, LTS, 그리고 DPM-추정법을 그리고 결측치 대체방법으로는 PMM, LRD, 그리고 BIM-PRD 방법을 사용하여 이들 결합 중 어느 조합이 가장 우수한 결측치 대체 방법인지 다양한 자료의 시나리오별로 살펴보고자 한다. MM-추정량과 LTS-추정량은 각각 R에 내장되어 있는 robustbase 패키지의 lmrob, ltsReg함수를 사용하였다, DPM의 조정상수 c = 2.5로 설정하였다. MM-추정량과 DPM-추정량이 사용하는 M-추정량의 조정상수는 모두 동일하게 c = 4.
Yiobs들 중 δij의 절대값의 크기가 작은 순서대로 정해진 크기의 도너집합을 구성한 후 이들 중 임의로 한 값을 추출하여 추출된 Yiobs로 Yjmis를 대체한다.
각 회귀모형에 기반을 둔 결측치 대체 방법에 대한 비교를 위하여 결측치 대체 이후 목적변수인 Y 의 평균 추정치에 근거하여 Y¯가 모수 µy를 추정하는데 있어 그 정확도(accuracy)와 효율성(efficiency)을 비교하였다.
결측치는 주 모형에서만 발생시켰으며 결측비율은 30%로 하였으며 생성된 자료에 다음의 두 가지 형태의 결측 메커니즘에 따라 결측치를 생성하였다. 첫 번째는 j번째 Y 변수의 결측 확률이 자료에 전혀 의존하지 않는 완전임의 결측(missing completely at random; MCAR)이며 두 번째 j번째 Y 변수의 결측 확률이 X_j의 값에 의존하는 임의결측(missing at random; MAR)이다.
두 번째로 결측치를 포함한 변수의 한계(boundary)가 있는 무응답 문제를 해결하기 위하여 기존의 회귀모형에 근거한 베이지안 다중대체 방법에 기각/채택 절차를 추가하는 방법을 먼저 적용하였다. 이를 위해 고려된 방법으로는 Little (1988)의 proportioned mean matching method (PMM) 그리고 Schenker과 Taylor (1996)의 local residual draw method (LRD)이다.
만약 Cj − Yˆjmis > 0이라면 r˜i ∈ R+들 중에서, 만약 Cj − Yˆjmis < 0이라면 r˜i ∈ R−들 중에서, |(Cj −Yˆjobs) − (Ci − Yˆiobs)|의 크기가 작은 순서대로 정해진 크기의 도너집합을 구성한 후 이들 중 임의로 한 값을 추출하여 추출된 r˜i∗를 이용하여 다음과 같이 Yjmis를 다음의 Yj∗mis로 대체한다.
548을 적용하였을 때 MM-추정량은 S-추정량과 마찬가지로 50%의 높은 붕괴점을 갖는다 (Stromberg, 1993). 본 논문에서는 R의 robustbase 라이브러리의 lmrob 함수를 이용하여 적합하였다 (Salibian-Barrera와 Yohai, 2006; Maronna와 Yohai, 2000).
3에 제시하였다. 이때 비교를 위하여 결측치들을 대체하지 않고 관측된 개체들만을 가지고 추정한 결과(OBS) 역시 제시하였다.
이렇게 계산된 M개의 Yˆi에 근거하여 Yjmis(j = n0 + 1, . . . , n)에 대한 M번의 대체값을 찾는 베이지안 다중대체방법 중 본 논문에서는 PMM, LRD, 그리고 BIM-PRD 방법을 고려하였다.
본 논문에서는 PMM, LRD, 그리고 BIM-PRD 방법들을 OLS 대신 앞서 제시된 로버스트 회귀모형 추정방법과 결합하여 새로운 결측치 대체방법으로 제안하고 이들의 최적의 조합을 찾고자 한다. 이를 위해 다양한 시나리오별로 생성된 자료에 대하여 모의실험을 실시하였다. 그 결과 로버스트 회귀모형의 추정 방법보다는 다중대체방법의 선택에 의해 성능차이가 크게 나타남을 확인하였고 DPM과 PMM 방법을 결합한 방법이 모든 시나리오에서 큰 차이 없이 가장 안정적인 성능을 나타내는 방법이지만 한계변수가 목적변수와 높은 상관관계를 가지고 있다면 PMM 대신 BIM-PRD 방법을 어떠한 로버스트 회귀모형 추정방법과 결합하여도 추정의 성능을 크게 향상시킬 수 있음을 확인하였다.
1에 두 가지 결측 시나리오에 따른 임의의 자료의 산점도를 제시하였다. 이상치의 비율(outlier rate; OR)은 10%, 25%, 그리고 40%의 경우에 대해 살펴보았다.
회귀모형 추정방법은 OLS, MM, LTS, 그리고 DPM-추정법을 그리고 결측치 대체방법으로는 PMM, LRD, 그리고 BIM-PRD 방법을 사용하여 이들 결합 중 어느 조합이 가장 우수한 결측치 대체 방법인지 다양한 자료의 시나리오별로 살펴보고자 한다. MM-추정량과 LTS-추정량은 각각 R에 내장되어 있는 robustbase 패키지의 lmrob, ltsReg함수를 사용하였다, DPM의 조정상수 c = 2.

대상 데이터

본 논문은 총 5장으로 구성되어 있다. 2장에서는 MM, LTS, 그리고 DPM 로버스트 회귀추정량들을 소개하고 3장에서는 PMM, LRD, 그리고 BIM-PRD 결측치 대체 방법들을 소개하였다.

데이터처리

1. Simulation results: Root mean squared error (RMSE) when missing mechanism is MAR
OS = outlier scenario; OR = outlier rate; OBS = estimates with observed cases. In the case of other estimates, the applied robust regression estimation method (OLS, MM, LTS, or DPM) is shown at the beginning and the missing imputation method (LRD, PMM, or BIM) is shown at the end.
이를 위해 평균제곱오차(root mean squared error; RMSE)와 95% 신뢰구간의 평균길이(average width of 95% confidence interval; AWCI)과 포함확률(coverage rate; CR)을 산출하여 Tables 4.1–4.3에 제시하였다.

이론/모형

먼저 이상치가 존재하는 경우 최소제곱법을 사용하는 일반적인 회귀모형(ordinary least square; OLS)에서 발생하는 추정된 모수의 편향을 해결하기 위한 방법으로 다양한 로버스트 회귀 추정량을 고려하였다. 본 논문에서는 높은 붕괴점을 갖는 MM-추정법 (Yohai, 1987), least trimmed square(LTS)-추정법 (Rousseeuw, 1984) 그리고 Park 등 (2012)의 data partition technique and Mestimation (DPM)-추정법을 기존의 OLS 대신 적용하였다.
이상치에 강건하지만 계산상의 문제로 일부 표본을 재표집(resampling)하는 FAST-LTS 알고리즘 (Rousseeuw와 Van Driessen, 2000)을 사용한다. 본 논문에서는 R-robustbase에서 제공하는 FAST-LRT알고리즘 함수 ltsReg 함수를 사용하여 적합하였다.
예를 들어 OLS를 적합함에 있어서는 하나의 관측치만을 무한대로 보내도 회귀계수가 발산하기 때문에 OLS의 붕괴점이 0%이다. 본 논문에서는 높은 붕괴점을 갖는 MM 추정법 (Yohai, 1987), LTS 추정법 (Rousseeuw, 1984), 그리고 Park 등 (2012)의 DPM-추정법을 고려하였다. 이에 본 장에서는 다음의 회귀모형
먼저 이상치가 존재하는 경우 최소제곱법을 사용하는 일반적인 회귀모형(ordinary least square; OLS)에서 발생하는 추정된 모수의 편향을 해결하기 위한 방법으로 다양한 로버스트 회귀 추정량을 고려하였다. 본 논문에서는 높은 붕괴점을 갖는 MM-추정법 (Yohai, 1987), least trimmed square(LTS)-추정법 (Rousseeuw, 1984) 그리고 Park 등 (2012)의 data partition technique and Mestimation (DPM)-추정법을 기존의 OLS 대신 적용하였다.
, n)에 대한 M번의 대체값을 찾는 베이지안 다중대체방법 중 본 논문에서는 PMM, LRD, 그리고 BIM-PRD 방법을 고려하였다. 위 세 방법은 각기 다른 방법으로 각 결측개에 대해 그와 유사성이 높다고 판단되는 도너집합(possible donor set)을 구성하고, 도너집합으로부터 M번 표집하여 결측치를 대체하는 핫덱 대체방법(hot-deck imputation)이 결합된 다중대체 방법으로 보다 일반적인 베이지안 다중 대체법에 대한 논의는 Rubin (1987)을 참조할 수 있다.
두 번째로 결측치를 포함한 변수의 한계(boundary)가 있는 무응답 문제를 해결하기 위하여 기존의 회귀모형에 근거한 베이지안 다중대체 방법에 기각/채택 절차를 추가하는 방법을 먼저 적용하였다. 이를 위해 고려된 방법으로는 Little (1988)의 proportioned mean matching method (PMM) 그리고 Schenker과 Taylor (1996)의 local residual draw method (LRD)이다. Kwon과 Park (2015)은 한계가 있는 결측변수에 대하여 이러한 추가적인 절차 없이도 한계조건의 만족을 보장하는 새로운 다중대체방법인 boundary information matching proportioned residual draw method (BIM-PRD)을 제안하였다.
만약 q = n/2 + 1이라면 붕괴점은 50%가 되며, q = [n/2] + [(p +1)/2]에서 최대 붕괴점[(n − p)/2]/n + 1/n을 갖는다 (Rousseeuw, 1984). 이상치에 강건하지만 계산상의 문제로 일부 표본을 재표집(resampling)하는 FAST-LTS 알고리즘 (Rousseeuw와 Van Driessen, 2000)을 사용한다. 본 논문에서는 R-robustbase에서 제공하는 FAST-LRT알고리즘 함수 ltsReg 함수를 사용하여 적합하였다.

성능/효과

가장 안정적인 성능을 나타내는 대체방법은 PMM 방법이다. PMM 방법과 결합되어 사용된 추정 결과들이 가장 낮은 RMSE를 보이지는 않으나 모든 경우 가장 안정적이고 크지 않은 RMSE를 보인다. 모든경우 OLS-PMM과 MM-PMM, LTS-PMM, DPM-PMM간에 큰 성능차이가 나타나지 않음을 확인할 수 있었다.
3. Simulation results: Average width of 95% confidence interval (AWCI) when missing mechanism is MAR
OS = outlier scenario; OR = outlier rate; OBS = estimates with observed cases. In the case of other estimates, the applied robust regression estimation method (OLS, MM, LTS, or DPM) is shown at the beginning and the missing imputation method (LRD, PMM, or BIM) is shown at the end.
2. Simulation results: Coverage rate (CR) of 95% confidence interval when missing mechanism is MAR
OS = outlier scenario; OR = outlier rate; OBS = estimates with observed cases. In the case of other estimates, the applied robust regression estimation method (OLS, MM, LTS, or DPM) is shown at the beginning and the missing imputation method (LRD, PMM, or BIM) is shown at the end.
결측메커니즘이 MCAR인 경우의 결과는 관측된 개체들만을 가지고 추정한 결과(OBS)가 MAR에서 문제가 됨을 보이기 위함으로 공간의 제약 때문에 본문에는 제시하지 않았다. 결측 메커니즘이 MCAR이 아닌 MAR이기 때문에 관측치들 만으로 평균을 추정하면(OBS) 추정의 정확성이 좋지 않음을 확인할 수 있다. 이 경우 가장 넒은 95% 신뢰구간의 평균길이를 보임에도 불구하고 신뢰구간의 모수포함 확률이 40%에 미치지 못하는 경우도 발생함을 볼 수 있다.
결측치를 포함하는 목적변수인 Y 변수와 그들의 한계변수인 C와의 상관계수가 높은 경우(즉 두변수간 상관관계가 0.9인 경우), 결측치 대체과정에서 한계변수를 고려하는 BIM-PRD 방법이 전반적으로 우수함을 확인할 수 있었다. 특히 로버스트 회귀모형의 추정방법 증 성능이 가장 우수한 DPM 방법과 함께 사용된 BIM-PRD 방법이 가장 작은 RMSE를 나타냈다.
이를 위해 다양한 시나리오별로 생성된 자료에 대하여 모의실험을 실시하였다. 그 결과 로버스트 회귀모형의 추정 방법보다는 다중대체방법의 선택에 의해 성능차이가 크게 나타남을 확인하였고 DPM과 PMM 방법을 결합한 방법이 모든 시나리오에서 큰 차이 없이 가장 안정적인 성능을 나타내는 방법이지만 한계변수가 목적변수와 높은 상관관계를 가지고 있다면 PMM 대신 BIM-PRD 방법을 어떠한 로버스트 회귀모형 추정방법과 결합하여도 추정의 성능을 크게 향상시킬 수 있음을 확인하였다.
또한 DPM 방법과 함께 사용하였을 때 결측치 대체 방법들 간에 (LRD, PMM, 그리고 BIM-PRD) 그리고 이상치 비율 및 이상치 위치 시나리오에 따른 RMSE 차이가 크게 변화 없이 그 성능이 유지됨을 확인할 수 있었다. 그러나 Y 변수와 한계변수 C간의 상관관계가 낮은 경우(두 변수 간 상관관계가 0.6인 경우) 그리고 높은 이상치 비율(25%와 40%)문제가 함께 존재하는 경우에는 BIM-PRD 방법은 PMM과 LRD 방법에 비하여 그 정확도가 현저히 떨어짐을 확인 할 수 있었다.
둘째, 로버스트 방법의 선택에 비하여 대체방법의 선택에 따른 추정결과의 성능차이가 두드러진다. 가장 안정적인 성능을 나타내는 대체방법은 PMM 방법이다.
특히 로버스트 회귀모형의 추정방법 증 성능이 가장 우수한 DPM 방법과 함께 사용된 BIM-PRD 방법이 가장 작은 RMSE를 나타냈다. 또한 DPM 방법과 함께 사용하였을 때 결측치 대체 방법들 간에 (LRD, PMM, 그리고 BIM-PRD) 그리고 이상치 비율 및 이상치 위치 시나리오에 따른 RMSE 차이가 크게 변화 없이 그 성능이 유지됨을 확인할 수 있었다. 그러나 Y 변수와 한계변수 C간의 상관관계가 낮은 경우(두 변수 간 상관관계가 0.
마지막으로 DPM과 PMM 방법을 결합한 방법이 모든 시나리오에서 큰 차이 없이 가장 안정적인 성능을 나타내는 방법이지만 한계변수가 목적변수와 높은 상관관계를 가지고 있다면 PMM대신 BIM-PRD 방법을 어떠한 로버스트 회귀모형 추정방법과 결합하여도 추정의 성능을 크게 향상시킬 수 있다.
PMM 방법과 결합되어 사용된 추정 결과들이 가장 낮은 RMSE를 보이지는 않으나 모든 경우 가장 안정적이고 크지 않은 RMSE를 보인다. 모든경우 OLS-PMM과 MM-PMM, LTS-PMM, DPM-PMM간에 큰 성능차이가 나타나지 않음을 확인할 수 있었다.
로버스트 회귀모형의 추정방법에 따른 성능은 MM-LTS-DPM 순으로 나타나며 이는 붕괴점이 우수한 순서와 동일하다. 전체 자료에서 이상치들이 차지하는 비율이 10% 그리고 25%까지는 세 가지 로버스트 회귀모형의 추정방법간의 성능차이가 거의 없었다. 그러나 이상치의 비율이 40%에 다다르게 되면 MM 방법은 큰 문제를 나타냈다.
모의실험 결과에 따라 이상치와 한계가 있는 변수의 회귀모형에 근거한 대체를 함에 있어 다음과 같은 결론을 내릴 수 있다. 첫째, 이상치의 비율이 큰 경우 로버스트 방법의 선택이 중요하다. 그리고 한계치가 목적변수와 상관관계가 아주 높은 경우에만 결측치 대체를 위한 BIM-PRD이 성능이 좋으며 그렇지 않은 경우는 주의하여 사용하여야 한다.
9인 경우), 결측치 대체과정에서 한계변수를 고려하는 BIM-PRD 방법이 전반적으로 우수함을 확인할 수 있었다. 특히 로버스트 회귀모형의 추정방법 증 성능이 가장 우수한 DPM 방법과 함께 사용된 BIM-PRD 방법이 가장 작은 RMSE를 나타냈다. 또한 DPM 방법과 함께 사용하였을 때 결측치 대체 방법들 간에 (LRD, PMM, 그리고 BIM-PRD) 그리고 이상치 비율 및 이상치 위치 시나리오에 따른 RMSE 차이가 크게 변화 없이 그 성능이 유지됨을 확인할 수 있었다.

후속연구

패널조사의 경우 조사 내의 논리적 한계관계 뿐 아니라 조사 간의 논리적 한계관계 까지 더해져 문제는 더욱 복잡해 질 수 있다. 본 논문에 제시된 결측치의 로버스트 회귀 대체방법을 적용한다면 흡연자의 연령을 넘을 수 없는 흡연기간의 결측치 (Raghunathan, 등, 2001), 가구의 소득을 넘을 수 없는 개인의 소득의 결측치 (Schenker 등, 2006) 그리고 증가 혹은 유지되어야만 하는 청소년 성장(키)에 관한 패널 조사에서의 결측치 (Geraci와 McLain, 2018)에 대한 대체를 보다 정확하고 효과적으로 실행할 수 있을 것으로 기대하며 이를 후속 연구로 진행할 예정이다.

질의응답

핵심어	질문	논문에서 추출한 답변
	이상치(outlier)가 존재하는 경우는 어떤 문제가 발생하는가?	설문조사에서 발생한 항목 무응답(item missing)에 대한 대체(imputation)를 위하여 결측치를 포함한 변수에 대하여 충분한 설명력을 갖는 독립변수들이 존재한다면 회귀모형을 이용할 수 있다. 그러나 자료에 이상치(outlier)가 존재하는 경우 일반적인 회귀모형은 붕괴점(breakdown point)이 0%이기 때문에 회귀계수의 추정에 있어 편향(bias)의 문제가 발생하고 (Park 등, 2012) 이러한 편향된 회귀계수의 추정치는 대체값의 편향으로 이어질 수 있다.
	회귀모형에 근거한 베이지안 다중대체 방법에 기각/채택 절차를 추가하는 방법을 적용하는데 있어 고려된 방법은?	두 번째로 결측치를 포함한 변수의 한계(boundary)가 있는 무응답 문제를 해결하기 위하여 기존의 회귀모형에 근거한 베이지안 다중대체 방법에 기각/채택 절차를 추가하는 방법을 먼저 적용하였다. 이를 위해 고려된 방법으로는 Little (1988)의 proportioned mean matching method (PMM) 그리고 Schenker과 Taylor (1996)의 local residual draw method (LRD)이다. Kwon과 Park (2015)은 한계가 있는 결측변수에 대하여 이러한 추가적인 절차 없이도 한계조건의 만족을 보장하는 새로운 다중대체방법인 boundary information matching proportioned residual draw method (BIM-PRD)을 제안하였다.
	이상치가 존재하는 경우의 문제점을 위해 어떤 것을 고려하였는가?	먼저 이상치가 존재하는 경우 최소제곱법을 사용하는 일반적인 회귀모형(ordinary least square; OLS)에서 발생하는 추정된 모수의 편향을 해결하기 위한 방법으로 다양한 로버스트 회귀 추정량을 고려하였다. 본 논문에서는 높은 붕괴점을 갖는 MM-추정법 (Yohai, 1987), least trimmed square(LTS)-추정법 (Rousseeuw, 1984) 그리고 Park 등 (2012)의 data partition technique and Mestimation (DPM)-추정법을 기존의 OLS 대신 적용하였다.

참고문헌 (16)

Geraci, M. and McLain, A. (2018). Multiple imputation for bounded variables, Psychometrika, 83, 919-940.

상세보기
Huber, P. J. (1973). Robust regression: asymptotics, conjectures and Monte Carlo, The Annals of Statistics, 1, 799-821.

상세보기
Kwon, T. Y. and Park, Y. (2015). A new multiple imputation method for bounded missing values, Statistics & Probability Letters, 107, 204-209.

상세보기
Little, R. J. (1988). Missing-data adjustments in large surveys, Journal of Business & Economic Statistics, 6, 287-296.

상세보기
Maronna, R. A. and Yohai, V. J. (2000). Robust regression with both continuous and categorical predictors, Journal of Statistical Planning and Inference, 89, 197-214.

상세보기
Park, Y., Kim, D., and Kim, S. (2012). Robust regression using data partitioning and M-estimation, Communications in Statistics-Simulation and Computation, 41, 1282-1300.

상세보기
Raghunathan, T. E., Lepkowski, J. M., Van Hoewyk, J., and Solenberger, P. (2001). A multivariate technique for multiply imputing missing values using a sequence of regression models, Survey Methodology, 27, 85-96.

상세보기
Rousseeuw, P. and Yohai, V. (1984). Robust regression by means of S-estimators. In Robust and Nonlinear Time Series Analysis (pp. 256-272), Springer, New York.
Rousseeuw, P. J. (1984). Least median of squares regression, Journal of the American Statistical Association, 79, 871-880.

상세보기
Rousseeuw, P. J. and Van Driessen, K. (2000). An algorithm for positive-breakdown regression based on concentration steps. In Data Analysis (pp. 335-346), Springer, Berlin, Heidelberg.
Rubin, D. B. (1987). Multiple Imputation for Nonresponse in Surveys (Vol. 81), John Wiley & Sons.
Salibian-Barrera, M. and Yohai, V. J. (2006). A fast algorithm for S-regression estimates, Journal of computational and Graphical Statistics, 15, 414-427.

상세보기
Schenker, N., Raghunathan, T. E., Chiu, P. L., Makuc, D. M., Zhang, G., and Cohen, A. J. (2006). Multiple imputation of missing income data in the National Health Interview Survey, Journal of the American Statistical Association, 101, 924-933.

상세보기
Schenker, N. and Taylor, J. M. (1996). Partially parametric techniques for multiple imputation, Computational Statistics & Data Analysis, 22, 425-446.

상세보기
Stromberg, A. J. (1993). Computation of high breakdown nonlinear regression parameters, Journal of the American Statistical Association, 88, 237-244.

상세보기
Yohai, V. J. (1987). High breakdown-point and high efficiency robust estimates for regression, The Annals of Statistics, 15, 642-656.

상세보기

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증