최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국해양환경공학회지 = Journal of the Korean society for marine environmental engineering, v.15 no.2, 2012년, pp.156 - 162
조홍연 (한국해양연구원 해양환경보전연구부) , 오지희 (한국해양연구원 해양환경보전연구부)
Outlier detection and treatment process is highly required as the first step for the statistical analysis of the monitoring data having many outliers frequently occurred in the coastal environmental monitoring projects. In this study, the outlier detection method using the approximate and detail (or...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
원(原) 자료(raw data) 분석을 선호하는 전문가가 자료 분석을 위한 전처리과정을 불가피하게 거쳐야 하는 이유는 무엇인가? | 기본적으로 원(原) 자료(raw data) 분석을 선호하는 전문가는 연속적인 환경 모니터링 자료로부터 정보를 추출하고자 하기 때문에 자료 분석을 위한 전처리과정을 불가피하게 거쳐야 한다. 특히, 대부분의 연속 환경모니터링 자료에서 빈번하게 관찰되는 이상자료를 감지하고 처리하는 과정이 필수적으로 요구된다. | |
이상 자료의 가장 기본적인 정의는 무엇인가? | 한편 언어를 이용한 정의와 더불어 이상 자료에 대한 통계적인 기준도 구체적으로 제시되고 있다. 가장 기본적인 정의는 정규분포 또는 기준이 되는 어떤 분포를 가정하고, 평균(m)과 표준편차(SD) 의 함수로 정의되는 영역을 벗어나는 자료로 정의한다. 예를 들면, Hair 등[2010]은 표본의 개수가 80개 정도 또는 그 이하에 해당하는 소표본의 경우와 그 이상에 해당하는 대표본의 경우를 구분하여 다음과 같이 이상자료를 정의하고 있다. | |
Dixon 방법은 어떤 방법인가? | 기본적으로 이상자료의 판단기준은평균을 중심으로 일정 한계범위를 벗어나는 자료를 이상자료로 간주하는 개념에 기초하고 있다. Grubbs 방법은 Extreme Studentized Deviate(# = 각각 자료 xi의 평균 및 표준편차) 수치를 한계수치와 비교하여 판단하는 방법이며, Dixon 방법은 자료를 정렬하여 전체 구간에 대한 부분비율 수치를 계산하여 판단하는 방법이다. 수정 표본점수방법은 z-score 계산(#)과정에서 표준편차 대신에 MAD(median absolute deviation about the median, #) 수치로 계산한 z-score (z = 0. |
국립수산과학원, 2012, 실시간 어장정보시스템. http://portal.nfrdi.re.kr/risa/.
Agresti, A. and Franklin, C., 2007, Statistics, The Art and Science of Learning from Data, Pearson Education, Inc. pp.693.
Barnett, V. and Lewis, T., 1994, Outliers in Statistical Data, Third Edition, John Wiley & Sons, Ltd., Chichester, UK, pp.584.
Cho, H.Y., Suzuki, K. and Nakamura, Y., 2010, Hysteresis loop model for the estimation of the coastal water temperatures, -by using the buoy monitoring data in Mikawa Bay, Japan-, Report of the Port and Airport Research Institute, 49(2), pp.123-153.
Dixon, W.J., 1950, Analysis of Extreme Values, The Annals of Mathematical Statistics, 21(4), pp.488-506.
Garcia, F.A.A., 2010, Tests to identify outliers in data series, http://www.se.mathworks.com/matlabcentral/fileexchange/28501, MATLAB Central File Exchange. Retrieved January 19th, 2012.
Grubbs, F.E., 1950, Sample Criteria for Testing Outlying Observations, The Annals of Mathematical Statistics, 21(1), pp.27-58.
Hair, J.F. Jr., Black, W.C., Babin, B.J. and Anderson, R.E., 2010, Multivariate Data Analysis, A Global Perspective, Seventh Edition, Chapter 2, Pearson Education, Inc., New Jersey, USA, pp.800.
Martinez, W.L. and Martinez, A.R., 2005, Exploratory Data Analysis with MATLAB, Computer Science and Data Analysis Series, Chapman & Hall/CRC. pp.405.
Rousseeuw, P.J. and Leroy, A.M., 2003, Robust Regression and Outlier Detection, John Wiley & Sons. pp.329.
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.