$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

혼합물 실험에서 특이값의 영향을 평가하기 위한 그래픽 탐색적 자료분석 도구로서의 불꽃그림
Firework Plot as a Graphical Exploratory Data Analysis Tool to Evaluate the Impact of Outliers in a Mixture Experiment 원문보기

응용통계연구 = The Korean journal of applied statistics, v.27 no.4, 2014년, pp.629 - 643  

장대흥 (부경대학교 통계학과) ,  안소진 (부경대학교 통계학과) ,  김영일 (중앙대학교 경영학부)

초록
AI-Helper 아이콘AI-Helper

회귀모형을 이용하여 자료를 분석하는 경우 이상점이나 영향점과 같은 특이값들의 유무를 검정하는 회귀진단기법은 모형의 적합성을 체크하기 위한 필수적인 도구로 잡은 지 오래이다. 이러한 점들이 존재 하는 경우 회귀분석의 결과가 왜곡되어 해석이 된다. Jang과 Anderson-Cook (2013)은 불꽃그림이란 이름을 붙인 그림도구를 발표하였는데 관측값에 부여된 가중치를 1에서 0으로 변화함에 따라 이상점이나 영향점이 회귀계수 및 잔차제곱합(SSE)에 어떠한 영향을 미치는지 3차원 그림에 추적곡선을 그려 보았을 뿐 아니라 쌍으로 대비시켜 봄으로써 분석의 시각적인 효과를 증대시켰다. 본 연구에서는 더 나아가 이러한 시도가 기존 방법과 어떤 차이점이 있는지 2013년에는 반영치 않은 통계량을 포함해서 더 많은 해석이 가능한지 혼합물 실험 계획을 통해 다양한 통계량의 민감도 분석을 실행하였다. 왜냐하면 작은 혼합물실험인 자료인 경우 더욱 세밀한 통계량에 대한 민감도 분석이 필요하기 때문이다.

Abstract AI-Helper 아이콘AI-Helper

It is common to check the validity of an assumed model with the heavy use of diagnostics tools when conducting data analysis with regression techniques; however, outliers and influential data points often distort the regression output in undesired manner. Jang and Anderson-Cook (2013) proposed a gra...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 기존 문헌에 추가하여 Jang과 Anderson-Cook (2013)은 이상점들이 자료 분석에 있어 어떻게 기술적인 요약정보들에 영향을 주는지 불꽃그림(firework plot)이라는 그림을 이용하여 알아보았다. 그리고 회귀 모형을 이용한 자료 분석인 경우에도 개개의 자료값이 회귀모형의 계수추정에 어떠한 영향을 주는지 보았다. 이러한 방법은 개개의 관측값이 존재 하는 경우와 그렇지 않은 경우를 비교하여 통계량을 구하기보다는 개개의 관측값에 부여된 가중치를 연속적으로 변하게 하고 그 과정을 추적하여 봄으로써 기존의 방법과는 차별적인 방법을 제시하였다.
  • 이러한 불꽃그림은 탐색적인 연구의 목적에 따라 3차원 적으로도 만들어 질 수 있어, 보다 시각적인 효과를 뚜렷이 할 수 있다. 따라서 본 연구의 목적은 사용자로 하여금 전반적인 자료의 회귀분석계수 및 가중 잔차제곱합에 대한 영향력을 점검하는 탐색적인 목적이 있다. 2.
  • 본 연구에서는 회귀분석에서 이상점이나 영향점을 진단하기 위한 도구로서 도시적이고 종합적인 분석이 가능한 그림 몇 가지를 제안하였다. 불꽃그림을 통하여 자칫 개별적인 결과에만 치우칠 수 있는 통계량들을 서로 연계하여 볼 수 있고 또한 가중치가 1에서 0으로 관측값이 완전제거 될 때까지 그 추적 동선을 판단할 수 있는 종합적인 정보를 제공한다.
  • 본 연구에서는 2013년의 연구에서 언급되지 않은 Cook의 거리통계량을 추가하여 이상점들과 영향점 분석을 위한 기존 통계량과 이들 그림과의 관계를 명확히 하였다. 이를 위해 본 연구에서는 혼합물 실험계획 예제를 들어 실험계획에서의 세밀한 분석의 중요성을 언급하고자 한다.

가설 설정

  • 혼합물 실험계획에서의 반응변수의 측정값은 혼합물에 쓰인 구성성분(component)들의 상대적인 비율에 의존한다고 가정한다. 따라서 혼합물 실험에서 구성성분들의 개수가 q일 때, 혼합물의 i번째 구성성분의 비율을 xi라면
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
Jang과 Anderson-Cook (2013)과 유사한 접근방법의 기존 논문은? Jang과 Anderson-Cook (2013)과 유사한 접근방법은 기존 연구 문헌에 없었던 것은 아니다. Cook과 Weisberg (1989)의 논문이나 Park 등 (1992)의 논문을 들 수 있는데, 특히 Cook과 Weisberg (1989)는 모형비교를 통해 관심있는 설명변수의 가중치의 변화가 잔차분석에 어떻게 영향을 주는지 동적인 그림의 형태로 소프트웨어를 구축한 바 있다. 불꽃그림은 연구에서는 이와 유사하나 가중치 변화에 따른 추적되는 선을 모든 점들에 대해 그림으로써 분석자로 하여금 종합적인 견해를 가지게 하였다.
혼합물 실험계획에서의 반응변수의 측정값은 무엇에 의존한다고 가정하는가? 혼합물 실험계획에서의 반응변수의 측정값은 혼합물에 쓰인 구성성분(component)들의 상대적인 비율에 의존한다고 가정한다. 따라서 혼합물 실험에서 구성성분들의 개수가 q일 때, 혼합물의 i번째 구성성분의 비율을 xi라면
이상점(특이값, 특이점이라고도 함) 및 영향점은 자료 분석에 어떤 영향을 주는가? 이상점(특이값, 특이점이라고도 함) 및 영향점(영향력이 큰 관측값이라고도 함)은 자료분석을 하는데 사용되는 계량적이고 기술적인 많은 측도들(measures)을 왜곡한다. 관련된 많은 참고문헌 중에서 Beckman과 Cook (1983)의 논문은 이상점에 관한 전반적인 정보를 담고 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (11)

  1. Beckman, R. J. and Cook, R. D. (1983). Outlier ... s, Technometrics, 25, 119-147. 

  2. Belsley, D. A., Kuh, E. and Welch, R. E. (1980). Regression Diagnostics: Identifying In uential Data and Source of Collinearity, Wiley, New York. 

  3. Cook, R. D. (1977). Detection of influential observation in linear regression, Technometrics, 19, 15-18. 

  4. Cook, R. D. (1979). Influential observation in linear regression, Journal of American Statistical Association, 74, 169-174. 

  5. Cook, R. D. and Weisberg, S. (1989). Regression diagnostics with dynamic graphics, Technometrics, 31, 277-291. 

  6. Emerson, J. D. and Strenio, J. (1983). The spread-versus-level plot in Hoaglin, D. C., Mosteller, F. and Tukey, J. W.(Eds.) (1983). Understanding Robust and Exploratory Data Analysis, Wiley, New York. 

  7. Fox, J. (2008). Applied Regression Analysis and Generalized Linear Models, 2nd ed., Sage, New York. 

  8. Jang, D. H. and Anderson-Cook, C. M. (2013). Firework plot as a graphical exploratory data analysis tool for evaluating the impact of outliers in data exploration and regression, Quality and Reliability Engineering International, in press. 

  9. McLean, R. A. and Anderson, V. L. (1966). Extreme vertices design of mixture experiments, Technometrics, 8, 447-454. 

  10. Myers, R. H., Montgomery, D. C. and Anderson-Cook, C. M. (2009). Response Surface Methodology: Process and Product Optimization Using Designed Experiments, 3rd ed., Wiley, New York. 

  11. Park, S. H., Kim, Y. H. and Toutenberg, H. (1992). Regression diagnostics for removing an observation with animating graphics, Statistical Papers, 33, 227-240. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로