$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

데이터 구조에 강건한 K 관리도의 관리 모수 결정
Robust determination of control parameters in K chart with respect to data structures 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.26 no.6, 2015년, pp.1353 - 1366  

박잉근 (단국대학교 응용통계학과) ,  이성임 (단국대학교 응용통계학과)

초록
AI-Helper 아이콘AI-Helper

공정의 안정성을 평가하기 위해 사용되는 Shewhart 관리도 기법은 최근 다양한 분야에서 널리 응용되고 있지만, 품질 특성치에 대한 엄격한 확률분포를 가정한다. 하지만 현업에서 수집되고 있는 데이터의 확률분포는 알려진 경우가 많지 않으며, 다변량 데이터로 확장될수록 확률분포를 결정하는데 더 큰 어려움이 따른다. 이러한 문제점을 해결하기 위해 다양한 비모수 관리도 기법이 연구되었는데, 최근 연구되고 있는 비모수 관리도 기법 중 하나인 RBF (Radial Basis Function) 커널 기반의 SVDD (Support Vector Data Description) 관리도는 관리상태 하의 데이터 영역에 대한 경계를 결정함으로써 공정의 이상상태를 탐지하는 기법으로 K 관리도로 불리우며, 다양한 분야에서 적용되고 있다. 그런데 K 관리도를 적용하기 위해서는 관리도의 성능을 결정짓는 커널모수 등의 선택이 중요하며, 관리도를 작성하기 전에 미리 결정되어야 한다. 이를 위해 기존의 연구들은 격자 탐색법 등을 활용하여 모수를 결정하고 있지만, 선택 가능한 범위에 대한 반복적인 계산으로 최적값을 선택하고 있어 계산 비용이 커지고 또 시간 등의 문제로 실제 문제에 적용하기 어려운 점이 있다. 따라서 본 연구에서는 데이터의 구조에 따라 모의실험을 통해 선택 가능한 영역에서의 효율성을 비교 검토하고, 이를 바탕으로 쉽게 적용할 수 있는 새로운 모수 선택 방법을 제안하고자 한다. 이를 통해 데이터 구조에 대해 강건함을 보이는 모수의 선택과 K 관리도의 구성을 논의하고 실제 자료에 적용해 보았다.

Abstract AI-Helper 아이콘AI-Helper

These days Shewhart control chart for evaluating stability of the process is widely used in various field. But it must follow strict assumption of distribution. In real-life problems, this assumption is often violated when many quality characteristics follow non-normal distribution. Moreover, it is ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • f의 범위는 데이터의 과거 추세 및 공정 담당자의 경험에 의거하여 조정이 가능하다. 관리모수 s에 대한 범위는 식 (2.3)을 이용하여, 이들 관리모수의 가능한 조합으로부터 다양한 구조를 갖는 다변량 데이터에 대한 모의실험을 통해 K 관리도의 성능이 어떻게 변화하는지를 알아보고자 한다. 이를 통해 데이터 영역의 구조에 따른 관리모수의 조합에는 어떤 차이가 있는지 살펴보고, 현업에서 쉽게 적용할 수 있는 관리모수를 제안하고자 한다.
  • 4)의 커널모수 s에도 크게 의존하게 된다. 따라서 본 논문에서는 C와 s를 K 관리도의 관리모수라고 부르고, 이들의 선택 방법에 대해 알아보기로 한다. K 관리도를 실제 문제에 적용할 때 이들 모수의 선택에 따라 데이터 영역의 크기가 작아지거나 커지게 되므로, K 관리도 작성 시 이들 모수의 선택은 매우 중요한 문제가 된다.
  • Sun과 Tsung (2003), Wang 등 (2009), Theissler와 Dear (2013)은 최적의 관리모수를 선택하기 위해 격자 탐색법(grid search method) 등을 활용하고 있는데, 이 방법은 관리모수에 대한 범위 선정, 계산 비용, 그리고 시간의 문제가 발생한다. 따라서 본 연구에서는 관리모수의 설정이 데이터 구조에 따라 어떤 영향이 있는지 모의실험을 통해 살펴보고, 다양한 데이터 구조의 영역에 대해 강건한 성능을 보이는 관리모수는 어떻게 결정될 수 있는지 알아보고자 한다.
  • 하지만, K 관리도를 구성하기 위해서는 관리모수 C와 s의 선택이 중요하며, 관리도를 작성하기 전에 미리 결정되어야 한다. 따라서, 본 장에서는 K관리도의 관리모수에 대한 기존의 연구 결과를 살펴보고, 간편하게 적용할 수 있는 새로운 관리모수 선택 방법을 제안해 보도록 하겠다.
  • 본 장에서는 다양한 구조를 갖는 관리상태 하의 2차원 데이터를 생성하여 K 관리도의 성능을 평가해보고, 적절한 관리모수의 선택에 대해 논의해 보도록 하겠다.
  • 실제 자료 분석에서는 2008년 1월부터 2009년 12월에 걸쳐 소셜 미디어 중 하나인 블로그에서 수집된 부정적인 감성어 (Moon과 Lee, 2013)들을 대상으로 블로거들의 정서 변화를 탐지하고자 한다. 사회에 악 영향을 미칠 수 있는 부정적인 감성어들을 대상으로 3장의 모의실험을 통해 도출된 관리모수 선택법을 적용하여 강건한 K 관리도를 구축하고, 사회의 전반적인 분위기를 모니터링하고자 한다.
  • 3)을 이용하여, 이들 관리모수의 가능한 조합으로부터 다양한 구조를 갖는 다변량 데이터에 대한 모의실험을 통해 K 관리도의 성능이 어떻게 변화하는지를 알아보고자 한다. 이를 통해 데이터 영역의 구조에 따른 관리모수의 조합에는 어떤 차이가 있는지 살펴보고, 현업에서 쉽게 적용할 수 있는 관리모수를 제안하고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
다변량 관리도 기법는 어떤 가정을 가지고 있는가? 통계적 공정관리를 위해 널리 사용되고 있는 다변량 관리도 기법은 품질 특성치, 즉 데이터가 정규분포를 따른다는 엄격한 분포 가정을 가지고 있다 (Montgomery, 2009; Cho와 Park, 2013; Jung과 Lee, 2015). 하지만 Cook과 Chiu (1998)와 Polansky (2001) 등에서 언급한대로 현실 공정에서 수집되고 있는 데이터의 실제 분포는 알려져 있지 않으며, 다변량 데이터의 분포를 결정하는 것은 더욱 더 어려운 문제이다.
SVDD 관리도는 무엇인가? 하지만 현업에서 수집되고 있는 데이터의 확률분포는 알려진 경우가 많지 않으며, 다변량 데이터로 확장될수록 확률분포를 결정하는데 더 큰 어려움이 따른다. 이러한 문제점을 해결하기 위해 다양한 비모수 관리도 기법이 연구되었는데, 최근 연구되고 있는 비모수 관리도 기법 중 하나인 RBF (Radial Basis Function) 커널 기반의 SVDD (Support Vector Data Description) 관리도는 관리상태 하의 데이터 영역에 대한 경계를 결정함으로써 공정의 이상상태를 탐지하는 기법으로 K 관리도로 불리우며, 다양한 분야에서 적용되고 있다. 그런데 K 관리도를 적용하기 위해서는 관리도의 성능을 결정짓는 커널모수 등의 선택이 중요하며, 관리도를 작성하기 전에 미리 결정되어야 한다.
K 관리도에서 데이터 영역에 대한 경계를 구성하기 위해 어떤 커널 함수를 이용하는가? K 관리도는 초구 구조가 아닌 다양한 구조의 데이터 영역에 대한 경계를 구성하기 위해 커널 함수를 이용한다. 커널 함수로는 Linear 커널, Sigmoid 커널, Polynomial 커널, RBF 커널 등 다양한 함수들이 제안되어 사용되고 있으며, K 관리도에서는 식 (1.4)의 RBF 커널이 사용되었다.
질의응답 정보가 도움이 되었나요?

참고문헌 (34)

  1. Bakir, S. (2006). Distribution-free quality control charts based on signed-rank-like statistics. Communications in Statistics: Theory and Methods, 35, 743-757. 

  2. Brereton, R. G. (2011). One-class classifiers. Journal of Chemometrics, 25, 225-246. 

  3. Camci, F., Chinnam, R. B. and Ellis, R. D. (2008). Robust kernel distance multivariate control chart using support vector principles. International Journal of Production Research, 46, 5075-5095. 

  4. Chakraborti, S., Van der Laan, P. and Bakir, S. T. (2001). Nonparametric control charts: An overview and some results. Journal of Quality Technology, 3, 304-315. 

  5. Cho, G. and Park, J. (2013). Parameter estimation in a readjustment procedure in the multivariate integrated process control. Journal of the Korean Data & Information Science Society, 24, 1275-1283. 

  6. Cook, D. F. and Chiu, C. C. (1998). Using radial basis function neural networks to recognize shifts in correlated manufacturing process parameters. IIE Transactions, 30, 227-234. 

  7. Cristianini, N. and Shawe-Taylor, J. (2000). An introduction to Support Vector Machines: and other kernel-based learning methods, Cambridge University Press, New York. 

  8. Gani, W, and Limam, M. (2013). On the use of the K-chart for phase II monitoring of simple linear profiles. Journal of Quality and Reliability Engineering, 2013, 8. 

  9. Gani, W., Taleb, H. and Limam, M. (2010). Support vector regression based residual control charts. Journal of Applied Statistics, 37, 309-324. 

  10. Ge, Z., Gao, F. and Song, Z. (2011). Batch process monitoring based on support vector data description method. Journal of Process Control, 21, 949-959. 

  11. Huang, J. and Ling, C. X. (2005). Using auc and accuracy in evaluating learning algorithms. IEEE Transactions on Knowledge and Data Engineering, 17, 299-310. 

  12. Jung, K. Y. and Lee, J. (2015). Multivariate process control procedure using a decision tree learning technique. Journal of the Korean Data & Information Science Society, 26, 639-652. 

  13. Kim, S. B., Jitpitaklert, W. and Sukchotrat, T. (2010). One-class classification-based control charts for monitoring autocorrelated multivariate processes. Communications in Statistics: Simulation and Computation, 39, 461-474. 

  14. Kim, S. B., Sukchotrat, T. and Park, S. -K. (2011). A nonparametric fault isolation approach through one-class classification algorithms. IIE Transactions, 43, 505-517. 

  15. Kim, S. H., Alexopoulos, C., Tsui, K. L. and Wilson, J. R. (2007). A distribution-free tabular CUSUM chart for autocorrelated data. IIE Transactions, 39, 317-330. 

  16. Kittiwachana, S., Ferreira, D. L. S., Lloyd, G. R., Fido, L. A., Thompson, D. R., Escott, R. E. A. and Brereton, R. G. (2010). One class classifiers for process monitoring illustrated by the application to online HPLC of a continuous process. Journal of Chemometrics, 24, 96-110. 

  17. Kubat, M. and Matwin, S. (1997). Addressing the curse of imbalanced data sets: One-sided sampling. Proceedings of the Fourteenth International Conference on Machine Learning, 179-186. 

  18. Kumar, S., Choudhary, A. K., Kumar, M., Shankar, R. and Tiwari, M. K. (2006). Kernel distance-based robust support vector methods and its application in developing a robust K-chart. International Journal of Production Research, 44, 77-96. 

  19. Liu, X., Lee, K., McAfee, M. and Irwin, G. W. (2011). Improved nonlinear PCA for process monitoring using support vector data description. Journal of Process Control, 21, 1306-1317. 

  20. Montgomery, D. C. (2009). Introduction to Statistical Quality Control, 6th ed, Wiley, USA. 

  21. Moon, J. and Lee, S. (2013). Detection of the change in blogger sentiment using multivariate control charts. The Korean Journal of Applied Statistics, 26, 903-913. 

  22. Polansky, A. M. (2001). A smooth nonparametric approach to multivariate process capability. Technometrics, 43, 199-211. 

  23. Schilling, E. G. and Nelson, P. R. (1976). The effect of non-normality on the control limits of X charts. Journal of Quality Technology, 8, 183-188. 

  24. Schlkopf, B. (2000). Statistical learning and kernel methods. Proceedings of the Interdisciplinary College 2000, Gunne, Germany, March. 

  25. Sukchotrat, T., Kim, S. B. and Tsung, F. (2010). One-class classification-based control charts for multivariate process monitoring. IIE Transactions, 42, 107-120. 

  26. Sun, R. and Tsung, F. (2003). A kernel-distance-based multivariate control chart using support vector methods. International Journal of Production Research, 41, 2975-2989. 

  27. Tax, D. M. J. (2001). One Class Classification, Delft Technical University, Delft. 

  28. Tax, D. M. J., Ypma, A. and Duin, R. P. W. (1999a). Pump failure detection using support vectordata description. Proceedings of the Third International Symposium on Advances in Intelligent Data Analysis, Amsterdam, Netherlands, 415-425. 

  29. Tax, D. M. J., Ypma, A. and Duin, R. P. W. (1999b). Support vector data description applied to machine vibration analysis. Proceedings of the Fifth Annual Conference of the Advanced School for Computing and Imaging, Heijen, Netherlands, 398-405. 

  30. Tax, D. M. J. and Duin, R. P. W. (1999c). Data domain description using support vectors. Proceedings of the European Symposium on Artificial Neural Networks, Bruges, Belgium, 251-256. 

  31. Tax, D. M. J. and Duin, R. P. W. (2004). Support vector data description. Machine Learning, 54, 45-66. 

  32. Theissler, A. and Dear, I. (2013). Autonomously determining the parameters for SVDD with RBF kernel from a one-class training set. International Journal of Computer, Information, Systems and Control Engineering, 7, 390-398. 

  33. Vapnik, V. (1998). Statistical Learning Theory, Wiley, New York, 1998. 

  34. Wang, C. K., Ting, Y., Liu, Y. H. and Hariyanto, G. (2009). A novel approach to generate artificial outliers for support vector data description. IEEE International Symposium on Industrial Electronics, Seoul Olympic Parktel, Seoul, Korea, July 5-8. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로