$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

대량 데이터를 위한 제한거절 기반의 회귀부스팅 기법
Boosted Regression Method based on Rejection Limits for Large-Scale Data 원문보기

대한산업공학회지 = Journal of the Korean Institute of Industrial Engineers, v.42 no.4, 2016년, pp.263 - 269  

권혁호 (한양대학교 융합기계공학과) ,  김승욱 (한양대학교 융합기계공학과) ,  최동훈 (한양대학교 기계공학과) ,  이기천 (한양대학교 산업공학과)

Abstract AI-Helper 아이콘AI-Helper

The purpose of this study is to challenge a computational regression-type problem, that is handling large-size data, in which conventional metamodeling techniques often fail in a practical sense. To solve such problems, regression-type boosting, one of ensemble model techniques, together with bootst...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • R2의 경우 회귀모델 나무(regression tree) 개념을 도입한 기법이었으며 AdaBoost.R의 적용 범위를 넓히기 위해 고안되었다. 하지만 수렴성이 보장되지 않는 문제가 존재하였다(Drucker, 1997).
  • 즉, 부트스트래핑 기반의 랜덤복원추출 방법으로 다양한 근사모델을 생성한 후, 정확도에 따라 단계적으로 가중치를 달리하여 조합하는 부스팅을 통해 방대한 데이터를 효과적으로 다룰 수 있다. 따라서 본 연구에서는 부스팅 기법의 대표적인 알고리즘인 AdaBoost의 개념을 이용하여 회귀모델 제작에 적합한 새로운 알고리즘을 제안하고자한다.
  • 대량 데이터를 모두 이용하여 일반 근사모델을 만드는 경우 수치적인 한계로 인해 근사모델이 부정확해진다. 따라서 본 연구에서는 이러한 일반 근사모델이 갖는 대량 데이터 처리 한계점을 극복하고자 하였다. 랜덤 복원 추출 방법을 통해 대량 데이터에서 일부 데이터를 이용하여 제한거절 방법 기반으로 근사모델을 생성하고, 이와 같은 과정을 반복하여 다양한 근사모델을 생성한 후 이들을 정확도에 따라 가중치를 달리하여 조합함으로써 효과적으로 대량 데이터를 다룰 수 있는 AdaBoost.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
부스팅은 어떤 방법인가? 이러한 문제점을 해결하고자 산업공학 분야에서 사용하는 앙상블 기법의 하나인 부스팅을 이용하고자 한다. 부스팅은 다양한 근사모델을 생성하고, 이들을 정확도에 따라 서로 다른 가중치로 조합하는 방법이다. 부스팅을 대량 데이터에 적용하는 경우에 랜덤복원추출 방법을 이용하여 방대한 데이터에서 일부 데이터를 선택한 후, 이를 이용하여 근사모델을 생성한다.
근사모델의 역할은? 이처럼 설계과정의 효율성을 극대화하기 위해 산업 분야에서 사용하는 방법 중 하나가 근사모델이다. 근사모델은 해석이나 실험을 통해 얻은 실제 응답 값을 기반으로 설계 공간 내에서 아직 해석이나 실험이 수행되지 않은 위치에서의 응답값을 예측해주는 역할을 한다. 각 산업 현장에서 갖고 있는 방대한 양의 데이터를 이용하여 근사모델을 제작한다면 정확성이 높은 근사모델을 얻을 수 있다(Chen et al.
일반 근사모델이 방대한 데이터를 효과적으로 다루는 데에 한계가 있는 이유는? 하지만 일반 근사모델의 경우 방대한 데이터들을 효과적으로 다루기에는 한계가 있다. 데이터가 많아질수록 근사모델제작에 필요한 변수 행렬이 커져 역행렬 계산이 어려워지기 때문이다. 따라서 방대한 데이터를 이용하여 한 번에 근사모델을 만드는 경우, 정확성이 부정확해진다.
질의응답 정보가 도움이 되었나요?

참고문헌 (13)

  1. Drucker, H. (1997), Improving regressors using boosting techniques, Proceedings of the 14th International Conference of Machine Learning. 

  2. Freund, Y. and Schapire, R. E. (1997), A decision-theoretic generalization of on-line learning and an application to boosting, Journal of computer and system sciences, 55(1), 119-139. 

  3. Gao, F., Kou, P., Gao, L., and Guan, X. (2013), Boosting regression methods based on a geometric conversion approach : using SVMs base learners, Neurocomputing, 113(3), 67-87. 

  4. Jin, R., Chen, W., and Simpson, T. W. (2001), Comparative Studies of Metamodeling Techniques under Multiple Modeling Criteria, Structural and Multidisciplinary Optimization, 23(1), 1-13. 

  5. Kodiyalam, S., Yang, R. J., and Gu, L. (2004), High-Performance Computing and Surrogate Modeling for Rapid Visualization with Multidisciplinary Optimization, AIAA Journal, 42(11), 2347-2354. 

  6. Madsen, K. and Zilinskas, J. (2000), Testing branch-and-bound methods for global optimization, IMM technical report, Technical University of Denmark. 

  7. Sasena, M. J. (2002), Flexibility and Efficiency Enhancement for Constrained Global Design Optimization with Kriging Approximations, PhD thesis, University of Michigan. 

  8. Park, C. I., Kim, Y. D., Kim, J. S., Song, J. W., and Choi, H. S. (2011), Data Mining with R, Kyowoosa. 

  9. Powell, M. J. D. (1987), Radial Basis Functions for Multivariable Interpolation : A review, Oxford University Press, 143-167. 

  10. Shrestha, D. L. and Solomatine, D. P. (2006), Experiments with Ada Boost.RT : an improved boosting scheme for regression, Neural computation, 18(7), 1678-1710. 

  11. Simpson, T. W., Toropov, V., Balabanov, V., and Viana, F. A. C. (2008), Design and Analysis of Computer Experiments in Multidisciplinary Design Optimization : A Review of How Far We Have Come-or Not, 12th AIAA/ISSMO Multidisciplinary and Optimization Conference. 

  12. Solomatine, D. P. and Shrestha, D. L. (2004), AdaBoost.RT : a boosting algorithm for regression problems, Proceedings of the International Joint Conference on Neural Networks. 

  13. Wang, G. G. and Shan, S. (2007), Review of Metamodeling Techniques in Support of Engineering Design Optimization, Journal of Mechanical Design, 129(4), 370-380. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로