$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

사례기반추론의 유사 임계치 및 커버리지 최적화
Optimizing Similarity Threshold and Coverage of CBR 원문보기

정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.2 no.8, 2013년, pp.535 - 542  

안현철 (국민대학교 경영정보학부)

초록
AI-Helper 아이콘AI-Helper

사례기반추론(CBR)은 많은 장점으로 인해 지금까지 의료진단, 생산계획, 고객분류 등 다양한 분야의 의사결정 지원에 적용되어 왔다. 그러나, 효과적인 CBR 시스템을 설계, 구축하기 위해서는 연구자가 직관적으로 설정해야 할 많은 설계요소들이 존재한다. 본 연구에서는 이러한 CBR의 여러 설계요소들 중 사례 검색 단계에서 결합할 이웃 사례들을 보다 효과적으로 선정할 수 있는 새로운 모형을 제시한다. 기존 연구에서는 결합할 이웃 사례를 선정하는 방법으로 사전에 정해진 이웃사례의 수(k-NN의 k)를 적용하든가, 혹은 최대 유사도의 상대적 비율을 임계치로 사용하는 방식을 적용해 왔다. 하지만, 본 연구에서는 결합할 유사사례를 선택하는 새로운 기준으로 0에서 1사이의 값을 갖는 절대적 유사 임계치를 사용할 것을 제안한다. 이 경우, 임계치 값이 과도하게 작아지게 되면, 예측결과의 생성이 잘 이루어지지 않을 수 있는 문제가 발생할 수 있다. 이에, 전체 학습사례들 중에서 예측결과가 생성된 사례의 비중을 커버리지(coverage)로 정의하고, 이를 유사 임계치 최적화 시 제약조건으로 설정함으로서, 사용자가 원하는 수준의 커버리지는 유지한 상태에서 가장 효과적인 유사 사례를 찾아 추론할 수 있도록 모형을 설계하였다. 제안 모형의 유용성을 검증하기 위해, 본 연구에서는 이 모형을 실존하는 국내 한 온라인 쇼핑몰의 표적 마케팅 사례에 적용하였다. 그 결과, 제안 모형이 CBR의 예측 성과를 유의미하게 개선시킬 수 있음을 확인할 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

Since case-based reasoning(CBR) has many advantages, it has been used for supporting decision making in various areas including medical checkup, production planning, customer classification, and so on. However, there are several factors to be set by heuristics when designing effective CBR systems. A...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이에 기존 문헌을 검토하게 될 본 절에서는 우선 CBR의 기본적인 개념과 원리에 대해 먼저 살펴보고, 이어 CBR과 GA를 결합하고자 시도한 다른 기존 연구들을 살펴보도록 한다. 그리고 끝으로, CBR 시스템에서 결합할 유사사례의 개수나 구성을 최적화 하고자 시도했던 기존 연구들을 살펴보고, 그 한계점을 살펴보고자 한다.
  • 만약 이러한 매개변수 값들이 적절하게 설정되지 않은 경우, SVM은 과적합화(overfitting)나 혹은 불충분적합(underfitting) 될 수 있기 때문이다. 때문에, 본 연구에서는 상기 매개변수들의 값을 다양하게 바꾸어가면서 실험하여, 가장 우수한 성과를 보이는 매개변수 값들을 최종적으로 선택하고자 하였다. SVM 실험을 위한 실험도구로는 공개 소프트웨어인 LIBSVM version 2.
  • 본 논문에서는 이른바 '절대적 유사 임계치'와 '커버리지' 개념을 도입하여, 사용자가 요구하는 정확도 수준에 따라 예측결과를 생성하는 새로운 개념의 CBR 시스템을 제안하였다.
  • 상기 두 변수의 동시 최적화 방법으로는, 전통적으로 많이 적용되어 온 유전자 알고리즘(GA, Genetic Algorithms)을 적용하였다. 본 연구는 이 모형의 우수성을 검증하기 위해, 국내 한 온라인 쇼핑몰의 특정 상품에 대한 표적 마케팅 대상 고객 발굴을 위한 데이터에 제안 모형을 적용해 보고, 과연 CBR 성과의 개선을 도모하는지 실증분석하였다.
  • 1씩 설정하였으며, 은닉층과 출력층의 노드들은 시그모이드 전이함수(sigmoid transfer function)를 사용하게끔 설계하였다. 은닉층의 노드수와 관련해서는 7, 14, 21, 28등 4가지 경우를 모두 대입해 보고 실험해 보았으며, 그 중에서 가장 우수한 결과를 보이는 은닉층의 노드수를 설정하고자 하였다. 아울러, 학습중지조건으로는 총 150차례 전체 학습데이터에 대한 학습을 반복하게끔 설정하였다.
  • 본 연구에서 제안하는 모형은 기본적으로 CBR과 GA가 결합된 형태로 구성되어 있다. 이에 기존 문헌을 검토하게 될 본 절에서는 우선 CBR의 기본적인 개념과 원리에 대해 먼저 살펴보고, 이어 CBR과 GA를 결합하고자 시도한 다른 기존 연구들을 살펴보도록 한다. 그리고 끝으로, CBR 시스템에서 결합할 유사사례의 개수나 구성을 최적화 하고자 시도했던 기존 연구들을 살펴보고, 그 한계점을 살펴보고자 한다.
  • 이에 본 연구에서는 '다이어트 보조식 제품에 대한 표적 마케팅'에 적절한 대상 고객을 산출할 수 있도록, 본 연구의 제안모형을 적용해 보고자 하였다.
  • 이에 본 연구에서는 0에서 1사이의 값을 갖는 절대적 유사 임계치(similarity threshold)에 기반한 새로운 CBR 모형을 제안하고자 한다. 그런데, 절대적 유사 임계치는 값이 너무 작게 설정되면, 예측결과의 생성이 과도하게 이루어지지 않을 수 있다.
  • 그런데, 절대적 유사 임계치는 값이 너무 작게 설정되면, 예측결과의 생성이 과도하게 이루어지지 않을 수 있다. 이에, 본 연구에서는 커버리지(coverage) 변수도 모형에 함께 반영함으로서, 사용자가 원하는 수준의 커버리지는 유지한 상태에서 가장 최적의 절대적 유사 임계치를 탐색하도록 하였다. 상기 두 변수의 동시 최적화 방법으로는, 전통적으로 많이 적용되어 온 유전자 알고리즘(GA, Genetic Algorithms)을 적용하였다.
  • 제안모형이 앞서 제안한 비교모형들에 비해 얼마나 우수한 예측결과를 생성하는지에 대한 확인은 검증용 데이터에 대한 구매 예측 정확도를 비교해 보는 방식을 통해 수행하고자 한다. 이 때, 예측 정확도(Hit)는 다음의 식 (7)을 통해 산출된다.
  • 즉, 절대적 유사 임계치를 기준으로 적용할 때, 유사한 사례가 하나도 나오지 않으면, 그 경우에는 예측결과를 생성하지 않고 '모름(don't know)'으로 결과를 회신할 수 있는 CBR 시스템을 제안하고자 하는 것이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
전세계 유수의 기업들이 고객의 프로필 및 구매 행태를 분석해 고객 분류 모형을 구축하는데 많은 노력을 기울이고 있는 이유는? 분석 고객관계관리(Analytic CRM)에 있어 중요한 이슈 중 하나는 기업에서 팔고자 하는 상품을 구매할 가능성이 높은 잠재 구매자를 발굴하는 고객 분류 모형(customer classification model)을 구축하는 것이다. 고객 분류 모형은 다양한 마케팅 기회 창출에 활용될 수 있는데, 예를 들어 일대일 마케팅이나 DM(direct mailing) 발송을 통한 표적 마케팅, 전화나 이메일 등을 이용한 판매 촉진(sales promotion) 등에 있어 대상 고객을 선별하는데 유용하게 활용될 수 있다. 때문에 Ford와 같은 자동차 제조업체나 Allstate와 같은 보험사, 그리고 1-800-flowers.
고객 분류 모형을 구축하는데는 어떤 방법들이 적용되는가? 이러한 고객 분류 모형을 구축하는데에는 전통적으로 로지스틱 회귀분석(LR, Logistic Regression), 인공신경망(ANN, Artificial Neural Networks), 사례기반추론(CBR, Case-based Reasoning) 등 다양한 방법들이 적용되어 왔다[2-8]. 그 중에서도 특히 CBR은 적용이 쉽고, 유지보수가 상대적으로 편리하며, 실시간으로 연속해서 학습이 이루어진다는 장점으로 인해, 고객 분류 모형 구축[2,3]을 비롯한 여러 경영문제 해결에 널리 활용되어 왔다[9-11].
고객 분류 모형을 구축하는데 있어서 사례기반추론은 어떤 장점을 가지는가? 이러한 고객 분류 모형을 구축하는데에는 전통적으로 로지스틱 회귀분석(LR, Logistic Regression), 인공신경망(ANN, Artificial Neural Networks), 사례기반추론(CBR, Case-based Reasoning) 등 다양한 방법들이 적용되어 왔다[2-8]. 그 중에서도 특히 CBR은 적용이 쉽고, 유지보수가 상대적으로 편리하며, 실시간으로 연속해서 학습이 이루어진다는 장점으로 인해, 고객 분류 모형 구축[2,3]을 비롯한 여러 경영문제 해결에 널리 활용되어 왔다[9-11].
질의응답 정보가 도움이 되었나요?

참고문헌 (24)

  1. H. Ahn, K.-j. Kim, and I. Han, "Simultaneous Optimization Model of Case-Based Reasoning for Effective Customer Relationship Management," Journal of Intelligence and Information Systems, Vol.11, No.2, pp.175-195, 2005. 

  2. C. Chiu, "A case-based customer classification approach for direct marketing," Expert Systems with Applications, Vol.22, No.2, pp.163-168, 2002. 

  3. G.-H. Lee and D.-H. Lee, "Recommending System of Products on e-shopping malls based on CBR and RBR," The KIPS Transactions: Part D, Vol.11D, No.5, pp.1189-1196, 2004. 

  4. V. Kumar and W. J. Reinartz, Customer Relationship Management: A Databased Approach, New Jersey: John Wiley & Sons, 2006. 

  5. H. Ahn, K.-j. Kim, and I. Han, "Hybrid Genetic Algorithms and Case-based Reasoning Systems for Customer Classification," Expert Systems, Vol.23, No.3, pp.127-144, 2006. 

  6. H. Ahn, K.-j. Kim, and I. Han, "Global optimization of feature weights and the number of neighbors that combine in a CBR system," Expert Systems, Vol.23, No.5, pp.290-301, 2006. 

  7. H. Ahn, K.-j. Kim, and I. Han, "A Case-based Reasoning System with the Two-Dimensional Reduction Technique for Customer Classification," Expert Systems with Applications, Vol.32, No.4, pp.1011-1019, 2007. 

  8. H. Ahn, J. J. Ahn, K. J. Oh, and D. H. Kim, "Facilitating Cross-selling in a Mobile Telecom Market to develop Customer Classification Model based on Hybrid Data Mining Techniques," Expert Systems with Applications, Vol.38, No.5, pp.5005-5012, 2011. 

  9. C. Chiu, P. C. Chang, and N. H. Chiu, "A case-based expert support system for due-date assignment in a water fabrication factory," Journal of Intelligent Manufacturing, Vol.14, No.3-4, pp.287-296, 2003. 

  10. K.-j. Kim and I. Han, "Maintaining case-based reasoning systems using a genetic algorithms approach," Expert Systems with Applications, Vol.21, No.3, pp.139-145, 2001. 

  11. K. S. Shin and I. Han, "Case-based reasoning supported by genetic algorithms for corporate bond rating," Expert Systems with Applications, Vol.16, No.2, pp.85-95, 1999. 

  12. J. M. Garrell i Guiu, E. Golobardes i Rib?, E. Bernad? i Mansilla, and X. Llor? i F?brega, "Automatic diagnosis with genetic algorithms and case-based reasoning," Artificial Intelligence in Engineering, Vol.13, No.4, pp.367-372, 1999. 

  13. H. Y. Lee and K. Park, "Methods for Determining the Optimal Number of Cases to Combine in An Effective Case-Based Forecasting System," Korean Management Review, Vol.27, No.5, pp.1239-1252, 1999. 

  14. Y. J. Park, "Case-Based Reasoning Methods based on Statistical Analysis," Doctoral Thesis, Division of Management Engineering, Korea Advanced Institute of Science and Technology, Seoul, Korea, 2006. 

  15. H. Ahn, "Simultaneous optimization model of similarity threshold and coverage of the CBR system for target marketing," in Proceedings of 2007 KMIS Fall Conference, Seoul, Korea, pp.605-610, 2007. 

  16. A. Aamodt and E. Plaza, "Case-based reasoning; Foundational issues, methodological variations, and system approaches," AI Communications, Vol.7, No.1, pp.39-59, 1994. 

  17. W. Siedlecki and J. Sklanski, "A note on genetic algorithms for large-scale feature selection," Pattern Recognition Letters, Vol.10, No.5, pp.335-347, 1989. 

  18. L. I. Kuncheva and L. C. Jain, "Nearest neighbor classifier: Simultaneous editing and feature selection," Pattern Recognition Letters, Vol.20, No.11-13, pp.1149-1156, 1999. 

  19. T. S. Kim, J. H. Yoon, and H. K. Lee, "Performance of a nonparametric multivariate nearest neighbor model in the prediction of stock index returns," Asia Pacific Management Review, Vol.7, No.1, pp.107-118, 2002. 

  20. J. Sun and X.-F. Hui, "Financial Distress Prediction Based on Similarity Weighted Voting CBR," Lecture Notes in Artificial Intelligence, Vol.4093, pp.947-958, 2006. 

  21. H. Ahn and K.-j. Kim, "Bankruptcy Prediction Modeling with Hybrid Case-Based Reasoning and Genetic Algorithms Approach," Applied Soft Computing, Vol.9, No.2, pp.599-607, 2009. 

  22. F. E. H. Tay and L. J. Cao, "Application of support vector machines in financial time series forecasting," Omega, Vol.29, No.4, pp.309-317, 2001. 

  23. Bichindaritz and C. Marling, "Case-based reasoning in the health sciences: What's next?," Artificial Intelligence in Medicine, Vol.36, No.2, pp.127-135, 2006. 

  24. S.-W. Kim and H. Ahn, "Development of an Intelligent Trading System Using Support Vector Machines and Genetic Algorithms," Journal of Intelligence and Information Systems, Vol.16, No.1, pp.71-92, 2010. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로