최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기지능정보연구 = Journal of intelligence and information systems, v.21 no.2, 2015년, pp.1 - 18
Collaborative filtering(CF) algorithm has been popularly used for recommender systems in both academic and practical applications. A general CF system compares users based on how similar they are, and creates recommendation results with the items favored by other people with similar tastes. Thus, it...
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
협업 필터링의 단점은? | 협업 필터링은 학계나 산업계에서 우수한 성능으로 인해 많이 사용되는 추천기법이지만, 정량적 정보인 사용자들의 평가점수에만 국한하여 추천결과를 생성하므로 간혹 정확도가 떨어지는 문제가 발생한다. 이에 새로운 정보를 추가로 고려하여, 협업 필터링의 성능을 개선하려는 연구들이 지금까지 다양하게 시도되어 왔다. | |
협업 필터링 이란? | 협업 필터링(Collaborative filtering, CF) 추천 시스템은 추천 대상이 되는 고객과 비슷한 패턴을 가진 고객들(이웃)을 식별하여, 이들이 과거에 선호했거나 구매했던 상품들 중 대상 고객이 아직 경험하지 않은 상품을 추천하는 시스템이다. 이러한 협업 필터링 기반의 추천 시스템을 구현하기 위해서는 추천 대상이 되는 고객과 유사한 고객이 누구인지를 얼마나 정확하게 식별하는가가 중요한데, 전통적인 협업 필터링에서 고객 간 유사도는 상품에 대한 평점 혹은 구매여부와 같은 정량적(quantitative)인 정보들을 활용해 산출되어 왔다. | |
메모리 기반 협업 필터링의 장점과 단점은? | 이 접근법에서는 추천 대상이 되는 사용자와 유사한 패턴을 가진 것으로 파악된 사용자 그룹에 속한 모든 점수의 가중치가 부여된 평균을 활용하여 추천결과를 생성한다. 메모리 기반 시스템의 주요 장점은 적용이 용이하고, 추천결과에 대한 설명이 가능하다는 점이다. 반면 추천결과를 생성할 때마다 매번 많은 연산이 요구된다는 단점을 가진다. |
Breese, J. S., D. Heckerman, and C. Kadie, "Empirical analysis of predictive algorithms for collaborative filtering," Proceedings of the Fourteenth Conference on Uncertainty in Artificial Intelligence, (1998), 43-52.
협업 필터링 알고리즘에는 크게 메모리 기반과 모델 기반의 2가지 접근 유형이 있다(Breese et al., 1998).
이 때 실제 평점과 예상 평점 간의 오차는 추천 시스템 관련 연구에서 전통적으로 많이 사용되어 온 평균 MAE(Mean Absolute Error)를 통해 산출하였다 (Breese et al., 1998; Sarwar et al., 2001).
Chen, P.-Y., S. Dhanasobhon, and M. D. Smith, "An Analysis of the Differential Impact of Reviews and Reviewers at Amazon.Com," Proceedings of International Conference on Information Systems(ICIS), (2007), 94.
이런 가운데 최근 Web 2.0의 도래와 함께, 텍스트를 이용해 인터넷 상에 자신의 의견을 표출하는 것이 점차 보편화 되어가고 있다(Chen et al., 2007).
Choeh, J. Y., S. K. Lee, and Y. B. Cho, "Applying Rating Score's Reliability of Customers to Enhance Prediction Accuracy in Recommender System," Journal of Digital Contents Society, Vol. 13, No. 7(2013), 379-385.
쇼핑몰과 같은 상거래 플랫폼에서도 상품에 대한 고객들의 의견을 공유할 수 있도록 하는 사용자 리뷰가 크게 활성화되고 있는데, 이와 같은 리뷰에는 해당 상품에 대해 고객이 갖고 있는 선호에 대한 보다 상세하고, 신뢰할 수 있는 정보를 담고 있어 추천 시스템에서 활용하기에 매우 유용할 수 있다(Choeh et al. 2013).
사용자 리뷰의 신뢰도를 정량적으로 측정할 수 있는 모형을 제안하고, 이를 추천 시스템에 반영하여 추천 정확도의 개선을 실증적으로 확인한 Choeh et al.(2013)의 연구나 개봉 첫 주 동안의 영화 사용자 리뷰들을 기반으로 영화 흥행 성적 예측모형을 제안한 Cho et al.(2014)의 연구들이 사용자 리뷰의 응용을 시도하였으나, 사용자 리뷰의 내용을 분석하여 이를 추천 시스템에 활용한 사례는 아직 발표되지 않은 상태이다.
Cho, S. Y., H.-k. Kim, B. S. Kim, and H.-w. Kim, "Predicting Movie Revenue by Online Review Mining Using the Opening Week Online Review," Information Systems Review, Vol. 16, No. 1(2014), 113-134.
사용자 리뷰의 신뢰도를 정량적으로 측정할 수 있는 모형을 제안하고, 이를 추천 시스템에 반영하여 추천 정확도의 개선을 실증적으로 확인한 Choeh et al.(2013)의 연구나 개봉 첫 주 동안의 영화 사용자 리뷰들을 기반으로 영화 흥행 성적 예측모형을 제안한 Cho et al.(2014)의 연구들이 사용자 리뷰의 응용을 시도하였으나, 사용자 리뷰의 내용을 분석하여 이를 추천 시스템에 활용한 사례는 아직 발표되지 않은 상태이다.
Garcia-Cumbreras, M. A., A. Montejo-Raez, and M. C. Diaz-Galiano, "Pessimists and optimists: Improving collaborative filtering through sentiment analysis," Expert Systems with Applications, Vol. 40, No. 17(2013), 6758-6765.
Hearst, M. A., "Untangling text data mining," Proceedings of the 37th Annual Meeting of the Association for Computational Linguistics on Computational Linguistics, (1999), 3-10.
텍스트 마이닝은 이처럼 우리가 흔하게 접할 수 있는 자연어로 구성된 대량의 비정형 텍스트 데이터에서 숨겨진 패턴 또는 관계를 추출하여 의미 있고 활용가치가 높은 정보 또는 지식을 추출하는 일련의 분석 기법을 의미한다(Hearst, 1999; Hyun et al. 2013; Sebastiani, 2002).
Hyun, Y., H. Han, H. Choi, J. Park, K., Lee, K. -Y. Kwahk and N. Kim, "Methodology Using Text Analysis for Packaging R&D Information services on Pending National Issues," Journal of Information Technology Applications & Management, Vol. 20, No. 3(2013), 231-257.
텍스트 마이닝은 이처럼 우리가 흔하게 접할 수 있는 자연어로 구성된 대량의 비정형 텍스트 데이터에서 숨겨진 패턴 또는 관계를 추출하여 의미 있고 활용가치가 높은 정보 또는 지식을 추출하는 일련의 분석 기법을 의미한다(Hearst, 1999; Hyun et al. 2013; Sebastiani, 2002).
Jacob, N., S. H. Weber, M. C. Muller, and I. Gurevych, "Beyond the Stars: Exploiting Free-Text User Reviews to Improve the Accuracy of Movie Recommendations," Proceedings of the 1st International CIKM Workshop on Topic-sentiment Analysis for Mass Opinion, Hong Kong, China, (2009), 57-64.
한편 Jacob et al.(2009)은 사용자 리뷰를 활용한 모델 기반 하이브리드 협업 필터링 시스템을 제안하였다.
Jacob et al.(2009)과 Wang et al.(2012)의 연구는 정량적 평가점수 기반의 추천 알고리즘에 사용자 리뷰 마이닝 결과를 추가로 반영하여 성능이 더 개선됨을 보였다는 점에서 의의가 있다.
이 연구의 경우, Jacob et al.(2009)이나 Wang et al.(2012)과 달리 메모리 기반 추천 시스템을 제안하여 구현이 용이하고, 예측 정확도가 상대적으로 우수하다는 장점을 갖고 있다.
Kim, K.-j. and H. Ahn, "User-Item Matrix Reduction Technique for Personalized Recommender Systems," Journal of Information Technology Applications & Management, Vol. 16, No. 1(2009), 97-113.
상품 간 유사성 (item-to-item similarity)에 기반하여 추천결과를 생성하는 내용 기반 추천 알고리즘과 달리, 협업 필터링은 사용자 간 유사성(user-to-user similarity)에 기반하여 추천 결과를 생성하는데, 일반적으로 내용 기반 추천 알고리즘에 비해 상대적으로 더 우수한 추천 정확도를 보이는 것으로 알려져 있다(Kim and Ahn, 2009; Kim and Ahn, 2011).
Kim, K.-j. and H. Ahn, "Collaborative Filtering with a User-Item Matrix Reduction Technique for Recommender Systems," International Journal of Electronic Commerce, Vol. 16, No. 1(2011), 107-128.
Kim, M. and K.-j. Kim, "Recommender Systems using Structural Hole and Collaborative Filtering," Journal of Intelligence and Information System, Vol. 20, No. 4(2014), 107-120.
Leung, C. W.-k., S. C.-f. Chan, and F.-l. Chung, "Integrating Collaborative Filtering and Sentiment Analysis: A Rating Inference Approach," Proceedings of the ECAI 2006 Workshop on Recommender Systems, Riva del Garda, Italy, (2006), 62-66.
그 중 가장 최초의 시도라 볼 수 있는 연구는 Leung et al.(2006)이다.
Levi, A., Mokryn, O., Diot, C. and N. Taft, "Finding a Needle in a Haystack of Reviews: Cold Start Context-Based Hotel Recommender System," Proceedings of the Sixth ACM Conference on Recommender Systems, Dublin, Ireland, (2012), 115-122.
Moshfeghi et al.(2011)과 Levi et al.(2012)는 협업 필터링의 주요한 문제 중 하나인 신규 고객 추천 문제(cold start problem)을 해결하기 위한 대안으로 사용자 리뷰 마이닝을 활용하는 방안을 제안하였다.
Moshfeghi, Y., B. Piwowarski, and J. M. Jose, "Handling Data Sparsity in Collaborative Filtering Using Emotion and Semantic Based Features," Proceedings of the 34th International ACM SIGIR Conference on Research and Development in Information Retrieval, Beijing, China, (2011), 625-634.
Moshfeghi et al.(2011)과 Levi et al.(2012)는 협업 필터링의 주요한 문제 중 하나인 신규 고객 추천 문제(cold start problem)을 해결하기 위한 대안으로 사용자 리뷰 마이닝을 활용하는 방안을 제안하였다.
Salton, G. and M. J. McGill, Introduction to Modern Information Retrieval, McGraw -Hill, 1986.
TF-IDF 가중치는 문서의 핵심어를 추출하거나, 검색 엔진에서 검색 결과의 순위를 결정할 때, 혹은 문서 간 유사도를 산출하는 등의 용도로 사용될 수 있다(Salton and McGill, 1986; You et al. 2004).
Salton, G., A. Wong, and C. S. Yang, "A vector space model for automatic indexing," Communications of the ACM, Vol. 18, No. 11 (1975), 613-620.
Sarwar, B., Karypis, G., Konstan, J. and Riedl, J., "Item-based collaborative filtering recommendation algorithms," Proceedings of the 10th International Conference on World Wide Web, (2001), 285-295.
추천 시스템(recommender system)이란 특정 사용자를 위한 Top-N 추천 상품 목록을 생성하거나 추천 대상 상품들에 대한 해당 사용자의 평가점수를 예측하는 방법을 통해, 그들이 전자 상거래 사이트에서 구매를 희망하는 상품을 쉽게 찾을 수 있도록 도와주는 데이터 분석 기술 기반의 정보 여과(information filtering) 시스템을 말한다(Sarwar et al., 2001).
이 때 실제 평점과 예상 평점 간의 오차는 추천 시스템 관련 연구에서 전통적으로 많이 사용되어 온 평균 MAE(Mean Absolute Error)를 통해 산출하였다 (Breese et al., 1998; Sarwar et al., 2001).
Sebastiani, F., "Machine learning in automated text categorization," ACM Computing Surveys, Vol. 34, No. 1(2002), 1-47.
Shin, C. H., J. W.Lee, H. N. Yang, and I. Y. Choi, "The Research on Recommender for New Customers Using Collaborative Filtering and Social Network Analysis," Journal of Intelligence and Information Systems, Vol. 18, No.4(2012), 19-42.
터넷 보급이 늘어나고 활성화 되면서 웹을 통한 쇼핑으로 고객들의 구매패턴이 변화하고 있다(Shin et al. 2012).
Statista, Number of apps available in leading app stores as of July 2014, 2015. Available at http://www.statista.com/statistics/276623/number-of-apps-available-in-leading-app-stores/ (Downloaded 11 May, 2015).
2014년 7월 기준으로 애플 앱 스토어에는 120만종, 구글 플레이에는 무려 130만 종 가량의 앱이 제공(Statista, 2015)되고 있는데, 이처럼 과도하게 많은 앱이 현재 제공되고 있어 사용자에게 적절한 앱을 추천해 줄 수 있는 추천 시스템의 개발은 실무적으로 대단히 중요한 의미가 있다.
Wang, Y., Y. Liu, and X. Yu, "Collaborative Filtering with Aspect-Based Opinion Mining: A Tensor Factorization Approach," Proceedings of 2012 IEEE 12th International Conference on Data Mining (ICDM), Brussels, Belgium, (2012), 1152-1157.
Wang et al.(2012)은 Jacob et al.(2009)이 제안한 추천 알고리즘의 기본 틀을 그대로 채택하되, 텐서 분해(tensor factorization)라는 새로운 기법을 통해 보다 효과적으로 사용자의 평가점수를 예측할 수 있는 방법을 제안하였다.
이 연구의 경우, Jacob et al.(2009)이나 Wang et al.(2012)과 달리 메모리 기반 추천 시스템을 제안하여 구현이 용이하고, 예측 정확도가 상대적으로 우수하다는 장점을 갖고 있다.
Witten, I. H., Text Mining: Practical Handbook of Internet Computing, CRC press, 2004.
텍스트는 가장 보편화된 정보를 표현하고 전달하는 수단으로, 인류의 역사가 진행되는 동안 축적되어 온 방대한 양의 지식들이 지금껏 텍스트 형태로 저장되어 왔다(Witten, 2004).
You, M., J.-S. Park, and J.-K. Kim, "Folder Recommendation Based on User Knowledge," Journal of Intelligence and Information System, Vol. 10, No. 3(2004), 133-146.
TF-IDF 가중치는 문서의 핵심어를 추출하거나, 검색 엔진에서 검색 결과의 순위를 결정할 때, 혹은 문서 간 유사도를 산출하는 등의 용도로 사용될 수 있다(Salton and McGill, 1986; You et al. 2004).
Zhang, Z., D. Zhang, and J. Lai, "urCF: User Review Enhanced Collaborative Filtering," Proceedings of the 20th Americas Conference on Information Systems, (2014).
이처럼 정량적이고 명시적인 상품에 대한 평점이나 구매 여부와 같은 정보는 수리적으로 처리하기 쉽다는 장점이 있지만, 과연 이러한 정보들이 진정으로 고객의 선호체계를 대표할 수 있는가에 대해서는 의문이 제기되고 있다(Zhang et al., 2014).
가장 최근에 발표된 Zhang et al.(2014)은 urCF(User Review enhanced Collaborative Filtering)이라는 이름의 메모리 기반 추천 시스템을 제안하였다.
Zhou, L. and P. Chaovalit, , "Ontology-Supported Polarity Mining," Journal of the American Society for Information Science and Technology, Vol. 59, No. 1(2008), 98-110.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.