$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용
A Collaborative Filtering System Combined with Users' Review Mining : Application to the Recommendation of Smartphone Apps 원문보기 논문타임라인

지능정보연구 = Journal of intelligence and information systems, v.21 no.2, 2015년, pp.1 - 18  

전병국 (국민대학교 비즈니스IT전문대학원) ,  안현철 (국민대학교 비즈니스IT전문대학원)

초록
AI-Helper 아이콘AI-Helper

협업 필터링은 학계나 산업계에서 우수한 성능으로 인해 많이 사용되는 추천기법이지만, 정량적 정보인 사용자들의 평가점수에만 국한하여 추천결과를 생성하므로 간혹 정확도가 떨어지는 문제가 발생한다. 이에 새로운 정보를 추가로 고려하여, 협업 필터링의 성능을 개선하려는 연구들이 지금까지 다양하게 시도되어 왔다. 본 연구는 최근 Web 2.0 시대의 도래로 인해 사용자들이 구입한 상품에 대한 솔직한 의견을 인터넷 상에 자유롭게 표현한다는 점에 착안하여, 사용자가 직접 작성한 리뷰를 참고하여 협업 필터링의 성능을 개선하는 새로운 추천 알고리즘을 제안하고, 이를 스마트폰 앱 추천 시스템에 적용하였다. 정성 정보인 사용자 리뷰를 정량화하기 위해 본 연구에서는 텍스트 마이닝을 활용하였다. 구체적으로 본 연구의 추천시스템은 사용자간 유사도를 산출할 때, 사용자 리뷰의 유사도를 추가로 반영하여 보다 정밀하게 사용자간 유사도를 산출할 수 있도록 하였다. 이 때, 사용자 리뷰의 유사도를 산출하는 접근법으로 중복 사용된 색인어의 빈도로 산출하는 방안과 TF-IDF(Term Frequency - Inverse Document Frequency) 가중치 합으로 산출하는 2가지 방안을 제시한 뒤 그 성능을 비교해 보았다. 실험결과, 제안 알고리즘을 통한 추천, 즉 사용자 리뷰의 유사도를 추가로 반영하는 알고리즘이 평점만을 고려하는 전통적인 협업 필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인할 수 있었다. 아울러, 중복 사용 단어의 TF-IDF 가중치의 합을 고려했을 때, 단순히 중복 사용 단어의 빈도만을 고려했을 때 보다 조금 더 나은 예측정확도를 얻을 수 있음도 함께 확인할 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

Collaborative filtering(CF) algorithm has been popularly used for recommender systems in both academic and practical applications. A general CF system compares users based on how similar they are, and creates recommendation results with the items favored by other people with similar tastes. Thus, it...

주제어

질의응답

핵심어 질문 논문에서 추출한 답변
협업 필터링의 단점은? 협업 필터링은 학계나 산업계에서 우수한 성능으로 인해 많이 사용되는 추천기법이지만, 정량적 정보인 사용자들의 평가점수에만 국한하여 추천결과를 생성하므로 간혹 정확도가 떨어지는 문제가 발생한다. 이에 새로운 정보를 추가로 고려하여, 협업 필터링의 성능을 개선하려는 연구들이 지금까지 다양하게 시도되어 왔다.
협업 필터링 이란? 협업 필터링(Collaborative filtering, CF) 추천 시스템은 추천 대상이 되는 고객과 비슷한 패턴을 가진 고객들(이웃)을 식별하여, 이들이 과거에 선호했거나 구매했던 상품들 중 대상 고객이 아직 경험하지 않은 상품을 추천하는 시스템이다. 이러한 협업 필터링 기반의 추천 시스템을 구현하기 위해서는 추천 대상이 되는 고객과 유사한 고객이 누구인지를 얼마나 정확하게 식별하는가가 중요한데, 전통적인 협업 필터링에서 고객 간 유사도는 상품에 대한 평점 혹은 구매여부와 같은 정량적(quantitative)인 정보들을 활용해 산출되어 왔다.
메모리 기반 협업 필터링의 장점과 단점은? 이 접근법에서는 추천 대상이 되는 사용자와 유사한 패턴을 가진 것으로 파악된 사용자 그룹에 속한 모든 점수의 가중치가 부여된 평균을 활용하여 추천결과를 생성한다. 메모리 기반 시스템의 주요 장점은 적용이 용이하고, 추천결과에 대한 설명이 가능하다는 점이다. 반면 추천결과를 생성할 때마다 매번 많은 연산이 요구된다는 단점을 가진다.
질의응답 정보가 도움이 되었나요?

참고문헌 (26)

  1. Breese, J. S., D. Heckerman, and C. Kadie, "Empirical analysis of predictive algorithms for collaborative filtering," Proceedings of the Fourteenth Conference on Uncertainty in Artificial Intelligence, (1998), 43-52. 

    인용구절

    인용 구절

    협업 필터링 알고리즘에는 크게 메모리 기반과 모델 기반의 2가지 접근 유형이 있다(Breese et al., 1998).

    이 때 실제 평점과 예상 평점 간의 오차는 추천 시스템 관련 연구에서 전통적으로 많이 사용되어 온 평균 MAE(Mean Absolute Error)를 통해 산출하였다 (Breese et al., 1998; Sarwar et al., 2001).

  2. Chen, P.-Y., S. Dhanasobhon, and M. D. Smith, "An Analysis of the Differential Impact of Reviews and Reviewers at Amazon.Com," Proceedings of International Conference on Information Systems(ICIS), (2007), 94. 

    인용구절

    인용 구절

    이런 가운데 최근 Web 2.0의 도래와 함께, 텍스트를 이용해 인터넷 상에 자신의 의견을 표출하는 것이 점차 보편화 되어가고 있다(Chen et al., 2007).

  3. Choeh, J. Y., S. K. Lee, and Y. B. Cho, "Applying Rating Score's Reliability of Customers to Enhance Prediction Accuracy in Recommender System," Journal of Digital Contents Society, Vol. 13, No. 7(2013), 379-385. 

    인용구절

    인용 구절

    쇼핑몰과 같은 상거래 플랫폼에서도 상품에 대한 고객들의 의견을 공유할 수 있도록 하는 사용자 리뷰가 크게 활성화되고 있는데, 이와 같은 리뷰에는 해당 상품에 대해 고객이 갖고 있는 선호에 대한 보다 상세하고, 신뢰할 수 있는 정보를 담고 있어 추천 시스템에서 활용하기에 매우 유용할 수 있다(Choeh et al. 2013).

    사용자 리뷰의 신뢰도를 정량적으로 측정할 수 있는 모형을 제안하고, 이를 추천 시스템에 반영하여 추천 정확도의 개선을 실증적으로 확인한 Choeh et al.(2013)의 연구나 개봉 첫 주 동안의 영화 사용자 리뷰들을 기반으로 영화 흥행 성적 예측모형을 제안한 Cho et al.(2014)의 연구들이 사용자 리뷰의 응용을 시도하였으나, 사용자 리뷰의 내용을 분석하여 이를 추천 시스템에 활용한 사례는 아직 발표되지 않은 상태이다.

  4. Cho, S. Y., H.-k. Kim, B. S. Kim, and H.-w. Kim, "Predicting Movie Revenue by Online Review Mining Using the Opening Week Online Review," Information Systems Review, Vol. 16, No. 1(2014), 113-134. 

    인용구절

    인용 구절

    사용자 리뷰의 신뢰도를 정량적으로 측정할 수 있는 모형을 제안하고, 이를 추천 시스템에 반영하여 추천 정확도의 개선을 실증적으로 확인한 Choeh et al.(2013)의 연구나 개봉 첫 주 동안의 영화 사용자 리뷰들을 기반으로 영화 흥행 성적 예측모형을 제안한 Cho et al.(2014)의 연구들이 사용자 리뷰의 응용을 시도하였으나, 사용자 리뷰의 내용을 분석하여 이를 추천 시스템에 활용한 사례는 아직 발표되지 않은 상태이다.

  5. Garcia-Cumbreras, M. A., A. Montejo-Raez, and M. C. Diaz-Galiano, "Pessimists and optimists: Improving collaborative filtering through sentiment analysis," Expert Systems with Applications, Vol. 40, No. 17(2013), 6758-6765. 

    상세보기 crossref
    인용구절

    인용 구절

    한편 Garcia-Cumbreras et al.(2013)은 사용자 리뷰에 감성 분석을 적용하여, 해당 사용자가 일반적으로 긍정적인 평가를 주로 하는 낙관주의자(optimist)인지 혹은 부정적인 평가를 주로 하는 비관주의자(pessimist)인지를 분류하고, 각 집단별로 따로 협업 필터링을 수행하도록 하는 새로운 접근의 추천 시스템을 제안하였다.

  6. Hearst, M. A., "Untangling text data mining," Proceedings of the 37th Annual Meeting of the Association for Computational Linguistics on Computational Linguistics, (1999), 3-10. 

    인용구절

    인용 구절

    텍스트 마이닝은 이처럼 우리가 흔하게 접할 수 있는 자연어로 구성된 대량의 비정형 텍스트 데이터에서 숨겨진 패턴 또는 관계를 추출하여 의미 있고 활용가치가 높은 정보 또는 지식을 추출하는 일련의 분석 기법을 의미한다(Hearst, 1999; Hyun et al. 2013; Sebastiani, 2002).

  7. Hyun, Y., H. Han, H. Choi, J. Park, K., Lee, K. -Y. Kwahk and N. Kim, "Methodology Using Text Analysis for Packaging R&D  Information services on Pending National Issues," Journal of Information Technology Applications & Management, Vol. 20, No. 3(2013), 231-257. 

    인용구절

    인용 구절

    텍스트 마이닝은 이처럼 우리가 흔하게 접할 수 있는 자연어로 구성된 대량의 비정형 텍스트 데이터에서 숨겨진 패턴 또는 관계를 추출하여 의미 있고 활용가치가 높은 정보 또는 지식을 추출하는 일련의 분석 기법을 의미한다(Hearst, 1999; Hyun et al. 2013; Sebastiani, 2002).

  8. Jacob, N., S. H. Weber, M. C. Muller, and I. Gurevych, "Beyond the Stars: Exploiting Free-Text User Reviews to Improve the Accuracy of Movie Recommendations," Proceedings of the 1st International CIKM Workshop on Topic-sentiment Analysis for Mass Opinion, Hong Kong, China, (2009), 57-64. 

    인용구절

    인용 구절

    한편 Jacob et al.(2009)은 사용자 리뷰를 활용한 모델 기반 하이브리드 협업 필터링 시스템을 제안하였다.

    Jacob et al.(2009)과 Wang et al.(2012)의 연구는 정량적 평가점수 기반의 추천 알고리즘에 사용자 리뷰 마이닝 결과를 추가로 반영하여 성능이 더 개선됨을 보였다는 점에서 의의가 있다.

    이 연구의 경우, Jacob et al.(2009)이나 Wang et al.(2012)과 달리 메모리 기반 추천 시스템을 제안하여 구현이 용이하고, 예측 정확도가 상대적으로 우수하다는 장점을 갖고 있다.

  9. Kim, K.-j. and H. Ahn, "User-Item Matrix Reduction Technique for Personalized Recommender Systems," Journal of Information Technology Applications & Management, Vol. 16, No. 1(2009), 97-113. 

    인용구절

    인용 구절

    상품 간 유사성 (item-to-item similarity)에 기반하여 추천결과를 생성하는 내용 기반 추천 알고리즘과 달리, 협업 필터링은 사용자 간 유사성(user-to-user similarity)에 기반하여 추천 결과를 생성하는데, 일반적으로 내용 기반 추천 알고리즘에 비해 상대적으로 더 우수한 추천 정확도를 보이는 것으로 알려져 있다(Kim and Ahn, 2009; Kim and Ahn, 2011).

  10. Kim, K.-j. and H. Ahn, "Collaborative Filtering with a User-Item Matrix Reduction Technique for Recommender Systems," International Journal of Electronic Commerce, Vol. 16, No. 1(2011), 107-128. 

    상세보기 crossref
    인용구절

    인용 구절

    상품 간 유사성 (item-to-item similarity)에 기반하여 추천결과를 생성하는 내용 기반 추천 알고리즘과 달리, 협업 필터링은 사용자 간 유사성(user-to-user similarity)에 기반하여 추천 결과를 생성하는데, 일반적으로 내용 기반 추천 알고리즘에 비해 상대적으로 더 우수한 추천 정확도를 보이는 것으로 알려져 있다(Kim and Ahn, 2009; Kim and Ahn, 2011).

  11. Kim, M. and K.-j. Kim, "Recommender Systems using Structural Hole and Collaborative Filtering," Journal of Intelligence and Information System, Vol. 20, No. 4(2014), 107-120. 

    원문보기 상세보기 crossref 타임라인에서 보기
    인용구절

    인용 구절

    본 연구에서는 All-but-One 방식으로 실제 평점이 입력된 상품에 대해 추천 알고리즘으로 예상 평점을 도출해 본 다음, 실제 평점과의 평균오차가 가장 적게 나타난 추천 알고리즘이 어떤 것인지를 확인하는 방식으로 검증 작업을 진행하였다(Kim and Kim, 2014).

  12. Leung, C. W.-k., S. C.-f. Chan, and F.-l. Chung, "Integrating Collaborative Filtering and Sentiment Analysis: A Rating Inference Approach," Proceedings of the ECAI 2006 Workshop on Recommender Systems, Riva del Garda, Italy, (2006), 62-66. 

    인용구절

    인용 구절

    그 중 가장 최초의 시도라 볼 수 있는 연구는 Leung et al.(2006)이다.

  13. Levi, A., Mokryn, O., Diot, C. and N. Taft, "Finding a Needle in a Haystack of Reviews: Cold Start Context-Based Hotel Recommender System," Proceedings of the Sixth ACM Conference on Recommender Systems, Dublin, Ireland, (2012), 115-122. 

    인용구절

    인용 구절

    Moshfeghi et al.(2011)과 Levi et al.(2012)는 협업 필터링의 주요한 문제 중 하나인 신규 고객 추천 문제(cold start problem)을 해결하기 위한 대안으로 사용자 리뷰 마이닝을 활용하는 방안을 제안하였다.

  14. Moshfeghi, Y., B. Piwowarski, and J. M. Jose, "Handling Data Sparsity in Collaborative Filtering Using Emotion and Semantic Based Features," Proceedings of the 34th International ACM SIGIR Conference on Research and Development in Information Retrieval, Beijing, China, (2011), 625-634. 

    인용구절

    인용 구절

    Moshfeghi et al.(2011)과 Levi et al.(2012)는 협업 필터링의 주요한 문제 중 하나인 신규 고객 추천 문제(cold start problem)을 해결하기 위한 대안으로 사용자 리뷰 마이닝을 활용하는 방안을 제안하였다.

  15. Salton, G. and M. J. McGill, Introduction to Modern Information Retrieval, McGraw -Hill, 1986. 

    인용구절

    인용 구절

    TF-IDF 가중치는 문서의 핵심어를 추출하거나, 검색 엔진에서 검색 결과의 순위를 결정할 때, 혹은 문서 간 유사도를 산출하는 등의 용도로 사용될 수 있다(Salton and McGill, 1986; You et al. 2004).

  16. Salton, G., A. Wong, and C. S. Yang, "A vector space model for automatic indexing," Communications of the ACM, Vol. 18, No. 11 (1975), 613-620. 

  17. Sarwar, B., Karypis, G., Konstan, J. and Riedl, J., "Item-based collaborative filtering recommendation algorithms," Proceedings of the 10th International Conference on World Wide Web, (2001), 285-295. 

    인용구절

    인용 구절

    추천 시스템(recommender system)이란 특정 사용자를 위한 Top-N 추천 상품 목록을 생성하거나 추천 대상 상품들에 대한 해당 사용자의 평가점수를 예측하는 방법을 통해, 그들이 전자 상거래 사이트에서 구매를 희망하는 상품을 쉽게 찾을 수 있도록 도와주는 데이터 분석 기술 기반의 정보 여과(information filtering) 시스템을 말한다(Sarwar et al., 2001).

    이 때 실제 평점과 예상 평점 간의 오차는 추천 시스템 관련 연구에서 전통적으로 많이 사용되어 온 평균 MAE(Mean Absolute Error)를 통해 산출하였다 (Breese et al., 1998; Sarwar et al., 2001).

  18. Schafer, J. B., J. Konstan, and J. Riedl, "Electronic Commerce Recommender Applications," Journal of Data Mining and Knowledge Discovery, Vol. 5, Nos. 1-2(2001), 115-152. 

    상세보기 crossref
    인용구절

    인용 구절

    다만, 추천 정확도가 메모리 기반 접근법에 비해 다소 떨어질 수 있고, 사용자들의 선호가 빠르게 또는 자주 갱신되어야 하는 환경에 적합하지 않다는 단점이 있다(Schafer et al., 2001).

  19. Sebastiani, F., "Machine learning in automated text categorization," ACM Computing Surveys, Vol. 34, No. 1(2002), 1-47. 

    상세보기 crossref
    인용구절

    인용 구절

    텍스트 마이닝은 이처럼 우리가 흔하게 접할 수 있는 자연어로 구성된 대량의 비정형 텍스트 데이터에서 숨겨진 패턴 또는 관계를 추출하여 의미 있고 활용가치가 높은 정보 또는 지식을 추출하는 일련의 분석 기법을 의미한다(Hearst, 1999; Hyun et al. 2013; Sebastiani, 2002).

    자연어 처리의 대상이 되는 텍스트는 목적에 따라 다양한 형태로 표현될 수 있지만, 일반적으로 벡터공간모델(Vector Space Model)을 이용하여 표현한다(Salton et al., 1975).

  20. Shin, C. H., J. W.Lee, H. N. Yang, and I. Y. Choi, "The Research on Recommender for New Customers Using Collaborative Filtering and Social Network Analysis," Journal of Intelligence and Information Systems, Vol. 18, No.4(2012), 19-42. 

    인용구절

    인용 구절

    터넷 보급이 늘어나고 활성화 되면서 웹을 통한 쇼핑으로 고객들의 구매패턴이 변화하고 있다(Shin et al. 2012).

  21. Statista, Number of apps available in leading app stores as of July 2014, 2015. Available at http://www.statista.com/statistics/276623/number-of-apps-available-in-leading-app-stores/ (Downloaded 11 May, 2015). 

    인용구절

    인용 구절

    2014년 7월 기준으로 애플 앱 스토어에는 120만종, 구글 플레이에는 무려 130만 종 가량의 앱이 제공(Statista, 2015)되고 있는데, 이처럼 과도하게 많은 앱이 현재 제공되고 있어 사용자에게 적절한 앱을 추천해 줄 수 있는 추천 시스템의 개발은 실무적으로 대단히 중요한 의미가 있다.

  22. Wang, Y., Y. Liu, and X. Yu, "Collaborative Filtering with Aspect-Based Opinion Mining: A Tensor Factorization Approach," Proceedings of 2012 IEEE 12th International Conference on Data Mining (ICDM), Brussels, Belgium, (2012), 1152-1157. 

    인용구절

    인용 구절

    Wang et al.(2012)은 Jacob et al.(2009)이 제안한 추천 알고리즘의 기본 틀을 그대로 채택하되, 텐서 분해(tensor factorization)라는 새로운 기법을 통해 보다 효과적으로 사용자의 평가점수를 예측할 수 있는 방법을 제안하였다.

    이 연구의 경우, Jacob et al.(2009)이나 Wang et al.(2012)과 달리 메모리 기반 추천 시스템을 제안하여 구현이 용이하고, 예측 정확도가 상대적으로 우수하다는 장점을 갖고 있다.

  23. Witten, I. H., Text Mining: Practical Handbook of Internet Computing, CRC press, 2004. 

    인용구절

    인용 구절

    텍스트는 가장 보편화된 정보를 표현하고 전달하는 수단으로, 인류의 역사가 진행되는 동안 축적되어 온 방대한 양의 지식들이 지금껏 텍스트 형태로 저장되어 왔다(Witten, 2004).

  24. You, M., J.-S. Park, and J.-K. Kim, "Folder Recommendation Based on User Knowledge," Journal of Intelligence and Information System, Vol. 10, No. 3(2004), 133-146. 

    인용구절

    인용 구절

    TF-IDF 가중치는 문서의 핵심어를 추출하거나, 검색 엔진에서 검색 결과의 순위를 결정할 때, 혹은 문서 간 유사도를 산출하는 등의 용도로 사용될 수 있다(Salton and McGill, 1986; You et al. 2004).

  25. Zhang, Z., D. Zhang, and J. Lai, "urCF: User Review Enhanced Collaborative Filtering," Proceedings of the 20th Americas Conference on Information Systems, (2014). 

    인용구절

    인용 구절

    이처럼 정량적이고 명시적인 상품에 대한 평점이나 구매 여부와 같은 정보는 수리적으로 처리하기 쉽다는 장점이 있지만, 과연 이러한 정보들이 진정으로 고객의 선호체계를 대표할 수 있는가에 대해서는 의문이 제기되고 있다(Zhang et al., 2014).

    가장 최근에 발표된 Zhang et al.(2014)은 urCF(User Review enhanced Collaborative Filtering)이라는 이름의 메모리 기반 추천 시스템을 제안하였다.

  26. Zhou, L. and P. Chaovalit, , "Ontology-Supported Polarity Mining," Journal of the American Society for Information Science and Technology, Vol. 59, No. 1(2008), 98-110. 

    상세보기 crossref
    인용구절

    인용 구절

    이들은 Zhou and Chaovalit (2008)의 영화 리뷰 온톨로지에 기반하여 총 32개의 영화 리뷰 특징을 도출한 뒤, 각 특징별 사용자 의견의 극성(opinion orientation)을 추가로 반영하여 보다 정밀하게 사용자 간 유사도를 산출하고자 하였다.

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로