사용자 간 신뢰관계 네트워크 분석을 활용한 협업 필터링 알고리즘의 예측 정확도 개선 Enhancing Predictive Accuracy of Collaborative Filtering Algorithms using the Network Analysis of Trust Relationship among Users원문보기
협업 필터링(Collaborative Filtering)은 유용성과 정교성 면에서 가장 성공적인 추천 알고리즘으로 평가받으며 산업계나 학계에서 많이 활용 및 연구되고 있지만, 기본적으로 사용자들이 평가한 점수에만 기반하여 추천결과를 생성하는 한계점이 있다. 이에 본 연구는 사용자가 상품을 구매할 때 자신이 신뢰하는 타인의 추천을 더 적극적으로 수용할 것이라는 점에 착안하여, 사용자의 평점 외에 사용자 간 신뢰관계를 소셜네트워크분석으로 분석한 결과를 추가로 반영하는 추천 알고리즘들을 제안하였다. 구체적으로 본 연구에서는 소셜네트워크분석에서 네트워크 내의 중심적 위치를 나타내는 척도인 내향 및 외향 중심성을 활용하여 사용자 간 유사도를 산출하는 알고리즘들과 사용자 신뢰 네트워크를 탐색하여 추천 대상이 되는 사용자가 직접 간접적으로 신뢰하는 사용자의 평가점수를 보다 높게 반영하는 알고리즘을 제안한 뒤 그 성능을 비교해 보았다. 실제 데이터에 적용하여 분석한 결과, 사용자 신뢰 네트워크의 내향 중심성 지수를 조건 없이 적용한 경우에는 오히려 정확도의 감소만을 야기하는 것으로 나타났고, 일정 임계치 이상의 외향 중심성을 갖는 사용자에 한해 내향 중심성 지수를 고려한 추천 알고리즘은 전통적인 협업 필터링에 비해 약간의 정확도 개선이 이루어짐을 확인할 수 있었다. 아울러, 사용자 신뢰 네트워크를 기반으로 탐색하는 알고리즘이 가장 우수한 성능을 보이는 것을 알 수 있었으며, 전통적인 협업 필터링과 비교해서도 통계적으로 유의한 수준의 정확도의 개선이 이루어짐을 확인할 수 있었다.
협업 필터링(Collaborative Filtering)은 유용성과 정교성 면에서 가장 성공적인 추천 알고리즘으로 평가받으며 산업계나 학계에서 많이 활용 및 연구되고 있지만, 기본적으로 사용자들이 평가한 점수에만 기반하여 추천결과를 생성하는 한계점이 있다. 이에 본 연구는 사용자가 상품을 구매할 때 자신이 신뢰하는 타인의 추천을 더 적극적으로 수용할 것이라는 점에 착안하여, 사용자의 평점 외에 사용자 간 신뢰관계를 소셜네트워크분석으로 분석한 결과를 추가로 반영하는 추천 알고리즘들을 제안하였다. 구체적으로 본 연구에서는 소셜네트워크분석에서 네트워크 내의 중심적 위치를 나타내는 척도인 내향 및 외향 중심성을 활용하여 사용자 간 유사도를 산출하는 알고리즘들과 사용자 신뢰 네트워크를 탐색하여 추천 대상이 되는 사용자가 직접 간접적으로 신뢰하는 사용자의 평가점수를 보다 높게 반영하는 알고리즘을 제안한 뒤 그 성능을 비교해 보았다. 실제 데이터에 적용하여 분석한 결과, 사용자 신뢰 네트워크의 내향 중심성 지수를 조건 없이 적용한 경우에는 오히려 정확도의 감소만을 야기하는 것으로 나타났고, 일정 임계치 이상의 외향 중심성을 갖는 사용자에 한해 내향 중심성 지수를 고려한 추천 알고리즘은 전통적인 협업 필터링에 비해 약간의 정확도 개선이 이루어짐을 확인할 수 있었다. 아울러, 사용자 신뢰 네트워크를 기반으로 탐색하는 알고리즘이 가장 우수한 성능을 보이는 것을 알 수 있었으며, 전통적인 협업 필터링과 비교해서도 통계적으로 유의한 수준의 정확도의 개선이 이루어짐을 확인할 수 있었다.
Among the techniques for recommendation, collaborative filtering (CF) is commonly recognized to be the most effective for implementing recommender systems. Until now, CF has been popularly studied and adopted in both academic and real-world applications. The basic idea of CF is to create recommendat...
Among the techniques for recommendation, collaborative filtering (CF) is commonly recognized to be the most effective for implementing recommender systems. Until now, CF has been popularly studied and adopted in both academic and real-world applications. The basic idea of CF is to create recommendation results by finding correlations between users of a recommendation system. CF system compares users based on how similar they are, and recommend products to users by using other like-minded people's results of evaluation for each product. Thus, it is very important to compute evaluation similarities among users in CF because the recommendation quality depends on it. Typical CF uses user's explicit numeric ratings of items (i.e. quantitative information) when computing the similarities among users in CF. In other words, user's numeric ratings have been a sole source of user preference information in traditional CF. However, user ratings are unable to fully reflect user's actual preferences from time to time. According to several studies, users may more actively accommodate recommendation of reliable others when purchasing goods. Thus, trust relationship can be regarded as the informative source for identifying user's preference with accuracy. Under this background, we propose a new hybrid recommender system that fuses CF and social network analysis (SNA). The proposed system adopts the recommendation algorithm that additionally reflect the result analyzed by SNA. In detail, our proposed system is based on conventional memory-based CF, but it is designed to use both user's numeric ratings and trust relationship information between users when calculating user similarities. For this, our system creates and uses not only user-item rating matrix, but also user-to-user trust network. As the methods for calculating user similarity between users, we proposed two alternatives - one is algorithm calculating the degree of similarity between users by utilizing in-degree and out-degree centrality, which are the indices representing the central location in the social network. We named these approaches as 'Trust CF - All' and 'Trust CF - Conditional'. The other alternative is the algorithm reflecting a neighbor's score higher when a target user trusts the neighbor directly or indirectly. The direct or indirect trust relationship can be identified by searching trust network of users. In this study, we call this approach 'Trust CF - Search'. To validate the applicability of the proposed system, we used experimental data provided by LibRec that crawled from the entire FilmTrust website. It consists of ratings of movies and trust relationship network indicating who to trust between users. The experimental system was implemented using Microsoft Visual Basic for Applications (VBA) and UCINET 6. To examine the effectiveness of the proposed system, we compared the performance of our proposed method with one of conventional CF system. The performances of recommender system were evaluated by using average MAE (mean absolute error). The analysis results confirmed that in case of applying without conditions the in-degree centrality index of trusted network of users(i.e. Trust CF - All), the accuracy (MAE = 0.565134) was lower than conventional CF (MAE = 0.564966). And, in case of applying the in-degree centrality index only to the users with the out-degree centrality above a certain threshold value(i.e. Trust CF - Conditional), the proposed system improved the accuracy a little (MAE = 0.564909) compared to traditional CF. However, the algorithm searching based on the trusted network of users (i.e. Trust CF - Search) was found to show the best performance (MAE = 0.564846). And the result from paired samples t-test presented that Trust CF - Search outperformed conventional CF with 10% statistical significance level. Our study sheds a light on the application of user's trust relationship network information for facilitating electronic commerce by recommending
Among the techniques for recommendation, collaborative filtering (CF) is commonly recognized to be the most effective for implementing recommender systems. Until now, CF has been popularly studied and adopted in both academic and real-world applications. The basic idea of CF is to create recommendation results by finding correlations between users of a recommendation system. CF system compares users based on how similar they are, and recommend products to users by using other like-minded people's results of evaluation for each product. Thus, it is very important to compute evaluation similarities among users in CF because the recommendation quality depends on it. Typical CF uses user's explicit numeric ratings of items (i.e. quantitative information) when computing the similarities among users in CF. In other words, user's numeric ratings have been a sole source of user preference information in traditional CF. However, user ratings are unable to fully reflect user's actual preferences from time to time. According to several studies, users may more actively accommodate recommendation of reliable others when purchasing goods. Thus, trust relationship can be regarded as the informative source for identifying user's preference with accuracy. Under this background, we propose a new hybrid recommender system that fuses CF and social network analysis (SNA). The proposed system adopts the recommendation algorithm that additionally reflect the result analyzed by SNA. In detail, our proposed system is based on conventional memory-based CF, but it is designed to use both user's numeric ratings and trust relationship information between users when calculating user similarities. For this, our system creates and uses not only user-item rating matrix, but also user-to-user trust network. As the methods for calculating user similarity between users, we proposed two alternatives - one is algorithm calculating the degree of similarity between users by utilizing in-degree and out-degree centrality, which are the indices representing the central location in the social network. We named these approaches as 'Trust CF - All' and 'Trust CF - Conditional'. The other alternative is the algorithm reflecting a neighbor's score higher when a target user trusts the neighbor directly or indirectly. The direct or indirect trust relationship can be identified by searching trust network of users. In this study, we call this approach 'Trust CF - Search'. To validate the applicability of the proposed system, we used experimental data provided by LibRec that crawled from the entire FilmTrust website. It consists of ratings of movies and trust relationship network indicating who to trust between users. The experimental system was implemented using Microsoft Visual Basic for Applications (VBA) and UCINET 6. To examine the effectiveness of the proposed system, we compared the performance of our proposed method with one of conventional CF system. The performances of recommender system were evaluated by using average MAE (mean absolute error). The analysis results confirmed that in case of applying without conditions the in-degree centrality index of trusted network of users(i.e. Trust CF - All), the accuracy (MAE = 0.565134) was lower than conventional CF (MAE = 0.564966). And, in case of applying the in-degree centrality index only to the users with the out-degree centrality above a certain threshold value(i.e. Trust CF - Conditional), the proposed system improved the accuracy a little (MAE = 0.564909) compared to traditional CF. However, the algorithm searching based on the trusted network of users (i.e. Trust CF - Search) was found to show the best performance (MAE = 0.564846). And the result from paired samples t-test presented that Trust CF - Search outperformed conventional CF with 10% statistical significance level. Our study sheds a light on the application of user's trust relationship network information for facilitating electronic commerce by recommending
본 연구에서는 사용자들의 영화 평점만을 활용해 추천 결과를 생성하는 기존의 협업 필터링을 개선하기 위해, 신뢰 기반 사용자 네트워크를 추가로 고려하여 협업 필터링의 성능 높일 수 있는 새로운 추천 알고리즘을 제안하였다. 구체적으로, 사용자의 신뢰관계 네트워크에서 내향 연결정도 중심성을 고려하여 유사도를 확대하거나 혹은 외향 연결정도 중심성이 특정 임계치 이상인 사용자에 한하여 이웃 사용자의 내향 연결정도 중심성을 활용하는 방법, 마지막으로 네트워크를 직접적으로 탐색하여 직접적 및 간접적 신뢰관계를 반영하는 3가지 접근법을 제시하였다.
제안 방법
대다수의 추천 시스템 연구에서 사용되어 온 평점 데이터에만 의존하지 않고, 오늘날 중요성이 크게 대두되고 있는 사용자 간 신뢰관계 네트워크 데이터를 활용하여 예측 성능을 제고하는 새로운 접근법을 제시하였다는 점은 기존 연구와 본 연구가 크게 차별화되는 부분이라고 할 수 있다. 특히 기존 연구에서 시도되지 않았던 내·외향 중심성을 차별적으로 적용하는 방법론을 새롭게 제안하여 그 가능성을 확인한 점과 직·간접 신뢰관계를 반영하여 유의미하게 기존 CF의 예측 정확도를 개선할 수 있는 방안을 제시한 점은 본 연구가 갖는 중요한 학술적 의의라 생각된다.
본 연구에서 새롭게 제안하는 추천 알고리즘은 단순히 상품에 대한 사용자 평가점수의 유사성만을 고려한 것이 아니라, 사용자들 사이에서 신뢰하는 사용자를 나타내는 데이터를 활용하여, 사용자 간 신뢰관계까지 함께 고려할 수 있도록 설계되었다. 이 때, 신뢰관계 데이터를 분석하기 위해서 소셜네트워크분석 기술을 사용하였다.
본 연구에서는 소셜네트워크분석을 활용한 신뢰 네트워크 데이터를 추가로 반영하여, 전통적인 협업 필터링의 성능을 개선할 수 있는 새로운 추천 알고리즘을 제안한다. 본 연구의 제안 알고리즘은 [Figure 2]와 같이 총 5단계로 구성된다.
대상 데이터
본 연구에서 제안하는 추천 알고리즘들의 예측 정확도를 확인하기 위하여 LibRec으로부터 제공받은 데이터를 사용해 실험을 수행한다. 제공된 연구데이터는 사용자들의 영화 선호도 평가점수 자료와 사용자 간 신뢰관계 네트워크에 대한 자료이다(Golbeck, 2006).
제공된 연구데이터는 사용자들의 영화 선호도 평가점수 자료와 사용자 간 신뢰관계 네트워크에 대한 자료이다(Golbeck, 2006). 영화 선호도 평가 점수 자료는 사용자 ID, 영화 ID, 평점으로 구성되어 있으며, 총 35,497건의 평가 데이터이다. 사용자 간 신뢰관계 데이터는 신뢰하는 사용자 ID, 신뢰받는 사용자 ID로 구성되어 있으며, 방향/이진 네트워크 그래프로 표현이 가능하다.
본 연구에서 제안하는 추천 알고리즘들의 예측 정확도를 확인하기 위하여 LibRec으로부터 제공받은 데이터를 사용해 실험을 수행한다. 제공된 연구데이터는 사용자들의 영화 선호도 평가점수 자료와 사용자 간 신뢰관계 네트워크에 대한 자료이다(Golbeck, 2006). 영화 선호도 평가 점수 자료는 사용자 ID, 영화 ID, 평점으로 구성되어 있으며, 총 35,497건의 평가 데이터이다.
데이터처리
본 연구에서 제안하는 추천 알고리즘에 대한 다양한 접근법들(Trust CF-All, Trust CFConditional, Trust CF-Search)의 유용성을 확인하기 위하여, 본 연구에서는 사용자 간 신뢰관계 네트워크 데이터에 UCINET 6를 이용하여 내향 및 외향 중심성 지수를 산출하고, Microsoft Excel VBA로 프로그램된 별도의 SW를 활용하여 사용자 간 직접 및 간접 신뢰관계를 나타내는 사용자-사용자 간 신뢰관계 행렬(User-to-User Trust Matrix)을 산출하였다. 아울러, 신뢰관계를 가중하여 사용자 간 유사도를 산출하는 본 연구의 제안 알고리즘 역시 Microsoft Excel VBA로 실험용 소프트웨어를 구현하여 실험하였다.
이론/모형
본 연구에서는 사용자의 평가점수가 입력된 영화에 대해서 제안한 추천 알고리즘으로 예상평가점수를 도출한 다음, 실제 평가점수와 비교했을 때 평균 오차가 가장 적은 추천 알고리즘이 무엇인지를 확인해보는 방식으로 검증을 진행하였다(Kim and Kim 2014). 이 때, 점수 간의 오차는 추천 시스템 관련 연구에서 가장 많이 사용되는 척도인 평균 MAE(Mean Absolute Error)를 활용하였다(Breese et al., 1998; Sarwar et al., 2001).
성능/효과
Trust CF-Conditional은 전통적인 CF와도 통계적으로 유의한 수준의 성능 차이를 나타내지 못하고 있는 것으로 나타났다. 결과적으로, 제안된 3가지 알고리즘 중에서는 오로지 Trust CF-Search만 전통적인 CF와 비교해 다소 유의한 성과 개선이 이루어짐을 확인할 수 있었다.
그 결과, 두 번째와 세 번째 접근법이 전통적인 CF에 비해 더 우수한 예측 정확도를 보인다는 사실과 그 중에서도 세 번째 접근법이 가장 우수한 추천 성능을 보인다는 사실을 확인할 수 있었다. 그리고 이를 통해 소셜네트워크 데이터를 추천알고리즘에 반영할 경우 사용자 간의 신뢰관계를 직접적으로 탐색한 결과를 고려하는 것이 예측의 효과성을 제고하는데 있어 가장 좋은 대안임을 제시하였다.
이상 소개한 세 가지 접근법의 예측 정확도와 비교 기법인 전통적인 CF의 예측 정확도를 종합적으로 정리한 결과가 다음의 [Table 4]에 제시되어 있다. 이 표를 통해서 알 수 있듯이, Trust CF-All < 전통적인 CF < Trust CF-Conditional < Trust CF-Search 순으로 예측 정확도가 산출됨을 알 수 있다.
후속연구
하지만, 본 연구에서 예측 정확도를 유의미하게 개선하는 것으로 나타난 ‘Trust CF-Search’의 경우, 사용자간 유사도를 계산할 때 마다 매번 사용자 신뢰관계 네트워크를 탐색해야 하므로 다른 접근법에 비해 훨씬 많은 컴퓨팅 자원을 요구하게 된다. 따라서 Trust CF-Search의 효율성을 개선하기 위한 후속 연구가 추후 이루어져야 할 것으로 보인다. 또한, Trust CF-Search에서는 현재 중개인이 1명인 경우에 한해서만 간접 신뢰관계를 정의하여 사용하고 있는데, 중개인이 2명이상인 간접 신뢰관계까지 고려하면 더 높은 예측 정확도를 얻을 가능성이 있다.
따라서 Trust CF-Search의 효율성을 개선하기 위한 후속 연구가 추후 이루어져야 할 것으로 보인다. 또한, Trust CF-Search에서는 현재 중개인이 1명인 경우에 한해서만 간접 신뢰관계를 정의하여 사용하고 있는데, 중개인이 2명이상인 간접 신뢰관계까지 고려하면 더 높은 예측 정확도를 얻을 가능성이 있다. 때문에 이러한 부분에 대한 확장 연구 역시 추후 필요할 것으로 판단된다.
끝으로 현재 제안된 연구 모형에는 임계치(p), 승수(µ) 등 실험자가 임의로 설정해야 할 변수들이 포함되어 있다. 이러한 변수들의 값을 최적화하기 위한 방법 역시 의미 있는 후속 연구의 주제가 될 것으로 예상된다.
질의응답
핵심어
질문
논문에서 추출한 답변
협업 필터링 추천 시스템은 무엇인가?
협업 필터링 추천 시스템은 상품에 대한 사용자들의 평가 데이터를 가지고 추천의 대상이 되는 사용자와 선호도가 유사한 즉, 평가 패턴이 비슷한 사용자들(이웃)을 식별한 후, 과거에 구매했거나 선호했던 상품들 중 추천 대상자에게 적합한 상품을 추천하는 시스템이다. 협업 필터링 기반의 추천 시스템을 구현하는 과정에서 가장 중요한 것은 추천 대상자와 유사한 선호도 패턴을 보이는 사용자가 누구인지를 정확하게 식별하는 것이다.
추천 시스템에 적용되는 알고리즘은 어떻게 추천결과를 생성하는가?
추천 시스템에 적용되는 알고리즘에는 크게 내용기반 필터링(Content-based filtering, CB)과 협업 필터링(Collaborative Filtering, CF)이 있다. 내용 기반 필터링은 상품 간의 유사성(item-to-item similarity)을 기반으로 하여 추천 결과를 생성하지만, 협업 필터링은 사용자 간 유사성(user-to-user similarity)에 따라 추천결과를 생성한다. 협업 필터링이 내용기반 필터링 보다 상대적으로 우수한 추천 정확도를 보이기 때문에 가장 대표적인 추천 기법으로 알려져 있다(Kim and Ahn, 2009; Kim and Ahn 2011).
협업 필터링 알고리즘의 한계점은 무엇인가?
협업 필터링(Collaborative Filtering)은 유용성과 정교성 면에서 가장 성공적인 추천 알고리즘으로 평가받으며 산업계나 학계에서 많이 활용 및 연구되고 있지만, 기본적으로 사용자들이 평가한 점수에만 기반하여 추천결과를 생성하는 한계점이 있다. 이에 본 연구는 사용자가 상품을 구매할 때 자신이 신뢰하는 타인의 추천을 더 적극적으로 수용할 것이라는 점에 착안하여, 사용자의 평점 외에 사용자 간 신뢰관계를 소셜네트워크분석으로 분석한 결과를 추가로 반영하는 추천 알고리즘들을 제안하였다.
참고문헌 (21)
Breese, J. S., D. Heckerman and C. Kadie, "Empirical analysis of predictive algorithms for collaborative filtering," Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence, 1998, 43-52.
Chen, P.-Y., S. Dhanasobhon and M. D. Smith, "An Analysis of the Differential Impact of Reviews and Reviewers at Amazon.Com," Proceedings of International Conference on Information Systems(ICIS), 2007.
Cho, Y. and J. Bang, "Social network analysis for new product recommendation," Journal of Intelligence and Information Systems, Vol.15, No.4(2009), 183-200.
Golbeck, J., "Generating predictive movie recommendations from trust in social networks," Proceedings of the 4th International Conference on Trust Management, Lecture Notes in Computer Science, Vol. 3986, 2006, 93-104.
Herlocker, J., J. Konstan, A. Borchers and J. Riedl, "An Algorithm Framework for Performing Collaborative Filtering," Proceedings of the 22nd Annual International ACMSIGIR Conference on Research and Development in information Retrieval, 1999, 230-237.
Jeon, B. K. and H. Ahn, "A Collaborative Filtering System Combined with Users' Review Mining: Application to the Recommendation of Smartphone Apps," Journal of Intelligence and Information Systems, Vol.21, No.2(2015), 1-18.
Jeong, J.-H. and J.-W. Kim, "Collaborative Filtering Techniques Using Social Network Analysis for UCC Recommendation," Journal of Intelligence and Information Systems, Vol.11, No.1(2013), 185-195.
Kim, K.-J. and H. Ahn, "Hybrid recommender systems using cluster-indexing collaborative filtering and soial network analysis," Proceedings of the 2010 Fall Conference of the Korean Society of Management Information Systems, 2010, 604-609.
Kim, K.-J. and H. Ahn, "User-Item Matrix Reduction Technique for Personalized Recommender Systems," Journal of Information Technology Application & Management, Vol.16, No.1(2009), 97-113.
Kim, K.-J. and H. Ahn, "Collaborative Filtering with a User-Item Matrix Reduction Technique for Recommender Systems," International Journal of Electronic Commerce, Vol.16, No.1(2011), 107-128.
Kim, M. G. and K.-J. Kim, "Recommender Systems using Structural Hole and Collaborative Filtering," Journal of Intelligence and Information System, Vol.20, No.4(2014), 107-120.
Kim, M. S. and I. Im, "Resolving the 'Gray sheep' Problem Using Social Network Analysis (SNA) in Collaborative Filtering (CF) Recommender Systems," Journal of Intelligence and Information System, Vol.20, No.2(2014), 137-148.
Kwahk, K. Y., Social Network Analysis, Cheongram, 2014.
Lee, J. S. and S. D. Park, "Performance Improvement of a Movie Recommendation System using Genre-wise Collaborative Filtering," Journal of Intelligence and Information Systems, Vol.13, No.4(2007), 65-78.
Liu, F. and H. J. Lee, "Use of social network information to enhance collaborative filtering performance," Expert Systems with Applications, Vol.37, No.7(2010), 4772-4778.
Park, J. H., Y. H. Cho and J. K. Kim, "Social network: a novel approach to new customer recommendations," Journal of Intelligence and Information Systems, Vol.15, No.1(2009), 123-140.
Park, J. H. and K.-Y. Kwahk, "The Effect of Patent Citation Relationship on Business Performance: A Social Network Analysis Perspective," Journal of Intelligence and Information Systems, Vol.19, No.3(2013), 127-139.
Sarwar, B., G. Karypis, J. Konstan and J. Riedl, "Item-based collaborative filtering recommendation algorithms," Proeeding of the 10th International Conference on World Wide Web, 2001, 285-295.
Shinha, R. and K. Swearingen, "Comparing recommendations made by online systems and friends," Proceedings of the DELOS-NSF Workshop on Personalization and Recommender Systems in Digital Libraries, 2001.
Sohn, D. W., Social Network Analysis, Kyungmoon Publishing, 2002.
Zhang, Z., D. Zhang and J. Lai, "urCF: User Review Enhanced Collaborative Filtering," Proceedings of the 20th Americas Conference on Information Systems, 2014.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.