대부분의 추천 시스템에서는 개인의 선호 정보를 바탕으로 한 내용-기반 추천 기법과 다른 사람들로부터의 추천을 기반으로 한 사회적 추천 기법을 사용한다. 이들 두 기법은 각각 장단점을 갖고 있으며, 서로 경쟁 관계에 있다기보다 상호 보완적인 성격을 갖고 있다. 이에 두 기법의 적절한 조합이 전체 추천 시스템의 질을 결정하는 관건이 된다. 본 논문에서는 사용자 개인마다 각 기법에 대한 만족도와 의존도가 다름을 밝히고, 이러한 각 개인의 경향에 따라 여러 추천 기법의 결과를 개인별로 조합해 주는 기법을 제안하였다. 각 개인의 경향을 나타내는 척도로 충성도, 다양도, 전문가도 둥의 척도를 정의하여 사용하였으며, 이 원리에 의해 동작하는 조합 엔진의 결과는 최고 40%, 평균 23%의 coverage 개선 효과를 나타내었다.
대부분의 추천 시스템에서는 개인의 선호 정보를 바탕으로 한 내용-기반 추천 기법과 다른 사람들로부터의 추천을 기반으로 한 사회적 추천 기법을 사용한다. 이들 두 기법은 각각 장단점을 갖고 있으며, 서로 경쟁 관계에 있다기보다 상호 보완적인 성격을 갖고 있다. 이에 두 기법의 적절한 조합이 전체 추천 시스템의 질을 결정하는 관건이 된다. 본 논문에서는 사용자 개인마다 각 기법에 대한 만족도와 의존도가 다름을 밝히고, 이러한 각 개인의 경향에 따라 여러 추천 기법의 결과를 개인별로 조합해 주는 기법을 제안하였다. 각 개인의 경향을 나타내는 척도로 충성도, 다양도, 전문가도 둥의 척도를 정의하여 사용하였으며, 이 원리에 의해 동작하는 조합 엔진의 결과는 최고 40%, 평균 23%의 coverage 개선 효과를 나타내었다.
Many recommender systems are based on Content-based Filtering and Social Filtering Both methods have their own advantages and disadvantages, and they complement each other rather than compete. So incorporating of both methods can make the better system and combination technique controls the quality ...
Many recommender systems are based on Content-based Filtering and Social Filtering Both methods have their own advantages and disadvantages, and they complement each other rather than compete. So incorporating of both methods can make the better system and combination technique controls the quality of the entire recommender system. In this paper, we presented each user has his own tendency to decide which is the better recommendation for himself among the various recommendation results, and suggested the Personalized combination technique. To represent user tendency, we defined and used loyalty, diversity and pioneerity and showed by experiments that our combination technique is useful. This combination technique improved the average coverage 23% and for the ceiling 40%.
Many recommender systems are based on Content-based Filtering and Social Filtering Both methods have their own advantages and disadvantages, and they complement each other rather than compete. So incorporating of both methods can make the better system and combination technique controls the quality of the entire recommender system. In this paper, we presented each user has his own tendency to decide which is the better recommendation for himself among the various recommendation results, and suggested the Personalized combination technique. To represent user tendency, we defined and used loyalty, diversity and pioneerity and showed by experiments that our combination technique is useful. This combination technique improved the average coverage 23% and for the ceiling 40%.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논昱이 제안할 조합 추천 기법이 효용성을 보이기 위하여, 영화 추천의 도페인 위에서 시스템을 〒축하였다. 본 논문이 주장하는 조합 기법은 원칙적으로 도메인에 제약을 받지 않으나, 현실적으로 가장 쉽게 양질의 자료 및 사용자 정로를 구할 수 있는 영화 도메인에서 동작하는 시스렘울 구축하였다.
많은 웹 사이트들에서 대량의 자체적인 사용자 정보를 보유하지 못하고 다른 곳에서 사용자 정보를 수입해야 하는 현실을 비추어 볼 때, 혼성 시스템 연구 외에, 이미 존재하는 여러 결과 리스트를 결합시켜주는 조합 기법에 대한 보다 깊은 연구가 절실히 필요하다. 본 논문에서는 이러한 측면어】서, 순수 조합 기법 시스템을 제안하고 있다.
똑같이 남의 말에 귀를 잘 기울이는 사람들임에도 불구하고, 어떤 사람들은 비평가 그룹의 견해에 더 공감하기도 하고, 어떤 이는 대중 그룹의 견해에 더 공감하기도 하는 것이 그 예이다. 이 단계는 여러 가지 사회적 추천 결과 사이에서 개인별로 균형점을 잡아주고자 하는데 목적이 있다. 또한, 사용자 본인이나 유사 그룹의 사람들이 평소 멀리 하는 아이템 중에서도 재미있게 받아들일 수 있는 아이템이 있을 것이다.
시스템이다. 이 시스템은 기본적으로 CF 기법에 기반을 두고 있으며, 다른 기법들은 CF 기법의 단점을 보완하기 위한 목적으로 사용되었다.
이 절에서는 본 논문의 동기가 된 사례를 들어, CBF 추천 결과와 CF 추천 결과가 결합되어야 하며, 이들 리스트들을 조합할 때, 개인별로 CF 추천 결과와 CBF 추천 결과의 조합 비율이 달라야 한다는 것을 보이고자 한다. 이를 위해 도메인으로서 영화를 택해서 이야기하기로 하겠다.
가설 설정
전문가도가 높은 사람은 대개 평론가의 추천 리스트를 따르는 경향이 있다는 가정을 세워서 시스템올 구성했다.
제안 방법
[2] 에서 Pazzani는 드물게 Demographic 추천 기법 (DF)의 결과에 주목하였고 CF와 CBF, DF, CF+CBF 의 결합 기법을 실험을 통하여 비교하였다. 그는 CBF, DF에서 얻은 정보를 사용자의 content-profile 행렬로 만들어서 CF 추천 기법을 동작시킬 때 입력으로 사용하는 방법을 제안하였다.
이 시스템은 웹페이지를 추천해주는 시스템으로서, 내용-기반 추천을 제공하기 위해 사용자로부터 프로필을 받아 저장하는 동시에, 사용자 피드백을 받아 프로필을 갱신하였다. 또한 유사한 사용자들을 묶어내기 위해서 프로필을 분석하였다. 그리하여, 사용자가 적고 찾으려는 토픽이 많은 경우에는 주로 내용-기반 추천 기법이 사용되도록 하고, 반대로 사용자가 많고 찾으려는 토픽이 적을 때에는 주로 협업-기반 추천 기법이 동작하도록 되어 있다.
본 논문에서는 Eachmovie[14]에서 제공한 영화 자료 및 사용자 평가 정보와 한국의 최대 영화 데이타베이스사이트 Films[15], 미국의 영화 데이타베이스 사이트 IMDB[16]의 자료를 이용하여 시스템을 구축하였다. 본래 최근의 영화 추천 연구는 대개 Eachmovie dataset 과 IMDB의 자료를 바탕으로 이루어지지만, 한국 사람을 대상으로 실험이 수행되었으므로, 국문으로 된 Films 데이타를 적극 이용하였다.
사회적 기법이 여러 도메인에서 훌륭한 성과를 거두어 온 것이 사실이기는 하지만, 이들은 씨실과 날실이 그러하듯 서로 다른 각도에서 추천 결과를 제공하고 있으며, 우열 관계가 아닌 상호 보완적인 관계에 있다고 보는 것이 타당하다. 본 논문온 자신의 선호 정보에 기반한 내용-기반 추천 방식과 다른 사람들로부터의 사회적 추천 방식에 대한 만족도와 의존도가 개인별로 각각 다름에 착안하여, 사용자 개인별로 내용-기반 추천과 사회적 추천을 적절하게 조합하여 제공하는 시스템을 제안하였다.
본 논문이 제안할 조합 추천 기법의 효용성을 보이기 위하여, 영화 추천의 도메인 위에서 시스템을 구축하였다. 본 논문이 주장하는 조합 기법은 원칙적으로 도메인에 제약을 받지 않으나, 현실적으로 가장 쉽게 양질의 자료 및 사용자 정보를 구할 수 있는 영화 도메인에서 동작하는 시스템을 구축하였다.
본 논문이 주장하는 조합 기법은 원칙적으로 도메인에 제약을 받지 않으나, 현실적으로 가장 쉽게 양질의 자료 및 사용자 정로를 구할 수 있는 영화 도메인에서 동작하는 시스렘울 구축하였다.
본 논문이 주장하는 조합 기법은 원칙적으로 도메인에 제약을 받지 않으나, 현실적으로 가장 쉽게 양질의 자료 및 사용자 정보를 구할 수 있는 영화 도메인에서 동작하는 시스템을 구축하였다.
본 시스템에서는 각 사용자 사이의 상관 계수 문석을 통하여 CF 추천이 이루어지는 알고리즘을 택하였다. 이는 가장 단순한 방법이나 효율적이지는 않다.
본 시스템에서는 전체 집단에 대해 이러한 조사를 하기 어려운 관계로 웹의 검색 엔진에서 검색되는 문서의 수로 awareness 계수 값을 대신하였다.
본 시스템의 궁극적인 Fusion 엔진의 결과를 순수 CBF 엔진의 결과와 순수 CF 엔진의 결과, CF와 CBF 를 단순히 교대로 섞는 단순한 조합 기법의 성능과 비교하였다. 총 자료의 50%는 트레이닝 집합으로 50%는 실험 집합으로 이용하였다.
2000년에 이르러보다 진보된 조합 시스템이 등장하였으며, 논문 [6] 에서 저자는 사용자마다 그리고 아이템마다 각 기법에 대한 의존도가 다름을 발견하였다. 이것에 착안, 저자는 사용자와 아이템들 각 쌍(pair)에 각 기법에 대한 가중치를 부여하여 이 가중치에 따라 두 기법을 조합하는 시스템을 제안하였다. 이것은 본 논문에서 제안하는 시스템과 비슷한 궤도에 있는 첫 작업이라 할 수 있다.
대상 데이터
여기 두 명의 고등학생이 있다. 한 명은 '갑'이라는 여고 2년생이며, 한 명은 고등학교 2학년 남학생으로, 각각의 프로필은 표 1에 주어져 있다.
이론/모형
본 실험에서는 시스템의 전반적인 정확도를 보이기 위한 통계적 방법으로서 일반적으로 가장 많이 쓰이는 정규화 된 평균 절대 오차(NMAE)를 사용하였다. 그리고 상위의 영화들이 얼마나 사용자의 실제 평가와 맞게 추천되었는지를 알아보기 위한 coverage를 계산하여 성능향상을 보였다.
성능/효과
결론적으로 사용자의 개인적 경향이 개인별로 바람직한 각 추천 기법을 결정한다는 전제는 틀리지 않음이 밝혀졌다. 사용자 경향에 기반하여 각 추천 기법을 동적으로 조합하는 기법은 한 쪽의 순수 추천 기법이나 기존의 조합 방법과 비교했을 때 좋은 성능 향상을 가져왔다.
대체로 충성도가 높고 다양도가 높은 사용자들에게 있어서 본 fusion 리스트의 만족도가 보다 좋게 나타났다. 그러나 충성도가 매우 낮은 사용자들에게 있어서 본 fusion엔진은 성능 향상을 크게 보이지 않았다. 또, 본 영화의 수가 많을수록, 긍정적으로 답한 영화가 많을수록 본 시스템의 결과가 좋게 나타나는 것을 관찰할 수 있었다.
차이가 있었다. 대체로 충성도가 높고 다양도가 높은 사용자들에게 있어서 본 fusion 리스트의 만족도가 보다 좋게 나타났다. 그러나 충성도가 매우 낮은 사용자들에게 있어서 본 fusion엔진은 성능 향상을 크게 보이지 않았다.
또 중요한 점으로, 두 번째 fusion 단계의 도입으로 검색 엔진 평가에서 Novelty라 이야기하는 기대하지 않았던 유의미한 추천 결과를 바랄 수 있게 되었으며, CF 의 결과가 조금 부정확한 경우에도 양호한 추천 성능을 보이는 것으로 나타났다. 이는 본 시스템의 2차에 걸친 조합 기법이 온라인 등의 제약 상황에서 CF 모듈의 동작이 여의치 않아도 양질의 추천 결과를 제공할 수 있음을 시사한다
그러나 충성도가 매우 낮은 사용자들에게 있어서 본 fusion엔진은 성능 향상을 크게 보이지 않았다. 또, 본 영화의 수가 많을수록, 긍정적으로 답한 영화가 많을수록 본 시스템의 결과가 좋게 나타나는 것을 관찰할 수 있었다. 이러한 측면에서 볼 때, 본 시스템은 동호회 등에서 쓰이면 좋은 반응을 얻을 것이라생각된다.
마이닝을 이용한 통상적인 CRM의 목적은 고객의 충성도를 굳건히 하고, 고객의 상품 선택 다양도를 높임으로서 매출을 높이는데 있다고 말할 수 있다[13]. 본 논문에서 정의할 '충성도(loyalty)'와 '다양도(diversity)'는 이들 개념과는 다르지만 의미상으로 유사성이 있음을 밝혀둔다.
좋아하리라 예측되는 영화를 추출하는 것이다. 본 시스템에서 사용자에게 배우, 감독, 장르의 리스트와 함께 라디오 버튼 박스를 제공하여 선호 정보로서 좋아하는 장르와 좋아하는 배우, 좋아하는 감독올 입력받았으며, 싫어하는 의사표시는 (-) 점수를 주어 특별히 표시하게 했다.
본 시스템이 제안한 fusion 알고리즘이 추천 결과를향상시켰음을 볼 수 있다. coverage의 경우 상위의 결과일수록 본 fusion 알고리즘이 큰 성과를 거둠을 보여주는데 이는 영화를 조금만 보는 사람에게는 매우 귀중한 기능이라 할 수 있다.
사용자 경향에 기반하여 각 추천 기법을 동적으로 조합하는 기법은 한 쪽의 순수 추천 기법이나 기존의 조합 방법과 비교했을 때 좋은 성능 향상을 가져왔다.
纹 f, z에 해당한다. 여기에서, 이들 3강지 척도가 3차원 취향 공간 상에서 의미적으로 직교(orthogonal同 며 완전(comp论拍)한 성질을 가짐을 직관적으로 시사받올 수 였다
하였다. 즉, 필터봇은 사용자의 선호 정보대로 행동하는 시스템의 또다른 사용자인 것처럼 취급되며, 이런 기작으로 CF 엔진을 돌려 GroupLens의 최종 추천 시스템이 더욱 잘 동작하게 할 수 있었다. 이러한 측면에서, GroupLens 역시 혼성 시스템의 일종이라 할 수도 있다[8].
첫째, CF 기법은 대상 아이템이 상세한 설명 정보를 갖고 있지 않거나, 컴퓨터가 프로세싱하기 어려운 분야의 것이라 해도 문제없이 잘 동작한다. 사용자로부터의 상세한 선호 정보가 없어도 마찬가지로 잘 동작한다.
참고문헌 (16)
Amazon, http://www.amazon.com
M. J. Pazzani. A framework for Collaborative, Content-based and Demographic Filtering. Artificial Intelligence Review, 13(5-6):393-408, 1999
Douglas W. Oard, Gary Marchionini. Conceptual framework for text filtering, Technical Report CS-TR3643, 1996
P. Melville, R. J. Mooney and R. Nagarajan. Content-Boosted Collaborative Filtering. SIGIR 2001
Breese, Heckermen, and Kadie. Emperical analysis of predictive algorithms for collaborative filtering. Technical report, Microsoft Research, October 1998
M. Claypool, A.Gokhale, T. Minranda, P. Murnikov, D. Netes, and M. Sartin. Combining content-based and collaborative filters in an online newspaper. In ACM SIGIR WS on recommender Systems, 1999
M. Balabanovic and Y. Shoham. Fab: Content-based, collaborative recommendation. Communications of the Association of Computing Machinery, 40(3):66-72, 1997
Paul Resnick, Neophytos Iacovou, Mitesh Suchak, Peter Bergstrom, John Riedl, GroupLens: An Open Architecture for Collaborative Filtering of Netnews., Proceedings of ACM 1994 Conference on Computer Supported Cooperative Work
Kevin Kelly, New Rules for the New Economy, Viking, 1998
※ AI-Helper는 부적절한 답변을 할 수 있습니다.