정보 필터링은 사용자에게 유익한 항목 (문서, 웹페이지, 영화 등)들을 제시하여 줌으로써 사용자의 정보에 대한 부담을 줄일 수 있다. 이러한 정보 필터링 방법은 내용기반 필터링과 사회기반 필터링 방법으로 분류할 수 있다. 사회기반 필터링은 유사한 성향을 갖는 타인의 평가정보에 기초하며 내용기반 필터링은 항목의 내용에 기반을 둔다. 이 두 방법 모두 사용자 관심사에 대한 모델링이 요구되며, 모델링이 정확할수록 더 좋은 필터링 결과를 얻을 수 있다. 이러한 측면에서, 본 연구에서는 내용기반 필터링과 사회기반 필터링을 위한 새로운 사용자
정보 필터링은 사용자에게 유익한 항목 (문서, 웹페이지, 영화 등)들을 제시하여 줌으로써 사용자의 정보에 대한 부담을 줄일 수 있다. 이러한 정보 필터링 방법은 내용기반 필터링과 사회기반 필터링 방법으로 분류할 수 있다. 사회기반 필터링은 유사한 성향을 갖는 타인의 평가정보에 기초하며 내용기반 필터링은 항목의 내용에 기반을 둔다. 이 두 방법 모두 사용자 관심사에 대한 모델링이 요구되며, 모델링이 정확할수록 더 좋은 필터링 결과를 얻을 수 있다. 이러한 측면에서, 본 연구에서는 내용기반 필터링과 사회기반 필터링을 위한 새로운 사용자 모델링 방법에 대해 연구하였다. 1차년도에는 사용자가 관심을 갖는 문서들에서 사용자 관심사를 추출하는 방법에 초점을 두었다. 이를 위해 용어 빈도수, 문헌 빈도수, 역문헌 빈도수 정보를 바탕으로 퍼지추론을 통해 사용자 관심사를 추출하는 방법에 대해 연구하였다. 그리고 이러한 방법의 성능을 개선하기 위해 퍼지추론과 연관 피드백 방법을 결합하는 방법에 대해서도 연구하였다. 2차년도에는 추천 시스템의 핵심 요소 중의 하나인 사회기반 필터링 방법에 초점을 두어 연구하였다. 사회기반 필터링 방법은 현재 많은 상용화 추천시스템에서 성공적으로 사용되고 있다. 하지만, 기존 사회기반 필터링 방법은 내용기반 필터링에서 사용자 관심사를 표현하기 위해 사용하는 내용 정보를 이용하지 않고 항목에 대한 평가 정보만을 이용하여 사용자의 관심사를 모델링하기 때문에 시스템 성능이 전적으로 이에 의존하는 문제점을 갖고 있다. 따라서, 2차년도에는 항목에 대한 평가정보와 내용 정보(사용자 프로파일)를 같이 이용하는 새로운 형태의 사회기반 필터링 방법에 대해 연구하였다. 1차년도에 초점을 두어 연구한 내용은 다른 각도에서 보면 관심 문서들의 벡터들로부터 대표벡터를 얻어내는 문제로 해석 가능하다. 따라서, 본 연구에서는 본 제안 방법의 유용성을 보이기 위하여 널리 알려진 두 방법 - Roccio 방법, Widrow-Hoff 방법 -과의 성능 비교를 하였다. 객관적 비교를 위해 Reuters-21578문서집합을 이용하였다. 실험 결과, 퍼지 추론만을 사용할 경우에는 기존 방법에 비해 성능 개선이 거의 없었으나 추가로 연관 피드백 방법을 이용하였을 경우에는 상당한 성능 향상이 있었다. 따라서, 본 제안 방법이 기존 내용기반 필터링 시스템이나 개인화 에이전트 시스템에서 사용자 프로파일을 구성하고 유지하는데 효과적으로 쓰일 수 있을 것으로 기대된다. 2차년도에 제안한 방법의 유용성을 평가하기 위해 영화 추천 시스템을 구현하였으며 MovieLens 데이터를 이용하여 그 성능을 평가하였다. 평가 결과, 기존 전통적인 사회기반 필터링 또는 협력 필터링 방법에 비해 좋은 성능을 보였다. 특히, 새로운 사용자 문제에 대해서 좋은 결과를 보였다. 본 제안 방법 자체만으로도 기존추천 시스템의 추천 질을 향상시키는 데 기여할 수 있으며, 1차년도에 제안한 방법과 같이 사용된다면 더 좋은 추천 결과를 얻을 수 있을 것이다.
Abstract▼
Information filtering attempts to alleviate information overload by identifying which items a user will find worthwhile. Information filtering (IF) techniques can be classified as two categories, content-based filtering (CBF) and social filtering (SF). SF focuses on identification of other users wit
Information filtering attempts to alleviate information overload by identifying which items a user will find worthwhile. Information filtering (IF) techniques can be classified as two categories, content-based filtering (CBF) and social filtering (SF). SF focuses on identification of other users with similar tastes while IF focuses on the analysis of item content. CBF and SF techniques require user modeling to acquire user's information needs or preferences. The more precise user's model is, the better performance can be obtained. So, in this project, we have tried to suggest new user modeling approaches for CBF and SF. In the first year, we addressed how to capture a user's information needs more precisely from the documents that user had been interested in. To this end, we applied fuzzy inference mechanism to extract a user's information needs from given documents based on the information such as the term frequency, the document frequency and the inverse document frequency. For further improvement of our approach, a new approach that combines fuzzy inference mechanism and the relevance feedback techniques have been also studied. During the second year, we focused on the social filtering technique that is an essential part of recommender systems. SF techniques have been used successfully in many commercial systems. However, they model a user's preference only based on rating information of other users having similar tastes without considering content-based information (for example, user profile). So, the performance of system depends on human ratings. To overcome the limitation of SF, we have studied on a new style of SF where a user's preferences are modeled based on not only rating information but also content information. The problem addressed in the first year can be viewed as the one of calculating a representative vector of document vectors. So, to show the usefulness of our approaches, we compared them with two famous methods - Rocchio and Widrow-Hoff - on the Reuters-21578 data set. The results show that our approach that uses solely fuzzy inference is not better than the other approaches. But, our second approach using the relevance feedback techniques together with fuzzy inference outperforms the others. This approach would be used effectively in constructing and maintaining user profiles in CBF systems or personalized agent systems. For evaluating the user modeling method suggested in the second year, a recommender system for movie was implemented and tested on the MovieLens data. The result shows that our approach is better than traditional SF, especially when new users are concerned. The approach itself would contribute to improvement of quality of recommender systems. Better quality can be achieved if the user modeling techniques developed in the first year will be used together.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.