컴퓨터와 웹의 발달은 사람들이 이용할 수 있는 정보의 양을 급격히 늘렸으며, 이로 인해 추천시스템에 대한 수요가 증가하고 있다. 전자도서관에서도 다른 분야와 마찬가지로 개인화 및 추천시스템에 대한 연구가 중요한데, 연구논문 추천시스템에 대한 연구는 극히 제한적으로 이뤄지고 있고, 국내에서는 거의 찾아보기 어려울 정도이다. 본 논문에서는 국내외에서 수행된 추천시스템에 대한 연구를 조사분석하고, 이를 토대로 전자도서관 연구논문 추천시스템 구축방안을 KISTI NDSL을 중심으로 제안한다. 현재 NDSL에서 제공하는 알리미서비스를 암묵적 방식으로 바꾸어서 이용자의 프로파일을 구축할 것과 이용자 및 메모리 기반의 협업 필터링을 병행하여 내용기반의 필터링이 가지는 연구논문 추천에서 신규성이 부족한 단점을 보완할 것을 제안한다. 또한 두 기법을 함께 사용하는 방식과 온톨로지와 분할방식에 의한 필터링을 이용하여 추천 만족도를 높이는 방식에 대해서도 제안한다.
컴퓨터와 웹의 발달은 사람들이 이용할 수 있는 정보의 양을 급격히 늘렸으며, 이로 인해 추천시스템에 대한 수요가 증가하고 있다. 전자도서관에서도 다른 분야와 마찬가지로 개인화 및 추천시스템에 대한 연구가 중요한데, 연구논문 추천시스템에 대한 연구는 극히 제한적으로 이뤄지고 있고, 국내에서는 거의 찾아보기 어려울 정도이다. 본 논문에서는 국내외에서 수행된 추천시스템에 대한 연구를 조사분석하고, 이를 토대로 전자도서관 연구논문 추천시스템 구축방안을 KISTI NDSL을 중심으로 제안한다. 현재 NDSL에서 제공하는 알리미서비스를 암묵적 방식으로 바꾸어서 이용자의 프로파일을 구축할 것과 이용자 및 메모리 기반의 협업 필터링을 병행하여 내용기반의 필터링이 가지는 연구논문 추천에서 신규성이 부족한 단점을 보완할 것을 제안한다. 또한 두 기법을 함께 사용하는 방식과 온톨로지와 분할방식에 의한 필터링을 이용하여 추천 만족도를 높이는 방식에 대해서도 제안한다.
The progress of computers and Web has given rise to a rapid increase of the quantity of the useful information, which is making the demand of recommender systems widely expanding. Like in other domains, a recommender system in a digital library is important, but there are only a few studies about th...
The progress of computers and Web has given rise to a rapid increase of the quantity of the useful information, which is making the demand of recommender systems widely expanding. Like in other domains, a recommender system in a digital library is important, but there are only a few studies about the recommender system of research papers, Moreover none is there in korea to our knowledge. In the paper, we seek for a way to develop the NDSL recommender system of research papers based on the survey of related studies. We conclude that NDSL needs to modify the way to collect user's interests from explicit to implicit method, and to use user-based and memory-based collaborative filtering mixed with contents-based filtering(CF). We also suggest the method to mix two filterings and the use of personal ontology to improve user satisfaction.
The progress of computers and Web has given rise to a rapid increase of the quantity of the useful information, which is making the demand of recommender systems widely expanding. Like in other domains, a recommender system in a digital library is important, but there are only a few studies about the recommender system of research papers, Moreover none is there in korea to our knowledge. In the paper, we seek for a way to develop the NDSL recommender system of research papers based on the survey of related studies. We conclude that NDSL needs to modify the way to collect user's interests from explicit to implicit method, and to use user-based and memory-based collaborative filtering mixed with contents-based filtering(CF). We also suggest the method to mix two filterings and the use of personal ontology to improve user satisfaction.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
향후연구에서는 최근의 NDSL 이용자의 이용 현황과 목적 및 형태를 분석하고, 추천시스템을 구축하여 이용자를 대상으로 만족도를 평가하여 시스템 구성을 구체화 및 최적화 하고자 한다. 또한 전자도서관이 단순히 보관하고 있는 정보를 인덱스하여 검색기능을 제공하는 수동적 서비스 차원을 탈피하여 연구자들의 문제를 직접적으로 해결해 줄 수 있는 능동적 추천시스템의 구축방안을 제안하고자 한다.
그렇지만 필요에 의해서 개발을 진행하는 경우 오히려 기존 연구에 대한 조사분석 과정을 소홀히 하는 경우가 많다. 본 논문에서는 국내외에서 수행된 연구논문 추천 시스템 연구의 결과를 비교분석하여 향후 국내전자도서관 연구논문 추천시스템 개발방향을 제안하고자 한다. 국내에서 연구논문을 서비스하는 대표적인 전자도서관은 국회도서관, 한국교육학술정보원 RISS, 한국과학기술정보연구원 NDSL 등이 있다.
본 논문에서는 국내외에서 수행된 추천시스템에 대한 연구결과와 NDSL 이용자 분포를 분석하여 NDSL의 연구논문 추천시스템 구축방안을 모색해 보았다. 현재 NDSL에서 제공하는 알리미서비스를 암묵적 방식으로 바꾸어서 이용자의 프로파일을 구축할 것과 내용기반의 필터링을 중심으로 이용자 및 메모리 기반의 협업 필터링을 병행하여 연구논문 추천에서 신규성이 부족한 단점을 보완할 것을 제안하였다.
국내에서 연구논문을 서비스하는 대표적인 전자도서관은 국회도서관, 한국교육학술정보원 RISS, 한국과학기술정보연구원 NDSL 등이 있다. 본 논문에서는 특허정보 등 다양한 연구정보를 함께 제공하는 NDSL을 중심으로 연구논문 추천시스템 구축 방안을 모색한다.
본 장에서는 각 추천알고리즘에 대해 간단히 살펴본다. 본 논문은 NDSL 추천시스템 구축 방안에 대한 논리적 접근을 연구의 목적으로 하기 때문에 본 논문에서는 추천시스템 알고리즘은 기본 원리만 살펴본다.
NDSL은 국내 학계, 연구계, 산업계의 모든 연구자들을 위한 해외 학술저널 및 프로시딩 정보제공 포털로서 2008년 6월 현재 6만 3천여 종의 학술저널과 19만 8천 여종의 프로시딩을 서비스 하고 있다[11]. 본장에서는 기존 연구결과와 연계하여 NDSL 연구논문 추천시스템 개발 방안을 모색해 본다.
많은 논문을 읽게 하기 보다는 오히려 더 적은 논문을 읽고도 원하는 목적을 달성할 수 있게 해 주어야 한다. 이 목적은 미국 Arrowsmith 프로젝트[22][23]와 같이 연구자가 풀어야 하는 난제에 대한 해결책(논문)을 제시하는 것과 연구자가 앞으로 수행해야만 하는 유망한 기술을 추천하는 것 등을 통해 한층 더 높은 수준으로 달성할 수 있다. 연구논문의 추천이 상품이나 서비스 추천과 다른 차원의 중요성에서 다루어져야 하는 이유가 여기에 있다.
기업은 궁극적으로 이용자들의 기호에 잘 맞는 서비스를 눈에 띄도록 추천하여 상품판매수를 늘리기 위해서 추천시스템을 도입하고 있다. 이에 반해 NDSL(www.ndsl.kr)과 같은 국가 전자도서관의 논문 추천시스템은 이용자들이 많은 논문을 읽게 한다는 것보다는 연구목적과 맞는 논문을 추천하여 연구자들의 연구 능력과 효율 향상에 기여하는 데에 궁극적인 목적이 있다. 많은 논문을 읽게 하기 보다는 오히려 더 적은 논문을 읽고도 원하는 목적을 달성할 수 있게 해 주어야 한다.
제안 방법
현재 NDSL에서 제공하는 알리미서비스를 암묵적 방식으로 바꾸어서 이용자의 프로파일을 구축할 것과 내용기반의 필터링을 중심으로 이용자 및 메모리 기반의 협업 필터링을 병행하여 연구논문 추천에서 신규성이 부족한 단점을 보완할 것을 제안하였다. 또한 두 기법을 함께 사용하는 방식과 온톨로지와 분할방식에 의한 필터링을 이용하여 추천 만족도를 높이는 방식에 대해서도 제안하였다.
본 논문에서는 국내외에서 수행된 추천시스템에 대한 연구결과와 NDSL 이용자 분포를 분석하여 NDSL의 연구논문 추천시스템 구축방안을 모색해 보았다. 현재 NDSL에서 제공하는 알리미서비스를 암묵적 방식으로 바꾸어서 이용자의 프로파일을 구축할 것과 내용기반의 필터링을 중심으로 이용자 및 메모리 기반의 협업 필터링을 병행하여 연구논문 추천에서 신규성이 부족한 단점을 보완할 것을 제안하였다. 또한 두 기법을 함께 사용하는 방식과 온톨로지와 분할방식에 의한 필터링을 이용하여 추천 만족도를 높이는 방식에 대해서도 제안하였다.
이론/모형
따라서 내용기반 필터링은 대부분 아이템을 추천하기 위해 아이템의 내용과 이용자의 정보요구간의 유사도를 측정하고 그 결과를 순위화하여 보여준다[3]. 이 기법은 정보검색에 기반을 두고 있으므로 이 분야에서 자주 사용되는 기법인 가중치 기법, 적합성 피드백, 불리안 검색, 확률검색 모형 등을 활용한다.
후속연구
NDSL의 알리미서비스로 제공하는 내용기반의 추천 방식을 현재의 명시적 방식에서 암묵적 방식으로 이용자 프로파일 구축방식을 바꿔서 추천을 하면 유사성이 높은 연구논문 추천에 적합할 것이다. 그러나 개인의 프로파일을 이용할 때에도 단순히 이용자가 클릭한 논문의 키워드 벡터 공간만을 이용하는 것보다는 온톨로지 관점에서 접근하여 개인의 프로파일의 특성을 뽑아내거나[27][15], 최근에 클릭한 논문과 그것에 포함된 단어(키워드)에 가중치를 예전에 클릭한 것보다 높게 설정하는 방법(time aging)을 사용하는 것이 성능개선에 효과가 있을 것이다.
협업 필터링은 내용기반의 필터링 보다 신규성이 높은 논문을 추천하고, 내용기반의 필터링은 이용자(협업) 필터링에 비해서 주제의 유사성이 높은 아이템을 추천해 주는 경향이 있다[29]. 그러므로 NDSL에서는 이용자 분포를 고려하여 이용자 기반의 필터링 보다는 내용기반의 필터링을 중심으로 시스템을 설계할 필요가 있을 것이다.
본 논문은 NDSL의 연구논문 추천시스템 구축 방안을 모색하였으나, 시스템을 구축하여 실제 이용자를 대상으로 만족도를 측정하지 못하였고, 이로 인해 NDSL 데이터와 주이용자의 특성에 맞는 알고리즘을 구체적으로 제안하지 못한 한계를 가진다. 향후연구에서는 최근의 NDSL 이용자의 이용 현황과 목적 및 형태를 분석하고, 추천시스템을 구축하여 이용자를 대상으로 만족도를 평가하여 시스템 구성을 구체화 및 최적화 하고자 한다.
따라서 인용정보를 NDSL 연구논문 추천시스템의 자원으로 활용하는 것은 불가능하다. 향후 인용정보를 제공하는 전자도서관에서는 인용정보를 이용하여 추천시스템을 개발하는 것을 적극적으로 고려해 볼 필요가 있다.
본 논문은 NDSL의 연구논문 추천시스템 구축 방안을 모색하였으나, 시스템을 구축하여 실제 이용자를 대상으로 만족도를 측정하지 못하였고, 이로 인해 NDSL 데이터와 주이용자의 특성에 맞는 알고리즘을 구체적으로 제안하지 못한 한계를 가진다. 향후연구에서는 최근의 NDSL 이용자의 이용 현황과 목적 및 형태를 분석하고, 추천시스템을 구축하여 이용자를 대상으로 만족도를 평가하여 시스템 구성을 구체화 및 최적화 하고자 한다. 또한 전자도서관이 단순히 보관하고 있는 정보를 인덱스하여 검색기능을 제공하는 수동적 서비스 차원을 탈피하여 연구자들의 문제를 직접적으로 해결해 줄 수 있는 능동적 추천시스템의 구축방안을 제안하고자 한다.
질의응답
핵심어
질문
논문에서 추출한 답변
NDSL과 같은 국가 전자도서관 논문 추천시스템의 궁극적인 목적은 무엇인가?
ndsl.kr)과 같은 국가 전자도서관의 논문 추천시스템은 이용자들이 많은 논문을 읽게 한다는 것보다는 연구목적과 맞는 논문을 추천하여 연구자들의 연구 능력과 효율 향상에 기여하는 데에 궁극적인 목적이 있다. 많은 논문을 읽게 하기 보다는 오히려 더 적은 논문을 읽고도 원하는 목적을 달성할 수 있게 해 주어야 한다.
내용기반 필터링 기법의 단점은 무엇인가?
내용기반의 필터링은 영화, 음악과 같이 텍스트와 무관한 주제에 대해서는 적용이 불가능하고, 글의 스타일이나 수준, 저자의 권위 등 이용자들이 아이템에 대해 가질 수 있는 주관적인 판단에 따라 유사성을 군집할 수 없으며, 단지 과거에 관련이 있는 아이템만을 추천할 뿐이지 내용에 포함된 단어는 달라도 관련된 아이템인 경우에도 추천이 불가능하다는 단점이 있다[20].
전자도서관에 적용된 추천시스템 수준이 높지 않은 이유는 무엇인가?
그러나 Mylibrary[14], ACM Digital Library[18] 등 대부분의 전자도서관에 적용된 많은 개인화 응용기술은 기본적인 개인화 시스템이 적용된 알림 서비스로서 개인의 관심 주제에 부합하는 논문이나 책이 새롭게 들어왔다는 것을 개인에게 통보해 주는 수준이다[5][12]. 이렇게 전자도서관에 적용된 추천시스템 수준이 높지 않은 이유는 전자도서관과 관련된 연구와 개발의 대부분이 Dublin Core와 같은 데이터 표준화, 정보처리상의 상호 운용성, 디지털 권리보호를 위한 기술, 메타데이터의 자동생성, 디지털 객체 식별 등 디지털 프로세스에 집중되어 왔기 때문이다. WoS나 SCOPUS에 등재된 논문에서도 다른 분야에 비해 전자도서관 추천시스템에 대한 논문의 수가 현격이 적게 검색된다.
참고문헌 (30)
강남규, 조민희, 권오석, “NDSL 검색 질의어와 기술용어간의 관계에 대한 분석적 연구”, 정보관리연구, 제39권, 제3호, pp.163-177, 2008.
A. F. Smeaton and J. Callan, “Personalisation and recommender systems in digital libraries", International Journal on Digital Libraries, Vol.57, No.4, pp.299-308. 2005.
A. I. Schein, A. Popescul, L. H. Ungar, and D. M. Pennock, “Methods and Metrics for Cold-start Recommendations", in Proceedings of 25th annual international ACM SIGIR conference on Research and development in information retrieval, Tampere, Finland, pp.253-260. 2002.
A. S. Das , M. Datar, A. Garg and S. Rajaram, “Google news personalization: scalable online collaborative filtering", Proceedings of the 16th international conference on World Wide Web, 2007.
B. Rous, “The ACM digital library", Communications of the ACM, Vol.44, No.5, pp.90-91. 2001.
B. Sarwar, G. Karypis, J. Konstan, and J. Riedl, “Item-Based Collaborative Filtering Recommendation Algorithms", Proc. 10th Int’'l WWW Conf., 2001.
F. Gao, C. Xing, X. Du, and S. Wang, “Personalized Service System Based on Hybrid. Filtering for Digital Library", Tsinghua Science and Technology, Vol.12, No.1, pp.1-8, 2007.
G. Adomavicius, A. Tuzhilin, “Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions", IEEE Transactions on Knowledge and Data Engineering, Vol.17, No.6, pp.734-749,2005.
H. Avancini, L. Candela and U. Straccia, “Recommenders in a personalized, collaborative digital library environment", J. Intell. Inf. Syst. Vol.28, No.3, pp.253-283. 2007.
H. Small, “Co-citation in the scientific literature: a new measure of the relationship between two documents", Journal of the American Society for Information Science, Vol.24, No.4, pp.265?269. 1973
I. E. Liao, S. C. Liao, K. F. Kao, and I. F. Harn, “A Personal Ontol-ogy Model for Library Recommendation System,” in The 9th International Conference on Asian Digital Libraries (ICADL 2006), pp.173-182, 2006.
J. A. Konstan, B. N. Miller, D. Maltz, J. L. Herlocker, L. R. Gordon, and J. Riedl,"GroupLens: Applying Collaborative Filtering to “Usenet News", Commun ACM, Vol.40, No.3, pp.77-87, 1997.
J. L. Herlocker, J. A. Konstan, A. Borchers and J. Riedl, “An Algorithmic Framework for Performing Collaborative Filtering", in Proc. of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp.230-237, 1999.
K. Goldberg, T. Roeder, D. upta, and C. Perkins, “Eigentaste: A Constant Time Collaborative Filtering Algorithm", Inf.Retr., Vol.4, No.2, pp.133-151, 2001.
N. R. Smalheiser, “The Arrowsmith project: 2005 status report", Lecture Notes in Artificial Intelligence. Vol.3735. pp.26-43. 2005.
N. R. Smalheiser, V. I. Torvik, W. Zhou, “Arrowsmith two-node search interface: A tutorial on finding meaningful links between two disparate sets of articles in MEDLINE", Computer Methods and Programs in Biomedicine, Vol.94, No.2, pp.190-197, 2009.
NSF, N.S.F. Academic Research and Development. 1999.
R. Jin, L. Si, C. Zhai, and J. Callan, “Collaborative filtering with decoupled models for preferences and ratings", In Proceedings of CIKM 2003, pp.309-106, 2003.
R. Torres, S. McNee, M. Abel, J. Konstan and J. Riedl, “Enhancing digital libraries with TechLens+", In Proceedings of the 2004 Joint ACM/IEEE Conference on Digital Libraries. ACM Press, Tuscon, AZ, USA, pp.228-236. 2004.
S. E. Middleton , N. R. Shadbolt and D. C. De Roure, “Ontological user profiling in recommender systems", ACM Transactions on Information Systems (TOIS), Vol.22, No.1, pp.54-88, 2004.
S. M. McNee, I. Albert, D. Cosley, P. Gopalkrishnan, S. K. Lam, A. Rashid, J. A. Konstan, and J. Riedl, “On the recommending of citations for research papers", In Proceedings of the 2002 ACM Conference on Computer Supported Cooperative Work, CSCW '02. ACM, New York, NY, pp.116-125, 2002.
S. M. M.cNee, N. Kapoor, and J. A. Konstan, “on' Look Stupid: Avoiding Pitfalls when Recommending Research Papers”, In Proceedings of the 2006 ACM Conference on Computer Supported Cooperative Work (CSCW 2006), Banff, Canada, 2006.
U. Shardanand and P. Maes, “Social Information Filtering: Algorithms for Automating Word of Mouth", in Proc. of the SIGCHI Conference on Human Factors in Computing Systems, pp.210-217, 1995.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.