[논문]연구논문 추천시스템의 전자도서관 적용방안

여운동; 박현우; 권영일; 박영욱

doi:10.5392/jkca.2010.10.11.010

연구논문 추천시스템의 전자도서관 적용방안
Application of Research Paper Recommender System to Digital Library 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.10 no.11, 2010년, pp.10 - 19

여운동 (한국과학기술정보연구원) , 박현우 (한국과학기술정보연구원) , 권영일 (한국과학기술정보연구원) , 박영욱 (한국과학기술정보연구원)

초록
AI-Helper

컴퓨터와 웹의 발달은 사람들이 이용할 수 있는 정보의 양을 급격히 늘렸으며, 이로 인해 추천시스템에 대한 수요가 증가하고 있다. 전자도서관에서도 다른 분야와 마찬가지로 개인화 및 추천시스템에 대한 연구가 중요한데, 연구논문 추천시스템에 대한 연구는 극히 제한적으로 이뤄지고 있고, 국내에서는 거의 찾아보기 어려울 정도이다. 본 논문에서는 국내외에서 수행된 추천시스템에 대한 연구를 조사분석하고, 이를 토대로 전자도서관 연구논문 추천시스템 구축방안을 KISTI NDSL을 중심으로 제안한다. 현재 NDSL에서 제공하는 알리미서비스를 암묵적 방식으로 바꾸어서 이용자의 프로파일을 구축할 것과 이용자 및 메모리 기반의 협업 필터링을 병행하여 내용기반의 필터링이 가지는 연구논문 추천에서 신규성이 부족한 단점을 보완할 것을 제안한다. 또한 두 기법을 함께 사용하는 방식과 온톨로지와 분할방식에 의한 필터링을 이용하여 추천 만족도를 높이는 방식에 대해서도 제안한다.

Abstract ▼ AI-Helper

The progress of computers and Web has given rise to a rapid increase of the quantity of the useful information, which is making the demand of recommender systems widely expanding. Like in other domains, a recommender system in a digital library is important, but there are only a few studies about the recommender system of research papers, Moreover none is there in korea to our knowledge. In the paper, we seek for a way to develop the NDSL recommender system of research papers based on the survey of related studies. We conclude that NDSL needs to modify the way to collect user's interests from explicit to implicit method, and to use user-based and memory-based collaborative filtering mixed with contents-based filtering(CF). We also suggest the method to mix two filterings and the use of personal ontology to improve user satisfaction.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

향후연구에서는 최근의 NDSL 이용자의 이용 현황과 목적 및 형태를 분석하고, 추천시스템을 구축하여 이용자를 대상으로 만족도를 평가하여 시스템 구성을 구체화 및 최적화 하고자 한다. 또한 전자도서관이 단순히 보관하고 있는 정보를 인덱스하여 검색기능을 제공하는 수동적 서비스 차원을 탈피하여 연구자들의 문제를 직접적으로 해결해 줄 수 있는 능동적 추천시스템의 구축방안을 제안하고자 한다.
그렇지만 필요에 의해서 개발을 진행하는 경우 오히려 기존 연구에 대한 조사분석 과정을 소홀히 하는 경우가 많다. 본 논문에서는 국내외에서 수행된 연구논문 추천 시스템 연구의 결과를 비교분석하여 향후 국내전자도서관 연구논문 추천시스템 개발방향을 제안하고자 한다. 국내에서 연구논문을 서비스하는 대표적인 전자도서관은 국회도서관, 한국교육학술정보원 RISS, 한국과학기술정보연구원 NDSL 등이 있다.
본 논문에서는 국내외에서 수행된 추천시스템에 대한 연구결과와 NDSL 이용자 분포를 분석하여 NDSL의 연구논문 추천시스템 구축방안을 모색해 보았다. 현재 NDSL에서 제공하는 알리미서비스를 암묵적 방식으로 바꾸어서 이용자의 프로파일을 구축할 것과 내용기반의 필터링을 중심으로 이용자 및 메모리 기반의 협업 필터링을 병행하여 연구논문 추천에서 신규성이 부족한 단점을 보완할 것을 제안하였다.
국내에서 연구논문을 서비스하는 대표적인 전자도서관은 국회도서관, 한국교육학술정보원 RISS, 한국과학기술정보연구원 NDSL 등이 있다. 본 논문에서는 특허정보 등 다양한 연구정보를 함께 제공하는 NDSL을 중심으로 연구논문 추천시스템 구축 방안을 모색한다.
본 장에서는 각 추천알고리즘에 대해 간단히 살펴본다. 본 논문은 NDSL 추천시스템 구축 방안에 대한 논리적 접근을 연구의 목적으로 하기 때문에 본 논문에서는 추천시스템 알고리즘은 기본 원리만 살펴본다.
NDSL은 국내 학계, 연구계, 산업계의 모든 연구자들을 위한 해외 학술저널 및 프로시딩 정보제공 포털로서 2008년 6월 현재 6만 3천여 종의 학술저널과 19만 8천 여종의 프로시딩을 서비스 하고 있다[11]. 본장에서는 기존 연구결과와 연계하여 NDSL 연구논문 추천시스템 개발 방안을 모색해 본다.
많은 논문을 읽게 하기 보다는 오히려 더 적은 논문을 읽고도 원하는 목적을 달성할 수 있게 해 주어야 한다. 이 목적은 미국 Arrowsmith 프로젝트[22][23]와 같이 연구자가 풀어야 하는 난제에 대한 해결책(논문)을 제시하는 것과 연구자가 앞으로 수행해야만 하는 유망한 기술을 추천하는 것 등을 통해 한층 더 높은 수준으로 달성할 수 있다. 연구논문의 추천이 상품이나 서비스 추천과 다른 차원의 중요성에서 다루어져야 하는 이유가 여기에 있다.
기업은 궁극적으로 이용자들의 기호에 잘 맞는 서비스를 눈에 띄도록 추천하여 상품판매수를 늘리기 위해서 추천시스템을 도입하고 있다. 이에 반해 NDSL(www.ndsl.kr)과 같은 국가 전자도서관의 논문 추천시스템은 이용자들이 많은 논문을 읽게 한다는 것보다는 연구목적과 맞는 논문을 추천하여 연구자들의 연구 능력과 효율 향상에 기여하는 데에 궁극적인 목적이 있다. 많은 논문을 읽게 하기 보다는 오히려 더 적은 논문을 읽고도 원하는 목적을 달성할 수 있게 해 주어야 한다.

제안 방법

현재 NDSL에서 제공하는 알리미서비스를 암묵적 방식으로 바꾸어서 이용자의 프로파일을 구축할 것과 내용기반의 필터링을 중심으로 이용자 및 메모리 기반의 협업 필터링을 병행하여 연구논문 추천에서 신규성이 부족한 단점을 보완할 것을 제안하였다. 또한 두 기법을 함께 사용하는 방식과 온톨로지와 분할방식에 의한 필터링을 이용하여 추천 만족도를 높이는 방식에 대해서도 제안하였다.
본 논문에서는 국내외에서 수행된 추천시스템에 대한 연구결과와 NDSL 이용자 분포를 분석하여 NDSL의 연구논문 추천시스템 구축방안을 모색해 보았다. 현재 NDSL에서 제공하는 알리미서비스를 암묵적 방식으로 바꾸어서 이용자의 프로파일을 구축할 것과 내용기반의 필터링을 중심으로 이용자 및 메모리 기반의 협업 필터링을 병행하여 연구논문 추천에서 신규성이 부족한 단점을 보완할 것을 제안하였다. 또한 두 기법을 함께 사용하는 방식과 온톨로지와 분할방식에 의한 필터링을 이용하여 추천 만족도를 높이는 방식에 대해서도 제안하였다.

이론/모형

따라서 내용기반 필터링은 대부분 아이템을 추천하기 위해 아이템의 내용과 이용자의 정보요구간의 유사도를 측정하고 그 결과를 순위화하여 보여준다[3]. 이 기법은 정보검색에 기반을 두고 있으므로 이 분야에서 자주 사용되는 기법인 가중치 기법, 적합성 피드백, 불리안 검색, 확률검색 모형 등을 활용한다.

후속연구

NDSL의 알리미서비스로 제공하는 내용기반의 추천 방식을 현재의 명시적 방식에서 암묵적 방식으로 이용자 프로파일 구축방식을 바꿔서 추천을 하면 유사성이 높은 연구논문 추천에 적합할 것이다. 그러나 개인의 프로파일을 이용할 때에도 단순히 이용자가 클릭한 논문의 키워드 벡터 공간만을 이용하는 것보다는 온톨로지 관점에서 접근하여 개인의 프로파일의 특성을 뽑아내거나[27][15], 최근에 클릭한 논문과 그것에 포함된 단어(키워드)에 가중치를 예전에 클릭한 것보다 높게 설정하는 방법(time aging)을 사용하는 것이 성능개선에 효과가 있을 것이다.
협업 필터링은 내용기반의 필터링 보다 신규성이 높은 논문을 추천하고, 내용기반의 필터링은 이용자(협업) 필터링에 비해서 주제의 유사성이 높은 아이템을 추천해 주는 경향이 있다[29]. 그러므로 NDSL에서는 이용자 분포를 고려하여 이용자 기반의 필터링 보다는 내용기반의 필터링을 중심으로 시스템을 설계할 필요가 있을 것이다.
본 논문은 NDSL의 연구논문 추천시스템 구축 방안을 모색하였으나, 시스템을 구축하여 실제 이용자를 대상으로 만족도를 측정하지 못하였고, 이로 인해 NDSL 데이터와 주이용자의 특성에 맞는 알고리즘을 구체적으로 제안하지 못한 한계를 가진다. 향후연구에서는 최근의 NDSL 이용자의 이용 현황과 목적 및 형태를 분석하고, 추천시스템을 구축하여 이용자를 대상으로 만족도를 평가하여 시스템 구성을 구체화 및 최적화 하고자 한다.
따라서 인용정보를 NDSL 연구논문 추천시스템의 자원으로 활용하는 것은 불가능하다. 향후 인용정보를 제공하는 전자도서관에서는 인용정보를 이용하여 추천시스템을 개발하는 것을 적극적으로 고려해 볼 필요가 있다.
본 논문은 NDSL의 연구논문 추천시스템 구축 방안을 모색하였으나, 시스템을 구축하여 실제 이용자를 대상으로 만족도를 측정하지 못하였고, 이로 인해 NDSL 데이터와 주이용자의 특성에 맞는 알고리즘을 구체적으로 제안하지 못한 한계를 가진다. 향후연구에서는 최근의 NDSL 이용자의 이용 현황과 목적 및 형태를 분석하고, 추천시스템을 구축하여 이용자를 대상으로 만족도를 평가하여 시스템 구성을 구체화 및 최적화 하고자 한다. 또한 전자도서관이 단순히 보관하고 있는 정보를 인덱스하여 검색기능을 제공하는 수동적 서비스 차원을 탈피하여 연구자들의 문제를 직접적으로 해결해 줄 수 있는 능동적 추천시스템의 구축방안을 제안하고자 한다.

질의응답

핵심어	질문	논문에서 추출한 답변
	NDSL과 같은 국가 전자도서관 논문 추천시스템의 궁극적인 목적은 무엇인가?	ndsl.kr)과 같은 국가 전자도서관의 논문 추천시스템은 이용자들이 많은 논문을 읽게 한다는 것보다는 연구목적과 맞는 논문을 추천하여 연구자들의 연구 능력과 효율 향상에 기여하는 데에 궁극적인 목적이 있다. 많은 논문을 읽게 하기 보다는 오히려 더 적은 논문을 읽고도 원하는 목적을 달성할 수 있게 해 주어야 한다.
	내용기반 필터링 기법의 단점은 무엇인가?	내용기반의 필터링은 영화, 음악과 같이 텍스트와 무관한 주제에 대해서는 적용이 불가능하고, 글의 스타일이나 수준, 저자의 권위 등 이용자들이 아이템에 대해 가질 수 있는 주관적인 판단에 따라 유사성을 군집할 수 없으며, 단지 과거에 관련이 있는 아이템만을 추천할 뿐이지 내용에 포함된 단어는 달라도 관련된 아이템인 경우에도 추천이 불가능하다는 단점이 있다[20].
	전자도서관에 적용된 추천시스템 수준이 높지 않은 이유는 무엇인가?	그러나 Mylibrary[14], ACM Digital Library[18] 등 대부분의 전자도서관에 적용된 많은 개인화 응용기술은 기본적인 개인화 시스템이 적용된 알림 서비스로서 개인의 관심 주제에 부합하는 논문이나 책이 새롭게 들어왔다는 것을 개인에게 통보해 주는 수준이다[5][12]. 이렇게 전자도서관에 적용된 추천시스템 수준이 높지 않은 이유는 전자도서관과 관련된 연구와 개발의 대부분이 Dublin Core와 같은 데이터 표준화, 정보처리상의 상호 운용성, 디지털 권리보호를 위한 기술, 메타데이터의 자동생성, 디지털 객체 식별 등 디지털 프로세스에 집중되어 왔기 때문이다. WoS나 SCOPUS에 등재된 논문에서도 다른 분야에 비해 전자도서관 추천시스템에 대한 논문의 수가 현격이 적게 검색된다.

참고문헌 (30)

강남규, 조민희, 권오석, “NDSL 검색 질의어와 기술용어간의 관계에 대한 분석적 연구”, 정보관리연구, 제39권, 제3호, pp.163-177, 2008.

원문보기 상세보기
유사라, “국가과학기술전자도서관 이용자 정보요구와 이용 행태 분석", 한국문헌정보학회지, 제36권, 제1호, pp.25-40, 2002.

원문보기 상세보기
정영미, 이용구, "필터링 기법을 이용한 도서 추천시스템 구축", 정보관리연구, 제33권, 제1호, pp.1-17, 2002.

원문보기 상세보기
최광남, 이재윤, 조현양, "KCI 활용을 위한 지표에 관한 연구", 정보관리연구, 제37권, 제2호, pp.21-31, 2006.

원문보기 상세보기
A. F. Smeaton and J. Callan, “Personalisation and recommender systems in digital libraries", International Journal on Digital Libraries, Vol.57, No.4, pp.299-308. 2005.
A. I. Schein, A. Popescul, L. H. Ungar, and D. M. Pennock, “Methods and Metrics for Cold-start Recommendations", in Proceedings of 25th annual international ACM SIGIR conference on Research and development in information retrieval, Tampere, Finland, pp.253-260. 2002.
A. S. Das , M. Datar, A. Garg and S. Rajaram, “Google news personalization: scalable online collaborative filtering", Proceedings of the 16th international conference on World Wide Web, 2007.
B. Rous, “The ACM digital library", Communications of the ACM, Vol.44, No.5, pp.90-91. 2001.

상세보기
B. Sarwar, G. Karypis, J. Konstan, and J. Riedl, “Item-Based Collaborative Filtering Recommendation Algorithms", Proc. 10th Int’'l WWW Conf., 2001.
F. Gao, C. Xing, X. Du, and S. Wang, “Personalized Service System Based on Hybrid. Filtering for Digital Library", Tsinghua Science and Technology, Vol.12, No.1, pp.1-8, 2007.

상세보기
G. Adomavicius, A. Tuzhilin, “Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions", IEEE Transactions on Knowledge and Data Engineering, Vol.17, No.6, pp.734-749,2005.

상세보기
H. Avancini, L. Candela and U. Straccia, “Recommenders in a personalized, collaborative digital library environment", J. Intell. Inf. Syst. Vol.28, No.3, pp.253-283. 2007.

상세보기
H. Small, “Co-citation in the scientific literature: a new measure of the relationship between two documents", Journal of the American Society for Information Science, Vol.24, No.4, pp.265？269. 1973

상세보기
http://lib-www.lanl.gov/lww/mylibweb.htm
I. E. Liao, S. C. Liao, K. F. Kao, and I. F. Harn, “A Personal Ontol-ogy Model for Library Recommendation System,” in The 9th International Conference on Asian Digital Libraries (ICADL 2006), pp.173-182, 2006.
J. A. Konstan, B. N. Miller, D. Maltz, J. L. Herlocker, L. R. Gordon, and J. Riedl,"GroupLens: Applying Collaborative Filtering to “Usenet News", Commun ACM, Vol.40, No.3, pp.77-87, 1997.

상세보기
J. Callan and M. Connell, “Query-based sampling of text databases", ACM Transactions on Information Systems (TOIS), Vol.19, No.2, pp.97-130, 2001.

상세보기
J. L. Herlocker, J. A. Konstan, A. Borchers and J. Riedl, “An Algorithmic Framework for Performing Collaborative Filtering", in Proc. of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp.230-237, 1999.
K. Goldberg, T. Roeder, D. upta, and C. Perkins, “Eigentaste: A Constant Time Collaborative Filtering Algorithm", Inf.Retr., Vol.4, No.2, pp.133-151, 2001.

상세보기
M. Balabanovic and Y. Shoham. Fab, “Content-Based, Collaborative Recommendation", Communications of the ACM, Vol.40, No.3, pp.66-72. 1997.

상세보기
M. M. Kessler, “Bibliographic coupling between scientific papers”, American Documentation, Vol.14, pp.10-25, 1963.

상세보기
N. R. Smalheiser, “The Arrowsmith project: 2005 status report", Lecture Notes in Artificial Intelligence. Vol.3735. pp.26-43. 2005.
N. R. Smalheiser, V. I. Torvik, W. Zhou, “Arrowsmith two-node search interface: A tutorial on finding meaningful links between two disparate sets of articles in MEDLINE", Computer Methods and Programs in Biomedicine, Vol.94, No.2, pp.190-197, 2009.

상세보기
NSF, N.S.F. Academic Research and Development. 1999.
R. Jin, L. Si, C. Zhai, and J. Callan, “Collaborative filtering with decoupled models for preferences and ratings", In Proceedings of CIKM 2003, pp.309-106, 2003.
R. Torres, S. McNee, M. Abel, J. Konstan and J. Riedl, “Enhancing digital libraries with TechLens+", In Proceedings of the 2004 Joint ACM/IEEE Conference on Digital Libraries. ACM Press, Tuscon, AZ, USA, pp.228-236. 2004.
S. E. Middleton , N. R. Shadbolt and D. C. De Roure, “Ontological user profiling in recommender systems", ACM Transactions on Information Systems (TOIS), Vol.22, No.1, pp.54-88, 2004.

상세보기
S. M. McNee, I. Albert, D. Cosley, P. Gopalkrishnan, S. K. Lam, A. Rashid, J. A. Konstan, and J. Riedl, “On the recommending of citations for research papers", In Proceedings of the 2002 ACM Conference on Computer Supported Cooperative Work, CSCW '02. ACM, New York, NY, pp.116-125, 2002.
S. M. M.cNee, N. Kapoor, and J. A. Konstan, “on' Look Stupid: Avoiding Pitfalls when Recommending Research Papers”, In Proceedings of the 2006 ACM Conference on Computer Supported Cooperative Work (CSCW 2006), Banff, Canada, 2006.
U. Shardanand and P. Maes, “Social Information Filtering: Algorithms for Automating Word of Mouth", in Proc. of the SIGCHI Conference on Human Factors in Computing Systems, pp.210-217, 1995.

저자의 다른 논문 :

LOADING...

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증