$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 질의기반 사용자 프로파일을 이용하는 개인화 웹 검색
Personalized Web Search using Query based User Profile 원문보기

한국산학기술학회논문지 = Journal of the Korea Academia-Industrial cooperation Society, v.17 no.2, 2016년, pp.690 - 696  

윤성희 (상명대학교 컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

사용자 입력 질의와 웹 문서에 포함된 단어들의 형태적 일치를 검사하여 관련 문서를 검색하는 검색엔진은 사용자의 개인별 관심 분야를 반영하는 검색 결과를 생성하기 어렵다. 본 논문에서는 개인별 관심사를 파악하여 질의 의도에 적합한 내용의 문서를 검색하는 개인화된 웹 검색 방법을 제안한다. 개인화 검색의 성능은 사용자의 개인적 관심사를 정확하게 표현하는 우수한 사용자 프로파일을 생성하는 전략에 좌우된다. 본 연구에서 개인 프로파일은 사용자가 최근 입력한 질의어들과 검색에서 클릭했던 문서들에 나타나는 주제어들이 출현 빈도를 반영한 가중치와 함께 등록된 데이터베이스이다. 특히 중의적 질의어의 정확한 의미를 결정하기 위해 워드넷을 기반으로 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 기존 웹 검색 시스템의 사용자 측에 질의확장 모듈과 순위재계산 모듈을 추가하는 확장모듈을 구축하여 비교 실험하였으며, 본 연구의 방법을 적용한 개인화 웹 검색의 결과는 특히 10위 이내 상위의 결과 문서들에 대해 92%의 정확률과 82%의 재현율을 보여 향상된 성능을 검증하였다.

Abstract AI-Helper 아이콘AI-Helper

Search engines that rely on morphological matching of user query and web document content do not support individual interests. This research proposes a personalized web search scheme that returns the results that reflect the users' query intent and personal preferences. The performance of the person...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구는 개인의 관심사를 파악하여 차별화된 검색 결과를 제공하는 개인화 웹 검색 방법을 제안하였다. 개인의 관심 주제어를 수집하여 프로파일 데이터베이스에 저장하고 지속적으로 갱신하여 최신 관심사를 유지하면서 검색 결과를 제공을 하는 것이 목적이며, 사용자의 검색 환경에서 확장모듈로 구축되는 방법이다. 사용자 프로파일을 구성하는 내용은 사용자가 최근에 입력한 질의어들과 최근 실제 검색했던 문서들의 주제어들이며, 특히 중의적 성격을 갖는 주제어들의 의미를 판별하기 위해 워드넷을 기반으로 사용자의 관심을 반영하는 주제어들 사이의 의미 유사도를 계산하였다.
  • 공통의 관심 분야를 갖는 사용자 집단의 성향을 프로파일 정보에 반영하는 연구들에서는 포털의 개인 블로그나 가입 활동하는 카페 등 커뮤니티(community)를 기반으로 정보를 수집한다[8-9]. 개인의 관심사를 다른 사용자들의 관심사와 결합하여 다수 사용자의 성향에 대한 정보를 표현할 수 있는 연결망 구조로 확장하는 방법을 소개했다. ‘사람들에 의한 분류법’라 불리는 폭소노미(folksonomy)의 태그를 개인화 검색에 활용하는 연구에서는 태그들을 중심으로 문서의 클러스터링 과정을 거치며, 문서의 태그가 사용자의 질의어로 사용되는 경우가 많다는 특성을 활용하는 방법이다[10].
  • 본 논문에서는 검색 사용자들의 성향과 관심 분야를 검색질의어와참조했던문서들의주제어들로부터추출하여 개인화된프로파일(profile) 구성하고, 이를활용하는질의 확장(query expansion)과 순위 재계산(re-ranking) 과정을 통해 개인 관심사에 적합한 문서들을 검색하는 개인화 웹 검색(personalized web search) 방법에 대해 제안한다. 검색 시스템의 결과문서 집합이 사용자의 질의 의도에 얼마나 일치하는지에 대한 성능은 정확률(precision)과 재현율(recall)이라는 정량적 지표로 평가된다.
  • 본 연구는 개인의 관심사를 파악하여 차별화된 검색 결과를 제공하는 개인화 웹 검색 방법을 제안하였다. 개인의 관심 주제어를 수집하여 프로파일 데이터베이스에 저장하고 지속적으로 갱신하여 최신 관심사를 유지하면서 검색 결과를 제공을 하는 것이 목적이며, 사용자의 검색 환경에서 확장모듈로 구축되는 방법이다.
  • 텍스트 데이터 처리에는 사전정보를 이용하고 불용어 처리와 형태소 분석 등 다양한 자연어처리 결과를 활용하며 질의어나 주제어들 간의 형태적 유사도와 빈도를 중심으로 처리하거나 온톨로지 등의 대용량 자원을 활용하기도 한다[13-14]. 본 연구는 워드넷을 이용하여 질의어와 주제어들의 사이의 의미 유사도(semantic similarity)를 계산하고 순위를 재계산하는 개인화 검색 시스템을 소개한다.
  • 본 연구에서는 사용자들이 검색 시스템에 일정 기간 입력한 질의어들을 수집하여 사용자의 개인화된 선호도와 관심사를 반영하는 개인 프로파일 정보로 등록하고 질의 확장하여 검색 결과의 정확률을 향상시킨다. 또 검색된 후보 문서들을 관련 주제어들의 출현 중첩도를 이용하여 순위를 재계산하여 결과물을 생성한다.
  • 특히 사용자들이 상위의 10개 내외의 문서들만을 중심으로 참조한다는 연구 결과에 따르면 검색 문서들의 순위를 결정하는 것은 검색 성능의 평가에 매우 중요한 과정이다. 본 연구에서는 순위 재계산을 위해 사용자 프로파일의 관심 주제어들과 검색결과 문서에 출현하는 주제어들과의 중첩정도를 계산한다. 또한 실제로 사용자가 클릭하는 문서에 대해서는 관심분야 주제어 갱신과 가중치 갱신이 이루어진다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
정보검색 시스템은 어떻게 적합 문서 여부를 결정하나? 정보검색 시스템은 기본적으로 입력 질의어와 웹 문서 에나타나는색인어(index)의형태적일치를 검사함으로써 적합 문서 여부를 결정한다. 대부분의 사용자들은 아주 단순한검색질의어를입력하고검색된 문서들에 대한 관련성 평가를 통해 더 관련이 많은 문서를 찾기 위해 재검색하는 것이 일반적이다[3].
개인화된 웹 검색 기법이 중요한 가치를 갖게 된 이유는? IT 기기나 소프트웨어 분야에 대해 관심이 많은 사용자의 검색어 ‘apple' 이나 'virus'는 농산물이나 생물학에 관심이 많은 사용자의 검색어 ’apple'이나 ’virus'와는 의미가 분명히 다를 것이다. 이와같이 검색시스템의 성능향상에 대한 사용자들의 기대는 점차로 개인의 관심사에 적합한문서들만 결과로 제시하는 지능적인 기능의 품질 높은 맞춤형 검색으로바뀌고있다. 개인화된 웹 검색 기법은 정보검색의 개선된 기능으로서도 중요하지만 더 나아가 개인별 맞춤형 광고와 마케팅 등을 위해서도 매우 중요한 가치를 갖는 기술이 되고 있다.
정보검색 시스템이란? 정보검색 시스템은 사용자의 입력 질의(query)에 적합한 문서를 찾기 위해 대량의 문서들을 검색하고 질의 목적에 부합하는 문서들을 선별하고 순위를 매겨서 정답 후보 문서 집합으로 제시하는 소프트웨어 도구이다[1]. 정보검색 시스템의 성능은 사용자의 질의 의도에 적합한 문서들을 골라내고 신뢰할 만한 순위로 제공하는 기능에 기준을 두고 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (24)

  1. Baeza-Yates Ricardo, Reberio-Neto Berthier, Modern Information Retrieval. Addison Wesley, 1999. 

  2. Soyeon Park, Joon-Ho Lee, "Investigating Web Search Behavior via Query Log Analysis," Journal of the Korean Society of Information Management,. Vol. 24, No. 4, pp. 255-265. 2002. 

  3. Soyeon Park, Joon-Ho Lee, Ji Seoung Kim, "An Analysis of Query Types and Topics Submitted to Naver," The Journal of the Korean Society for Library and Information Science, Vol. 39, No. 11, pp. 265-278, 2005. DOI: http://dx.doi.org/10.4275/KSLIS.2005.39.1.265 

  4. S. Koratkar, S. A. Takale, "Deriving Concept Based User Profile for Search Engine Personalization," International Journal of Science and Research, Vol.4, No. 6, pp.3086-3089, 2013. 

  5. K. W. Leung, W. Ng, D. L. Lee, "Personalized Concept-Based Clustering of Search Engine Queries.," IEEE Transactions on Knowledge and Data Engineering, Vol.20, No. 11, pp.1505-1518, 2008. DOI: http://dx.doi.org/10.1109/TKDE.2008.84 

  6. N. Sharma, M. Sharma, O. J. Gupta, "Search Engine Personalization Using Concept Based User Profiles," International Journal of Scientific Research Engineering & Technology(IJSRET), Vol. 2, No. 4, pp.084-087, 2012. 

  7. K. R. Remesh Babu, P. Samuel, "Concept Networks for Personalized Web Search Using Genetic Algorithm," International Conference on Information and Communication Technologies (ICICT 2014), pp. 566-573, 2015. 

  8. Taebok Yoon, Seungjoon Lee, Kwangho Yoon, Jeehyong Lee, "Design and Application of Multi Concept Model based on Web-using Information," Journal of Internet Computing and Services, Vol. 10, No. 5, pp.95-104, 2009. 

  9. Gunwoo Park, Sang-Hoon Lee, "Personalized Search based on Community through Automatic Analysis of Query Patterns," Journal of the Korean Institute of Information Scientists and Engineers: Database, Vol. 36, No. 4, pp. 321-326, 2009. 

  10. Dongwook Kim, Sooyong Kan, Hanjoon Kim, Byungjeong Lee, "Folksonomy-based Personalized Web Search System," Journal of Digital Contents Society, Vol. 11, No. 1, pp. 105-116, 2010. 

  11. Soyeon Park, "Analysis and Evaluation of Term Suggestion Services of Korean Search Portals: The Case of Naver and Google Korea," Journal of the Korean Society of Information Management, No. 20, Vol. 2, pp.297-315, 2013. DOI: http://dx.doi.org/10.3743/kosim.2013.30.2.297 

  12. Sung Hee Yoon, "Using Query Word Senses and User Feedback to Improve Precision of Search Engine," Journal of the Korean Society of Information Management, Vol. 26, No. 4, pp. 81-91, 2009. DOI: http://dx.doi.org/10.3743/kosim.2009.26.4.081 

  13. Jeong Heo, Pum-Mo Ryu, Yoon Jae Choi, Hyun Ki Kim, and Cheol Young Ock, "An Issue Event Search System based on Big Data for Decision Supporting: SocialWisdom," The Proceedings of Korean Institute of Information Scientists and Engineers Vol. 39, No. 5, pp.381-394, 2013. 

  14. Boon Hee Kim, "Words Recommendation Algorithm for Similarity Connection based on Data Transmutability," The Journal of The Korea Institute of Electronic Communication Sciences, Vol. 8, No. 11, pp. 1719-1724, 2013. DOI: http://dx.doi.org/10.13067/JKIECS.2013.8.11.1719 

  15. Yong-Gu Lee, Young-Mee Chung, "An Experimental Study on an Effective Word Sense Disambiguation Model Based on Automatic Sense Tagging Using Dictionary Information," Journal of the Korean Society for Information Management, Vol.24, No. 1, pp. 321-342, 2007. DOI: http://dx.doi.org/10.3743/kosim.2007.24.1.321 

  16. Wikipedia, http://en.wikipedia.org/wiki/WordNet 

  17. WordNet:A Lexical Database for English. http://wordnet.princeton.edu/ 

  18. KIBS : Korean Information Base System. http://kibs.kaist.ac.kr 

  19. Young-Bum Kim, Yu-seop Kim,"A Question Example Generation System for Multiple Choice Tests by utilizing Concept Similarity in Korean WordNet," Journal of the Korean Information Processing Society, Vol. 15(A), 2008. 

  20. Kyeong-Kook Park, Kwang-Mo Lee, Yu-Seop Kim, "WordNet Extension for IT Terminology Using Web Search," The Proceedings of Korean Institute of Information Scientists and Engineers Conference, pp. 189-193, 2007. 

  21. In Keun Lee, Dosam Hwang, Younggyun Hahm, Key-Sun CHoi, "Open Korean WordNet(KWN): Dictionary-based Semi-Automatic Development," The 26th Annual Conference on Human & Cognitive Language Technology, 2014. 

  22. Mi-Young Cho, Jun-Ho Choi, Pan-Koo Kim, "Design of Conceptual Image Annotation System Using WordNet," The Proceedings of the Korea Multimedia Society Conference. pp. 1081-1086., 2002. 

  23. L. Meng, R. Huang, J. Gu, "A Review of Semantic Similarity Measures in WordNet," International Journal of Hybrid Information Technology. Vol. 6, No. 1,, 2013. 

  24. T. Simpson, T. Dao, "WordNet-based semantic similarity measurement," 2010, http://www.codeproject.com/Articles/11835. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로