$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

검색 포털들의 검색어 추천 서비스 분석 평가: 네이버와 구글의 연관 검색어 서비스를 중심으로
Analysis and Evaluation of Term Suggestion Services of Korean Search Portals: The Case of Naver and Google Korea 원문보기

정보관리학회지 = Journal of the Korean society for information management, v.30 no.2 = no.88, 2013년, pp.297 - 315  

박소연 (덕성여자대학교 문헌정보학과)

초록
AI-Helper 아이콘AI-Helper

본 연구에서는 주요 검색 포털들의 검색어 추천 서비스를 분석, 평가하였다. 이 연구에서는 네이버와 구글 코리아를 대상으로 추천되는 연관 검색어의 적합도 및 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 또한 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하고, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교하였다. 연구 결과, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 또한 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다. 본 연구의 결과는 향후 포털들의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다.

Abstract AI-Helper 아이콘AI-Helper

This study aims to analyze and evaluate term suggestion services of major search portals, Naver and Google Korea. In particular, this study evaluated relevance and currency of related search terms provided, and analyzed characteristics such as number and distribution of terms, and queries that did n...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 예를 들어, 문상준과 최재걸(2004)은 네이버와 같은 검색 엔진에서 수집된 검색어들 간의 상호 연관성을 찾기 위해 변형된 Apriori 알고리즘을 제안하였다. 기존의 데이터 마이닝 알고리즘이 일정 횟수 이상 검색된 라지 셋(large set) 검색어들에만 집중하는 반면, 이들의 연구에서는 일정 횟수 이하로 검색되는 검색어들인 스몰 셋(small set)의 연관 법칙을 찾기 위한 방법을 제시하였다. 박성주, 박하얀, 김용혁(2008)은 네이버를 대상으로 분산 객체 기반의 병렬 처리 방식으로 검색 결과 페이지들을 재분석하여 연관 검색어를 추천하는 방법을 제안하였다.
  • 셋째, 연관 검색어의 유형을 질의와 연관 검색어의 관계 및 연관 검색어들 간의 관계 등의 측면에서 분석하고자 한다. 넷째, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하고자 한다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의 간의 연관 검색어의 특징을 비교, 분석하고자 한다.
  • 좀 더 구체적으로 이 연구에서는 추천된 검색어, 즉 연관 검색어의 적합도, 최신성과 같은 품질을 분석하고자 한다. 둘째, 포털별로 제공되는 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하고자 한다. 셋째, 연관 검색어의 유형을 질의와 연관 검색어의 관계 및 연관 검색어들 간의 관계 등의 측면에서 분석하고자 한다.
  • 이렇게 공개되는 질의들은 엔터테인먼트와 뉴스 관련 검색어들에 집중되어서 경제, 의학, IT, 자연과학, 사회과학, 인문학과 같은 다양한 주제 분야의 질의들을 포함하지 못한다는 한계가 있다. 따라서 이 연구에서는 다양한 주제 분야와 다양한 난이도의 질의를 대상으로 연관 검색어를 평가하기 위하여 이용자들의 실제 질의를 활용하기로 하였다. 좀 더 구체적으로, 40명의 수강생들이 연관 검색 서비스 평가 용도로 본인이 관심 있는 질의 11개씩을 제출하였으며, 이때, 학문, 문화/예술/엔터테인먼트, 의학, 경제, 사회, 지역/여행, IT, 뉴스, 라이프스타일, 쇼핑 등 다양한 주제 분야에서 질의를 고루 선택하고, 대중적 질의와 전문적인 질의를 고루 선택하도록 안내하였다.
  • 이와 유사하게 Xu 등(2011)도 이용자들이 질의 입력 후 조회한 문서의 미리 보기에 등장한 단어들을 추출한 후, 이 검색어 들을 의미적 유사도에 따라 순위화한 후 연관 검색어로 추천하는 알고리즘을 개발하였다. 또한 이러한 알고리즘과 구글과 야후의 검색어 추천 방식을 비교하여, 제안된 알고리즘의 우수성을 보고하였다.
  • 넷째, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하고자 한다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의 간의 연관 검색어의 특징을 비교, 분석하고자 한다. 국내에서는 검색어 추천 서비스가 연관 검색어로 통용되는 만큼, 이 논문에서도 추천된 검색어를 지칭하기 위하여 연관 검색어라는 용어를 사용하고자 한다.
  • 본 연구에서는 구글과 네이버의 연관 검색어를 첫째 적합도 기준에 따라 평가하고자 한다. 연관 검색어의 적합도는 적합과 부적합으로 평가되었으며, 그 이유는 주제 분야 전문가들인 교수들을 대상으로 파일럿 스터디를 수행한 결과, 포털들의 연관 검색어가 적합한 그룹과 전혀 부적합한 그룹으로 양분되는 경향이 뚜렷함을 발견하였기 때문이다.
  • 본 연구에서는 주요 검색 포털들인 네이버와 구글의 연관 검색어 서비스의 특징 및 품질을 조사, 분석하였다. 좀 더 구체적으로 이 연구에서는 구글과 네이버의 연관 검색어의 적합도, 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다.
  • 한편 국내외 선행 연구들의 경우, 웹 검색 엔진을 위한 검색어 추천 알고리즘 구축 및 제안에 집중되어 있으며, 제안된 검색어의 품질을 종합적으로 분석, 평가한 연구는 드문 실정이다. 이에 본 연구에서는 국내외 주요 검색 포털들인 구글과 네이버의 검색어 추천 서비스의 특징과 장단점을 조사하고자 한다. 좀 더 구체적으로 이 연구에서는 추천된 검색어, 즉 연관 검색어의 적합도, 최신성과 같은 품질을 분석하고자 한다.
  • 국내외 선행 연구들 중에서 웹 검색 포털들의 검색어 추천 서비스를 상세하고 종합적으로 분석, 평가한 연구는 찾아보기 어려운 실정이다. 이에 본 연구에서는 주요 검색 포털인 네이버와 구글의 검색어 추천 서비스의 특징과 품질을 분석, 평가하고자 한다.
  • 이에 본 연구에서는 국내외 주요 검색 포털들인 구글과 네이버의 검색어 추천 서비스의 특징과 장단점을 조사하고자 한다. 좀 더 구체적으로 이 연구에서는 추천된 검색어, 즉 연관 검색어의 적합도, 최신성과 같은 품질을 분석하고자 한다. 둘째, 포털별로 제공되는 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하고자 한다.

가설 설정

  • 인터넷 쇼핑몰의 매출을 높이기 위한 마케팅 방법으로 연관 검색어 활용을 제안하는 단행본이(최재봉, 2012) 출판된 것은 연관 검색어의 상업적 성격에 대한 사회적 인식을 반영한 사례라고 할 수 있다. 넷째, 비표준어에 대한 품질 관리가 요청된다. 특히 구글과 네이버 모두 띄어쓰기 오류가 전체 연관 검색어의 절반 정도를 차지하므로, 이에 대한 정정 작업이 요구된다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
질의 확장은 어떻게 실행되는가? 정보 검색 분야에서 검색어 추천 또는 제안과 관련된 국외 선행 연구는 오랜 기간 동안 수행되어 왔으며(Bates, 1981), 질의 확장(query expansion)과 밀접한 관련이 있다. 질의 확장은 이용자의 초기 질의를 정련하기 위한 기법으로, 이용자의 질의에 검색어나 구를 추가함으로써 실행되며, 검색 시스템에 의해 자동으로 실행되거나, 이용자에 의해서 적합성 피드백의 형태로 수작업으로 실행된다(Xu, Luo, Yu, & Xu, 2011). 전통적인 질의 확장 기법은 대개 문서 내의 출현 단어의 분석에 기반하는데 비해(Croft, Metzler, & Strohman, 2010), 웹 검색 분야에서의 검색어 추천 기법은 문서 내 출현 단어뿐만 아니라, 질의에 대한 검색 결과 중 이용자들이 많이 조회한 결과와 같은 다양한 요소들에 근거하여 연관 검색어들을 추출한다는 점에서 차이가 있다.
검색어 추천이란 무엇인가? 검색어 추천은 “이용자가 보다 효율적으로 질의를 작성할 수 있도록 이용자가 입력한 초기 질의에 적합한 검색어들을 제안하는 정보 검색 기법의 일종”이다(Huang, Chien, & Oyang, 2003, p. 638).
문헌정보학 전공 대학생들이 선택한 실제 질의들을 선택한 이유는 무엇인가? 이 수강생들은 모두 문헌 정보학을 전공하거나(34명) 복수 전공하는(6명) 학생들로 3학년이 전체의 65%, 4학년이 35% 였다. 이처럼 이용자들의 실제 질의를 선택한 이유는 검색 포털들이 일반에게 공개하는 질의들은 엔터테인먼트와 뉴스에 편중되어 다양한 질의에 대한 연관 검색어 평가에 제약이 따르기 때문이다. 즉, 네이버, 다음은 각각 인기 검색어 사이트(http://searchc.
질의응답 정보가 도움이 되었나요?

참고문헌 (23)

  1. 김지혜, 장재영, 윤홍준, 김한준 (2010). 키워드 관련도를 이용한 뉴스기사의 연관 검색 기법. 한국정보과학회 학술발표논문집, 37(1C), 53-57. 

  2. 문상준, 최재걸 (2004). 검색어의 연관법칙. 한국정보과학회 학술발표논문집, 31(2), 10-12. 

  3. 박성주, 박하얀, 김용혁 (2008). 검색엔진의 검색 결과 분석을 통한 병렬처리 기반의 연관 검색어 추천 기법. 한국정보과학회 학술발표논문집, 35(2C), 214-217. 

  4. 박소연 (2011). 웹 검색 행태의 추이 및 변화 분석. 한국문헌정보학회지, 45(1), 377-393. http://dx.doi.org/10.4275/KSLIS.2011.45.1.377 

  5. 박소연, 이준호, 김지승 (2005). 클릭 로그에 근거한 네이버 검색 질의의 형태 및 주제 분석. 한국문헌정보학회지, 39(1), 265-278. 

  6. 윤여생, 유진호 (2012). 불법유해정보 법.제도 동향 분석. 정보보호학회지, 22(3), 25-36. 

  7. 이정훈, 전서현 (2009). 검색어 질의 확장을 위한 추천 질의 랭킹 시스템. 한국정보과학회 학술발표논문집, 36(2C), 210-214. 

  8. 이준호, 박소연, 권혁성. (2003). 질의 로그 분석을 통한 네이버 이용자의 검색 행태 연구. 정보관리학회지, 20(2), 27-41. 

  9. 주길홍, 이주일, 이원석 (2011). 효율적인 문서 검색을 위한 연관 키워드 추출 및 확산 클러스터링 방법. 한국정보기술학회 논문지, 9(6), 155-166. 

  10. 최재봉 (2012). 인터넷 쇼핑몰 마케팅 비법. 서울: 앱북스. 

  11. 한국인터넷자율정책기구(KISO) (2013). 연관검색어 및 자동완성검색어에 대한 정책결정 15호. Retrieved from http://www.kiso.or.kr/decision/decision_view.html. 

  12. Arkin, H., & Colton, R. (1963). Tables for statisticians. New York: Barnes & Noble Inc. 

  13. Bates, M. J. (1981). Search techniques. Annual Review of Information Science and Technology, 16, 139-169. 

  14. Beeferman, D., & Berger, A. (2000). Agglomerative clustering of a search engine query log. Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 407-416. http://dx.doi.org/10.1145/347090.347176 

  15. Chen, L. (2011). Term suggestion with similarity measure based on semantic analysis techniques in query logs. Online Information Review, 35(1), 9-33. 

  16. Croft, W. B., Metzler, D., & Strohman, T. (2010). Search engines: Information retrieval in practice. Boston: Pearson Education. 임해창, 임희석, 한경수, 박소영 공역 (2012). 검색엔진: 최신정보검색론. 서울: 휴먼싸이언스. 

  17. Huang, C., Chien, L., & Oyang, Y. (2003). Relevant term suggestion in interactive web search based on contextual information in query session logs. Journal of the American Society for Information Science and Technology, 54(7), 638-649. http://dx.doi.org/10.1002/asi.10256 

  18. Liu, Y., Miao, J., Zhang, M., Ma, S., & Ru, L. (2011). How do users describe their information need: Query recommendation based on snippet click model. Expert systems with applications, 38, 13847-13856. http://dx.doi.org/10.1016/j.eswa.2011.04.188 

  19. NHN. (2013). 연관검색어는 어떤 서비스인가요? Retrieved from http://help.naver.com/ops/faq/faqPrint.nhn?faqId24796. 

  20. Sanderson, M. (2008). Ambiguous queries: Test collections need more sense. Proceedings of the 31st Annual international ACM SIGIR conference on research and development in information retrieval, 499-506. http://dx.doi.org/10.1145/1390334.1390420 

  21. Silverstein, C., Henzinger, M., Marais, H., & Moricz, M. (1999). Analysis of a very large web search engine query log. SIGIR Forum, 33(1), 6-12. 

  22. Spink, A., Wolfram, D., Jansen, B. J., & Saracevic, T. (2001). Searching the Web: The public and their queries. Journal of the American Society for Information Science and Technology, 52(3), 226-234. 

  23. Xu, Z., Luo, X., Yu, J., & Xu, W. (2011). Mining Web search engines for query suggestion. Concurrency and Computation: Practice and Experience, 23, 1101-1113. http://dx.doi.org/10.1002/cpe.1689 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로