[논문]검색 포털들의 검색어 추천 서비스 분석 평가: 네이버와 구글의 연관 검색어 서비스를 중심으로

박소연

doi:10.3743/kosim.2013.30.2.297

문제 정의

예를 들어, 문상준과 최재걸(2004)은 네이버와 같은 검색 엔진에서 수집된 검색어들 간의 상호 연관성을 찾기 위해 변형된 Apriori 알고리즘을 제안하였다. 기존의 데이터 마이닝 알고리즘이 일정 횟수 이상 검색된 라지 셋(large set) 검색어들에만 집중하는 반면, 이들의 연구에서는 일정 횟수 이하로 검색되는 검색어들인 스몰 셋(small set)의 연관 법칙을 찾기 위한 방법을 제시하였다. 박성주, 박하얀, 김용혁(2008)은 네이버를 대상으로 분산 객체 기반의 병렬 처리 방식으로 검색 결과 페이지들을 재분석하여 연관 검색어를 추천하는 방법을 제안하였다.
셋째, 연관 검색어의 유형을 질의와 연관 검색어의 관계 및 연관 검색어들 간의 관계 등의 측면에서 분석하고자 한다. 넷째, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하고자 한다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의 간의 연관 검색어의 특징을 비교, 분석하고자 한다.
좀 더 구체적으로 이 연구에서는 추천된 검색어, 즉 연관 검색어의 적합도, 최신성과 같은 품질을 분석하고자 한다. 둘째, 포털별로 제공되는 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하고자 한다. 셋째, 연관 검색어의 유형을 질의와 연관 검색어의 관계 및 연관 검색어들 간의 관계 등의 측면에서 분석하고자 한다.
이렇게 공개되는 질의들은 엔터테인먼트와 뉴스 관련 검색어들에 집중되어서 경제, 의학, IT, 자연과학, 사회과학, 인문학과 같은 다양한 주제 분야의 질의들을 포함하지 못한다는 한계가 있다. 따라서 이 연구에서는 다양한 주제 분야와 다양한 난이도의 질의를 대상으로 연관 검색어를 평가하기 위하여 이용자들의 실제 질의를 활용하기로 하였다. 좀 더 구체적으로, 40명의 수강생들이 연관 검색 서비스 평가 용도로 본인이 관심 있는 질의 11개씩을 제출하였으며, 이때, 학문, 문화/예술/엔터테인먼트, 의학, 경제, 사회, 지역/여행, IT, 뉴스, 라이프스타일, 쇼핑 등 다양한 주제 분야에서 질의를 고루 선택하고, 대중적 질의와 전문적인 질의를 고루 선택하도록 안내하였다.
이와 유사하게 Xu 등(2011)도 이용자들이 질의 입력 후 조회한 문서의 미리 보기에 등장한 단어들을 추출한 후, 이 검색어 들을 의미적 유사도에 따라 순위화한 후 연관 검색어로 추천하는 알고리즘을 개발하였다. 또한 이러한 알고리즘과 구글과 야후의 검색어 추천 방식을 비교하여, 제안된 알고리즘의 우수성을 보고하였다.
넷째, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하고자 한다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의 간의 연관 검색어의 특징을 비교, 분석하고자 한다. 국내에서는 검색어 추천 서비스가 연관 검색어로 통용되는 만큼, 이 논문에서도 추천된 검색어를 지칭하기 위하여 연관 검색어라는 용어를 사용하고자 한다.
본 연구에서는 구글과 네이버의 연관 검색어를 첫째 적합도 기준에 따라 평가하고자 한다. 연관 검색어의 적합도는 적합과 부적합으로 평가되었으며, 그 이유는 주제 분야 전문가들인 교수들을 대상으로 파일럿 스터디를 수행한 결과, 포털들의 연관 검색어가 적합한 그룹과 전혀 부적합한 그룹으로 양분되는 경향이 뚜렷함을 발견하였기 때문이다.
본 연구에서는 주요 검색 포털들인 네이버와 구글의 연관 검색어 서비스의 특징 및 품질을 조사, 분석하였다. 좀 더 구체적으로 이 연구에서는 구글과 네이버의 연관 검색어의 적합도, 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다.
한편 국내외 선행 연구들의 경우, 웹 검색 엔진을 위한 검색어 추천 알고리즘 구축 및 제안에 집중되어 있으며, 제안된 검색어의 품질을 종합적으로 분석, 평가한 연구는 드문 실정이다. 이에 본 연구에서는 국내외 주요 검색 포털들인 구글과 네이버의 검색어 추천 서비스의 특징과 장단점을 조사하고자 한다. 좀 더 구체적으로 이 연구에서는 추천된 검색어, 즉 연관 검색어의 적합도, 최신성과 같은 품질을 분석하고자 한다.
국내외 선행 연구들 중에서 웹 검색 포털들의 검색어 추천 서비스를 상세하고 종합적으로 분석, 평가한 연구는 찾아보기 어려운 실정이다. 이에 본 연구에서는 주요 검색 포털인 네이버와 구글의 검색어 추천 서비스의 특징과 품질을 분석, 평가하고자 한다.
이에 본 연구에서는 국내외 주요 검색 포털들인 구글과 네이버의 검색어 추천 서비스의 특징과 장단점을 조사하고자 한다. 좀 더 구체적으로 이 연구에서는 추천된 검색어, 즉 연관 검색어의 적합도, 최신성과 같은 품질을 분석하고자 한다. 둘째, 포털별로 제공되는 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하고자 한다.

가설 설정

인터넷 쇼핑몰의 매출을 높이기 위한 마케팅 방법으로 연관 검색어 활용을 제안하는 단행본이(최재봉, 2012) 출판된 것은 연관 검색어의 상업적 성격에 대한 사회적 인식을 반영한 사례라고 할 수 있다. 넷째, 비표준어에 대한 품질 관리가 요청된다. 특히 구글과 네이버 모두 띄어쓰기 오류가 전체 연관 검색어의 절반 정도를 차지하므로, 이에 대한 정정 작업이 요구된다.

제안 방법

넷째, 비표준어는 표준 국어법을 준수하지 않는 검색어를 의미하며, 띄어쓰기 오류, 오타, 준말이나 축약어 사용, 비속어나 외계어 사용 등의 유형으로 세분화하여 분석하였다.
좀 더 구체적으로 이 연구에서는 구글과 네이버의 연관 검색어의 적합도, 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 둘째, 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하였다. 셋째, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다.
둘째, 질의를 수집하기 위하여 문헌정보학 전공 대학생들이 선택한 실제 질의들을 활용하였다. 즉, 2012년도 2학기 서울 소재 여자 사립 대학교의 문헌정보학과에서 개설한 “온라인 정보검색론” 수강생들이 제공한 실제 질의 400개를 평가 대상으로 하였다.
, 2011; NHN, 2013), 첫째, 한 세션 내에서 이용자가 특정 질의 입력 후 연속하여 입력하는 질의들을 연관 검색어들로 추출한다. 둘째, 특정 질의에 대한 검색 결과 중 이용자들이 많이 조회한 결과의 컨텐츠로부터 연관 검색어들을 추출한다. 셋째, 특정한 질의에 대한 백과사전이 나, 블로그, 카페, 지식 문서 등의 컨텐츠로부터 연관 검색어들을 추출한다.
따라서 이 연구에서는 제공된 연관 검색어가 질의와 의미적으로 긴밀한 관계를 맺고 있어, 이용자가 연관 검색어를 이용하여 질의를 확장하거나 구체화하는데 도움이 될 수 있는 경우, 적합으로 평가하였다. 반면, 연관 검색어가 질의와 전혀 무관한 경우, 지나친 의미 확장이 발생한 경우, 유해 검색어가 노출된 경우, 오타가 발생한 경우, 내용상의 오류가 존재하는 경우, 질의의 일부만 포함되어 전체 질의와는 무관한 연관 검색어가 제공된 경우 등은 부적합으로 평가하였다.
마지막으로, 연관 검색어의 유형을 질의와의 관련성 측면에서 분석하였다. 이용자가 특정 연관 검색어를 클릭 시, 검색 엔진은 이 연관 검색어를 새로운 질의로 취급하여 재검색을 수행하게 된다.
셋째, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의들 및 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교, 분석하였다.
따라서 이 연구에서는 제공된 연관 검색어가 질의와 의미적으로 긴밀한 관계를 맺고 있어, 이용자가 연관 검색어를 이용하여 질의를 확장하거나 구체화하는데 도움이 될 수 있는 경우, 적합으로 평가하였다. 반면, 연관 검색어가 질의와 전혀 무관한 경우, 지나친 의미 확장이 발생한 경우, 유해 검색어가 노출된 경우, 오타가 발생한 경우, 내용상의 오류가 존재하는 경우, 질의의 일부만 포함되어 전체 질의와는 무관한 연관 검색어가 제공된 경우 등은 부적합으로 평가하였다. 좀 더 구체적으로, 연관 검색어가 질의와 의미적으로 대등한 관계, 또는 상하 관계를 맺고 있을 때, 적합으로 평가하였다.
둘째, 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하였다. 셋째, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의들 및 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교, 분석하였다.
둘째, 포털별로 제공되는 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하고자 한다. 셋째, 연관 검색어의 유형을 질의와 연관 검색어의 관계 및 연관 검색어들 간의 관계 등의 측면에서 분석하고자 한다. 넷째, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하고자 한다.
둘째, 특정 질의에 대한 검색 결과 중 이용자들이 많이 조회한 결과의 컨텐츠로부터 연관 검색어들을 추출한다. 셋째, 특정한 질의에 대한 백과사전이 나, 블로그, 카페, 지식 문서 등의 컨텐츠로부터 연관 검색어들을 추출한다.
평가자들은 동일한 질의와 연관 검색어에 대한 평가를 수행하였으며, 학술적인 질의의 연관 검색어 평가에 있어서는 각 분야 전문가인 교수들의 자문을 제공받았다. 연구의 일관성을 위하여 동일한 질의를 네이버와 구글에 동시에 입력 후 노출되는 연관 검색어 결과에 대해 평가를 수행하였다. 본 연구에 수집된 데이터에 대한 기술 통계 및 추론 통계 분석을 위하여 IBM SPSS Statistics version 19가 활용되었다.
, 2001). 이 연구에서는 이러한 재검색 질의의 세부 유형을 참고하여 연관 검색어를 분석하였다.
이 연구에서는 이처럼 도출된 평가 기준에 대한 상세한 가이드라인을 작성하였으며, 문헌정보학과 전공자들로 구성된 세 명의 평가자들이 이러한 기준에 근거하여 연관 검색어 평가 작업을 2013년 1월 한 달 동안 수행하였다. 세 명의 평가자들은 나이, 성별, 전공 등이 모두 같은 동질적인 그룹이며, 한 달 이상 연구자로부터 연관 검색어 분석에 관한 교육을 받고, 파일럿 스터디를 수행하였기 때문에, 분석에 있어 평가자들의 주관이 개입할 여지는 매우 적다고 할 수 있다.
본 연구에서는 주요 검색 포털들인 네이버와 구글의 연관 검색어 서비스의 특징 및 품질을 조사, 분석하였다. 좀 더 구체적으로 이 연구에서는 구글과 네이버의 연관 검색어의 적합도, 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 둘째, 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하였다.
따라서 이 연구에서는 다양한 주제 분야와 다양한 난이도의 질의를 대상으로 연관 검색어를 평가하기 위하여 이용자들의 실제 질의를 활용하기로 하였다. 좀 더 구체적으로, 40명의 수강생들이 연관 검색 서비스 평가 용도로 본인이 관심 있는 질의 11개씩을 제출하였으며, 이때, 학문, 문화/예술/엔터테인먼트, 의학, 경제, 사회, 지역/여행, IT, 뉴스, 라이프스타일, 쇼핑 등 다양한 주제 분야에서 질의를 고루 선택하고, 대중적 질의와 전문적인 질의를 고루 선택하도록 안내하였다. 셋째, 이렇게 수집된 실제 질의들을 대상으로 중복 질의를 제거한 후, 2013년도 1월 9일과 10일 이틀 동안 구글, 네이버, 다음에서 제공하는 연관 검색어들을 수집하였다.
반면, 연관 검색어가 질의와 전혀 무관한 경우, 지나친 의미 확장이 발생한 경우, 유해 검색어가 노출된 경우, 오타가 발생한 경우, 내용상의 오류가 존재하는 경우, 질의의 일부만 포함되어 전체 질의와는 무관한 연관 검색어가 제공된 경우 등은 부적합으로 평가하였다. 좀 더 구체적으로, 연관 검색어가 질의와 의미적으로 대등한 관계, 또는 상하 관계를 맺고 있을 때, 적합으로 평가하였다. 예를 들어, 기업 관련 질의의 연관 검색어의 경우, 같은 분야의 경쟁사, 해당 기업이 생산한 프로그램이나 제품, 해당기업 계열사나 공장, 해당기업 정보, 해당기업 웹사이트, 카페 및 블로그 등은 적합으로 평가된 반면, 해당 기업과 전혀 무관한 업종의 기업은 부적합으로 평가되었다.
Huang, Chien, Oyang(2003)은 웹 검색 엔진의 질의 로그로부터 적합한 검색어를 추출하고 제안하는 방식을 제안하였다. 즉 이들은 특정 질의가 검색된 세션 내에서 함께 등장한 검색어들을 연관 검색어로 추천하는 방식을 제안하였으며, 약 200만 개의 질의가 포함된 대만의 검색 엔진 로그를 통하여 이 방식의 성능을 평가하였다. Zhang과 Nasraoui(2008)도 중국의 산업 분야 전문 검색 엔진인 Sina의 질의 로그를 대상으로 특정한 세션 내에서 이용자가 연속하여 입력하는 검색어들을 연관 검색어 후보군으로 추출한 후, 이 후보군에 포함된 검색어들 중 내용상 유사도가 높은 검색어들을 연관 검색어로 추천하는 알고리즘을 제안하였다.
또한 심층 면접이나 설문 조사를 통하여 연관 검색어에 대한 이용자 만족도 및 개선이 필요한 사항을 조사하여 연관 검색어 서비스 개선에 반영할 필요가 있을 것이다. 한편 이 연구에서는 대학생들의 관심 질의들에 대한 연관 검색어들을 대상으로 분석과 평가를 수행하였다. 향후 연구에 서는 성격이 다른 이용자 집단의 질의들 및 실제로 이용자들이 주로 검색하는 질의들에 대한 평가 작업도 필요할 것으로 보인다.

대상 데이터

<표 1>은 이 연구에 사용된 질의에 대한 네이버와 구글의 연관 검색어 제공 현황을 보여준다. 본 연구에 사용된 400개의 질의 중 네이버에서는 총 387개의 질의에 대해 연관 검색어가 제공되었으며, 구글에서는 총 380개의 질의에 대해 연관 검색어가 제공되었다. 연관 검색어가 제공된 질의들에 대해 네이버에서는 평균 17개의 연관 검색어가, 구글에서는 평균 7.
좀 더 구체적으로, 40명의 수강생들이 연관 검색 서비스 평가 용도로 본인이 관심 있는 질의 11개씩을 제출하였으며, 이때, 학문, 문화/예술/엔터테인먼트, 의학, 경제, 사회, 지역/여행, IT, 뉴스, 라이프스타일, 쇼핑 등 다양한 주제 분야에서 질의를 고루 선택하고, 대중적 질의와 전문적인 질의를 고루 선택하도록 안내하였다. 셋째, 이렇게 수집된 실제 질의들을 대상으로 중복 질의를 제거한 후, 2013년도 1월 9일과 10일 이틀 동안 구글, 네이버, 다음에서 제공하는 연관 검색어들을 수집하였다.
즉, 2012년도 2학기 서울 소재 여자 사립 대학교의 문헌정보학과에서 개설한 “온라인 정보검색론” 수강생들이 제공한 실제 질의 400개를 평가 대상으로 하였다.

성능/효과

구글과 네이버의 최신성 평가 결과, 최신성이 명백히 결여된 연관 검색어의 비중이 각각 전체의 3.7%와 1.2%로 나타났다. 구글에서는 특정 질의에 대해 연도별 일정이 연관 검색어로 제공되는 경우가 많았는데, 예를 들어, “한국 시리즈” 질의에 대한 가장 최신 일정으로 “2009 한국 시리즈 일정”이, “토익 시험”에 대한 최신 일정으로 “2009 토익 시험 일정”이, “수능 예상 등급 컷” 질의에 대한 최신 일정으로 “2006 수능 등급컷”, “2007 수능 등급컷”, “2008 수능 등급컷”, “2009 수능 등급컷”이 노출되었다.
네이버에서 영어 질의에 대한 부적합 검색어의 비중이 29.7%로, 한글 질의의 부적합 검색어 비중인 14.8%보다 두 배 이상 높았으며, 한글 질의와 영어 질의 간의 검색어 적합도 분포의 차이를 분석하기 위하여 카이 제곱 검정을 적용한 결과, 이 차이는 통계적으로 유의미한 것으로 나타났다(x2(1, N=6820)=105.274, p<0.001).
또한 제품 명, 음식명과 같은 쇼핑 관련 질의에서는 광고성 검색어가 항상 등장하였다. 넷째, 네이버의 경우, 대중적인 질의의 연관 검색어의 적합도가 학문적인 질의의 적합도보다 높았으며, 한글 질의의 연관 검색어의 적합도가 영어 질의의 적합도보다 현저히 높았으며, 이러한 차이는 통계 적으로 유의한 것으로 나타났다. 반면, 구글의 경우, 대중적인 질의와 학문적인 질의 간에, 그리고 한글 질의와 영어 질의 간에 연관 검색어의 적합도의 분포에 있어서 통계적으로 유의한 차이가 없었다.
대중적인 질의와 전문적인 질의 간의 적합도 분포의 차이를 분석하기 위하여 카이 제곱 검정을 적용한 결과, 네이버에서 대중적인 질의와 전문적인 질의 간에는 검색어의 적합도 분포에 있어서 통계적으로 유의한 차이가 있었다(x2(1, N=6820)= 10.385, p<0.01).
5%로 높게 나타났다. 도출된 주제 범주 중 엔터테인먼트, 라이프스타일 등은 대중적인 주제 범주로 인문/사회과학, 건강/의학 등은 전문 적인 주제 범주로 통합될 수 있는데, 전체 질의중 대중적인 주제는 약 58%로, 전문적인 주제는 42%로 나타났다. 400개 질의들 중 대중적인 질의의 예로는 “늑대소년”, “싸이”, “카카오톡”, “브레이킹던”, “아이폰 5”, “오바마”, “취업”, “무한도전”, “코레일 내일로”, “태블릿” 등을 들 수 있으며, 보다 전문적인 질의의 예로는 “정보 검색”, “기록 관리”, “장서 개발”, “재정 절벽”, “양적 완화”, “포괄 수가제”, “죄수의 딜레마”, “군중 심리”, “플라시보 효과”, “건선”, “안구 건조증” 등을 들 수 있다.
연구 결과, 첫째, 네이버가 구글보다 2배 이상 많은 수의 연관 검색어를 제공하고 있었으며, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 둘째, 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다. 또한 연관 검색어들이 상호 중복되는 경우가 많아, 실질 적으로 이용자의 질의 확장이나 변경에 기여하는 바가 크지 않을 것으로 판단된다.
둘째, 네이버의 “caffe”, 구글의 “싸이월ㄷ”, “ㅋ코레일”, “다음음카페”, “다움카페”, “psy d”와 같이 명백한 오타도 발견되었으며, 이러한 오타의 비중은 네이버와 구글에서 모두 전체 연관 검색어의 0.3%로 나타났다.
둘째, 연관 검색어의 내용이 유사한 경우가 네이버의 경우 전체의 12.7%인 863개, 구글의 경우 전체의 17%인 492개였으며, 이러한 검색어들의 예로는 “홍루몽”의 네이버 연관 검색어인 “홍루몽 내용”, “홍루몽 줄거리”, “요요 현상”의 네이버 검색어인 “요요 현상 예방법”, “요요 현상 막는 법”을 들 수 있다.
둘째, 질의에서 검색어가 삭제된 경우가 네이버에서는 전체의 2.8%인 193개, 구글의 경우 전체의 6.1%인 173개로 나타났다. 예를 들어, “빅맥 지수”의 네이버 연관 검색어로 “빅맥”이 “고흐 전시회”의 네이버 연관 검색어로 “고흐”가 “여자 연예인”의 연관 검색어로 “연예인”이 “착한 사마리아인 법”의 구글 연관 검색어로 “사마리아인 법”, “착한 사마리아인”, “사마리아인”이 제공된 경우를 들 수 있다.
둘째, 최신성의 경우, 본 연구에 사용된 질의들이 2012년 12월에 수집되었다는 점을 고려하여, 연관 검색어의 내용의 시점이 2012년인 경우 최신성이 높은 검색어로, 연관 검색어의 내용이 1년 이상 경과한 경우, 즉 연관 검색어의 내용의 시점이 2011년인 경우 최신성이 낮은 검색어로 평가하였다.
네이버에서는 현재 연관 검색어를 더보기 전과 더보기 후로 구분하여 제공하는데, 더보기 후에서 제공되는 연관 검색어들이 더보기 전에서 제공되는 연관 검색어보다 적합도가 낮았으며, 이 차이는 통계적으로 유의하였다. 따라서 연관 검색어들이 과다 하게 중복된 상태에서 더보기 후에 연관 검색어를 추가하는 방식보다는 중복되는 연관 검색어를 제거하고, 더 보기 후를 삭제하여 이용자의 불필요한 클릭을 배제하는 것이 더 효율적일 것으로 판단된다. 둘째, 포털의 영향력을 고려할 때, 이용자를 오도할 수 있는 부정확한 연관 검색어를 철저히 관리할 필요가 있다.
또한 네이버에서는 한글 질의의 연관 검색어 개수 평균이 17.68개로 영어 질의의 연관 검색어 개수 평균인 12.84개보다 현저히 높았으며, 이 차이를 비교하기 위하여 독립 표본 t-test를 적용한 결과, 한글 질의와 영어 질의 간에 제공되는 연관 검색어의 수에 있어서 통계적으로 유의한 차이가 있는 것으로 나타났다(t(398)=6.133, p<0.001).
또한 네이버의 경우, 대중적인 질의의 연관 검색어 개수 평균이 18.03개로 학문적인 질의의 연관 검색어 개수 평균인 15.59보다 높았으며, 독립 표본 t-test를 적용한 결과, 이 차이는 통계적으로 유의한 것으로 나타났다(t(393)=4.488, p<0.001).
또한, 연관 검색어에 대한 내용 분석 결과, 구글과 네이버 모두 연관 검색어들 간에 상당히 많은 중복이 발생하였으며, 전체 연관 검색어들 중 상호 중복되는 검색어들은 네이버의 경우 전체의 32%인 2,192개, 구글의 경우 전체의 33%인 948개로 나타났다. 이러한 검색어들의 예로는 “국회도서관”의 네이버 연관 검색어인 “riss”, “riss4u”, “리스포유”처럼 동의어가 반복되는 경우를 들 수 있다.
마지막으로, 이용자의 질의와 중복되지 않은 새로운 연관 검색어가 제공되는 경우는 네이버에서는 전체의 39.5%였고, 구글에서는 11.3%에 불과하였다.
네이버의 경우, 영어 질의의 검색 시 질의와 무관한 전치사, 관사, 부사 등의 불용어가 주로 노출되었으며, 이로 인해 한글 질의보다 영어 질의에서 부적합한 연관 검색어의 비중이 현저히 높았다. 마지막으로, 표준 국어법과 관련하여 가장 흔한 오류는 띄어쓰기 오류로 네이버의 경우 전체 연관 검색어의 46%, 구글은 전체의 39%로 나타났다.
9%보다 높았으며, 이 차이는 통계적으로 유의미한 것으로 나타났다. 반면, 구글에서는 대중적인 질의와 전문적인 질의 간에 검색어의 적합도 분포에 있어서 유의한 차이가 없는 것으로 나타났다. 네이버에서는 연관 검색어를 더보기 전과 더보기 후로 구분하여 제공하는데, 더보기 전의 적합 검색어의 비중이 84.
001). 반면, 구글에서는 한글 질의와 영어 질의 간에 검색어의 적합도 분포에 있어서 유의한 차이가 없는 것으로 나타났다.
001). 반면, 구글에서는 한글 질의의 연관 검색어 개수 평균이 7.01개, 영어 질의의 연관 검색어 개수 평균이 7.95개였으며, 이 차이는 통계적으로 유의하지 않은 것으로 나타났다.
001). 반면, 구글의 경우, 대중적인 질의의 연관 검색어 개수 평균이 7.34개로 학문적인 질의의 연관 검색어 개수 평균인 6.87보다 약간 높았으나, 이 차이는 통계적으로 유의하지 않은 것으로 나타났다.
또한 연관 검색어들이 상호 중복되는 경우가 많아, 실질 적으로 이용자의 질의 확장이나 변경에 기여하는 바가 크지 않을 것으로 판단된다. 셋째, 구글에서 네이버보다 유해 검색어의 비중이 더 높은 것으로 나타났으며, 두 포털 모두 유해 검색어 중 가장 큰 비중을 차지하는 유형은 광고성 검색어였으며, 이어서 저작권 침해성, 선정성 검색어 순으로 나타났다. 네이버와 구글에서 인명 검색 시 선정성, 비방성 검색어가 항상 등장하였으며, 특히 여자 인명 검색 시, 선정성 연관 검색어가 상시적으로 등장하였다.
셋째, 날짜나 국가명과 같은 일정한 패턴이 반복되는 검색어들이 네이버는 전체의 15.2%인 1,035개, 구글은 전체의 12.6%인 359개였으며, “아시아 시리즈”의 네이버 연관 검색어인 “2009 아시아 시리즈”, “2008 아시아 시리즈”, “2007 아시아 시리즈”, “수능 예상 등급컷”의 구글 연관 검색어인 “2006 수능 등급컷”, “2007 수능 등급컷”, “2008 수능 예상 등급컷”, “2009 수능 예상 등급컷” 등을 예로들 수 있다.
둘째, 드라마나 영화, 컴퓨터 소프트웨어 검색 시, 저작권 침해의 소지가 큰 “토렌트”, “온디스크”, “파일조”와 같은 불법 다운로드 사이트나 “보기”, “다운로드”, “… crack codec”과 같은 저작권 침해성 검색어도 연관 검색어로 자주 노출되었다. 셋째, 네이버와 구글에서 모두 선정적인 음란성 연관 검색어의 문제가 심각한 것으로 나타났다. 네이버에서 인명 검색, 특히 여자 인명 검색 시, 노출 또는 신체 일부와 관련된 연관 검색어가 상시적으로 등장하였다.
셋째, 유해 검색어란 일반적인 검색어가 아니며, 음란성, 저작권 침해성, 비방성, 광고성 검색어 등과 같이 연관 검색어로 수집, 제공되기에 문제가 있는 검색어들을 의미한다. 위와 같은 유해 검색어의 유형은 선행 연구(윤여생, 유진호, 2012) 및 네이버의 “연관 검색어 삭제 기준” (NHN, 2013), 한국인터넷자율정책기구(KISO) (2013)의 “연관검색어 및 자동완성검색어에 대한 정책결정 15호”를 참고하여 도출되었다.
셋째, 이용자의 질의와 연관 검색어가 동일한 경우가 네이버에서는 전체 연관 검색어의 1.9%, 구글에서는 2.7%로 나타났다. 질의와 동일한 연관 검색어는 질의에 포함된 검색어들만으로 구성된 연관 검색어를 의미하며, 검색어 순서가 변경된 경우, 불용어 제거 후 이전 질의와 동일한 검색어들을 포함하는 경우를 의미한다.
<표 2>에 따르면, 네이버와 구글 모두 적합한 연관 검색어가 부적합한 연관 검색어보다 많고, 네이버가 구글보다 적합도가 높은 검색어의 비중이 다소 높은 것으로 나타났다. 대중적인 질의와 전문적인 질의 간의 적합도 분포의 차이를 분석하기 위하여 카이 제곱 검정을 적용한 결과, 네이버에서 대중적인 질의와 전문적인 질의 간에는 검색어의 적합도 분포에 있어서 통계적으로 유의한 차이가 있었다(x²(1, N=6820)= 10.
연구 결과, 첫째, 네이버가 구글보다 2배 이상 많은 수의 연관 검색어를 제공하고 있었으며, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 둘째, 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다.
Zhang과 Nasraoui(2008)도 중국의 산업 분야 전문 검색 엔진인 Sina의 질의 로그를 대상으로 특정한 세션 내에서 이용자가 연속하여 입력하는 검색어들을 연관 검색어 후보군으로 추출한 후, 이 후보군에 포함된 검색어들 중 내용상 유사도가 높은 검색어들을 연관 검색어로 추천하는 알고리즘을 제안하였다. 오프라인 실험과 평가자들의 평가를 통하여 제안된 알고리즘이 효율적임을 발견하였다.
9%로 나타났다. 유해 검색어 중 가장 큰 비중을 차지하는 유형은 네이버와 구글 모두 광고성 검색어였다. 음식명, 제품명과 같이 광고가 예상될 수 있는 질의뿐만 아니라, 광고와 무관한 인명, 지명 관련 질의에도 광고성 검색어가 등장하였다.
셋째, 광고성, 음란성, 저작권 침해성, 비방성 검색어와 같은 유해 검색어들을 제외할 수 있는 방안이 요구된다. 이 연구에는 전문적인 질의가 많이 포함되어 유해 검색어의 비중이 상대적으로 낮은 것으로 분석된다. 그러나 대부분의 웹검색이 연예인, 뉴스, 쇼핑 등의 분야에 집중되는 현실을 고려할 때, 실제 웹 검색 환경에서는 유해 검색어의 비중이 이 조사 결과보다 훨씬 높을 것으로 예상된다.
이러한 검색어들의 예로는 “국회도서관”의 네이버 연관 검색어인 “riss”, “riss4u”, “리스포유”처럼 동의어가 반복되는 경우를 들 수 있다. 좀 더 구체적으로, 첫째, 연관 검색어들의 형태가 동일한 경우가 네이버는 전체 검색어의 4.3%인 294개, 구글은 3.4%인 97개로 나타났다. 조사 등 불용어 제거 후 동일한 검색어가 제공되는 경우, 검색어의 순서만 변경된 경우, 동일한 검색어를 한글과 영어로 표기한 경우, 동일한 외래어에 대한 표기 방식의 차이가 있는 경우 등이 이에 해당한다.
01). 즉 대중적인 질의의 경우 적합 검색어의 비중이 84.8%로, 전문적인 질의의 적합 검색어 비중인 81.9%보다 높았으며, 이 차이는 통계적으로 유의미한 것으로 나타났다. 반면, 구글에서는 대중적인 질의와 전문적인 질의 간에 검색어의 적합도 분포에 있어서 유의한 차이가 없는 것으로 나타났다.
연관 검색어의 적합도는 적합과 부적합으로 평가되었으며, 그 이유는 주제 분야 전문가들인 교수들을 대상으로 파일럿 스터디를 수행한 결과, 포털들의 연관 검색어가 적합한 그룹과 전혀 부적합한 그룹으로 양분되는 경향이 뚜렷함을 발견하였기 때문이다. 즉, 검색 포털들이 추천하는 연관 검색어들은 질의의 의미를 설명하거나 질의와 형태나 내용이 중복되는 검색어 그룹과 질의와 전혀 무관하거나 내용상 오류가 있는 검색어 그룹으로 확연하게 양분되어서, 상세한 수준의 적합도 평가 기준이 불필요하다는 전문가들의 의견이 지배적이었다.
첫째, 연관 검색어들 중 가장 빈번히 등장하는 유형은 이용자가 입력한 질의에 검색어가 추가된 경우로 네이버에서는 전체의 54%인 3,684개, 구글의 경우 전체의 78.2%인 2,232개로 나타났다. 예를 들어, 네이버에서 “국회도서관” 질의의 연관 검색어로 “국회도서관 이용”, “ 회도서관 논문”, “국회도서관 대출”이 “공정 무역”의 연관 검색어로 “미국 공정무역”, “프랑스 공정무역”이 “2013년 공휴일”의 연관 검색어로 “2013년 공휴일 수”가 구글에서 “거식증”의 연관 검색어로 “거식증 증상”이 “날씨”의 연관 검색어로 “내일 날씨”가 제공된 경우를 들 수 있다.
세 명의 평가자들은 나이, 성별, 전공 등이 모두 같은 동질적인 그룹이며, 한 달 이상 연구자로부터 연관 검색어 분석에 관한 교육을 받고, 파일럿 스터디를 수행하였기 때문에, 분석에 있어 평가자들의 주관이 개입할 여지는 매우 적다고 할 수 있다. 평가자들 간의 평가의 일치성은 95% 이상으로 매우 높았으며, 평가가 불일치하는 경우 재검토와 토론을 통하여 합의에 이르는 과정을 거쳤다. 평가자들은 동일한 질의와 연관 검색어에 대한 평가를 수행하였으며, 학술적인 질의의 연관 검색어 평가에 있어서는 각 분야 전문가인 교수들의 자문을 제공받았다.
표준 국어법과 관련하여 가장 흔히 발견되는 오류는 띄어쓰기 오류로, 네이버의 경우 전체 연관 검색어 중 46.3%인 3,138개가, 구글의 경우 전체 연관 검색어 중 38.9%인 1,110개가 띄어쓰기 오류인 것으로 나타났다. 구글의 띄어쓰기 오류의 예로는 “서브프라임모기지론”, “제주도여행싸게가는법”, “운전면허시험관리공단”, “사회적기업지원센터”, “나눔로또당첨번호확인,” 네이버의 예로는 “주택금융공사모기지론”, “IBK월복리자유적금”, “누가말을걸어도뒤돌아보지마세요”, “windows7tablet”, “kttablet”, “delltablet”, “hptablet” 등을 들 수 있다.

후속연구

이 밖에도 특정 질의에 대한 백과사전이나 블로그, 카페, 지식 문서 등으로부터도 연관 검색어를 추출하고 있다. 그러나 이 연구에서 발견된 연관 검색어의 복합적인 문제점 들을 해결하기 위해서는 자동화된 방식과 더불어 수작업으로 연관 검색어를 추출, 관리하는 방안이 고려되어야 할 것으로 보인다. 특히, 전문적이고 학문적인 성격의 질의에 대해서는 전문가의 자문을 구하는 방안도 고려될 수 있을 것이다.
따라서 연관 검색어들이 과다 하게 중복된 상태에서 더보기 후에 연관 검색어를 추가하는 방식보다는 중복되는 연관 검색어를 제거하고, 더 보기 후를 삭제하여 이용자의 불필요한 클릭을 배제하는 것이 더 효율적일 것으로 판단된다. 둘째, 포털의 영향력을 고려할 때, 이용자를 오도할 수 있는 부정확한 연관 검색어를 철저히 관리할 필요가 있다.
첫째, 로그 분석을 통하여 이용자들의 연관 검색어 이용 행태를 분석하고, 이를 연관 검색 서비스 및 인터페이스 개선에 반영하는 것이 필요할 것이다. 또한 심층 면접이나 설문 조사를 통하여 연관 검색어에 대한 이용자 만족도 및 개선이 필요한 사항을 조사하여 연관 검색어 서비스 개선에 반영할 필요가 있을 것이다. 한편 이 연구에서는 대학생들의 관심 질의들에 대한 연관 검색어들을 대상으로 분석과 평가를 수행하였다.
또한 학문적이고 전문적인 질의의 연관 검색어에 대해서도 품질 관리가 요구된다. 마지막으로, 구글은 연관 검색어에 대한 주기적인 업데이트를 통하여 연관 검색어 서비스의 최신성을 도모할 필요가 있는 것으로 보인다.
향후 연구에 서는 성격이 다른 이용자 집단의 질의들 및 실제로 이용자들이 주로 검색하는 질의들에 대한 평가 작업도 필요할 것으로 보인다. 마지막으로, 후속 연구에서는 본 연구에서 제시한 방법론에 대한 검증 및 보완 작업이 요청된다.
본 연구를 수행하기 위하여서는 평가 대상 포털의 선택 및 연관 검색어 평가용 질의와 이 질의들에 대한 연관 검색어의 수집이 필요하다. 첫째, 평가 대상 포털들로, 구글, 네이버를 선택한 이유는 국내외 검색 포털 분야에서의 이들의 위상과 인지도 때문이다.
이 연구의 결과는 향후 포털의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다. 즉 본 연구의 결과는 포털 업체들의 효과적인 검색어 추천 알고리즘 개발 및 인터페이스 개발에 중요한 자료로서 활용될 수 있을 것으로 기대된다.
이 연구의 결과는 향후 포털의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다. 즉 본 연구의 결과는 포털 업체들의 효과적인 검색어 추천 알고리즘 개발 및 인터페이스 개발에 중요한 자료로서 활용될 수 있을 것으로 기대된다.
향후 유무선 상의 웹 검색의 이용은 꾸준히 증가할 것으로 예측되므로, 연관 검색에 관한 지속적인 연구가 요청된다. 첫째, 로그 분석을 통하여 이용자들의 연관 검색어 이용 행태를 분석하고, 이를 연관 검색 서비스 및 인터페이스 개선에 반영하는 것이 필요할 것이다. 또한 심층 면접이나 설문 조사를 통하여 연관 검색어에 대한 이용자 만족도 및 개선이 필요한 사항을 조사하여 연관 검색어 서비스 개선에 반영할 필요가 있을 것이다.
한편 이 연구에서는 대학생들의 관심 질의들에 대한 연관 검색어들을 대상으로 분석과 평가를 수행하였다. 향후 연구에 서는 성격이 다른 이용자 집단의 질의들 및 실제로 이용자들이 주로 검색하는 질의들에 대한 평가 작업도 필요할 것으로 보인다. 마지막으로, 후속 연구에서는 본 연구에서 제시한 방법론에 대한 검증 및 보완 작업이 요청된다.
향후 유무선 상의 웹 검색의 이용은 꾸준히 증가할 것으로 예측되므로, 연관 검색에 관한 지속적인 연구가 요청된다. 첫째, 로그 분석을 통하여 이용자들의 연관 검색어 이용 행태를 분석하고, 이를 연관 검색 서비스 및 인터페이스 개선에 반영하는 것이 필요할 것이다.

핵심어	질문	논문에서 추출한 답변
	질의 확장은 어떻게 실행되는가?	정보 검색 분야에서 검색어 추천 또는 제안과 관련된 국외 선행 연구는 오랜 기간 동안 수행되어 왔으며(Bates, 1981), 질의 확장(query expansion)과 밀접한 관련이 있다. 질의 확장은 이용자의 초기 질의를 정련하기 위한 기법으로, 이용자의 질의에 검색어나 구를 추가함으로써 실행되며, 검색 시스템에 의해 자동으로 실행되거나, 이용자에 의해서 적합성 피드백의 형태로 수작업으로 실행된다(Xu, Luo, Yu, & Xu, 2011). 전통적인 질의 확장 기법은 대개 문서 내의 출현 단어의 분석에 기반하는데 비해(Croft, Metzler, & Strohman, 2010), 웹 검색 분야에서의 검색어 추천 기법은 문서 내 출현 단어뿐만 아니라, 질의에 대한 검색 결과 중 이용자들이 많이 조회한 결과와 같은 다양한 요소들에 근거하여 연관 검색어들을 추출한다는 점에서 차이가 있다.
	검색어 추천이란 무엇인가?	검색어 추천은 “이용자가 보다 효율적으로 질의를 작성할 수 있도록 이용자가 입력한 초기 질의에 적합한 검색어들을 제안하는 정보 검색 기법의 일종”이다(Huang, Chien, & Oyang, 2003, p. 638).
	문헌정보학 전공 대학생들이 선택한 실제 질의들을 선택한 이유는 무엇인가?	이 수강생들은 모두 문헌 정보학을 전공하거나(34명) 복수 전공하는(6명) 학생들로 3학년이 전체의 65%, 4학년이 35% 였다. 이처럼 이용자들의 실제 질의를 선택한 이유는 검색 포털들이 일반에게 공개하는 질의들은 엔터테인먼트와 뉴스에 편중되어 다양한 질의에 대한 연관 검색어 평가에 제약이 따르기 때문이다. 즉, 네이버, 다음은 각각 인기 검색어 사이트(http://searchc.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

검색 포털들의 검색어 추천 서비스 분석 평가: 네이버와 구글의 연관 검색어 서비스를 중심으로
Analysis and Evaluation of Term Suggestion Services of Korean Search Portals: The Case of Naver and Google Korea 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

성능/효과

후속연구

질의응답

참고문헌 (23)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

검색 포털들의 검색어 추천 서비스 분석 평가: 네이버와 구글의 연관 검색어 서비스를 중심으로 Analysis and Evaluation of Term Suggestion Services of Korean Search Portals: The Case of Naver and Google Korea 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

성능/효과

후속연구

질의응답

참고문헌 (23)

이 논문을 인용한 문헌

저자의 다른 논문 :

박소연 (25)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

검색 포털들의 검색어 추천 서비스 분석 평가: 네이버와 구글의 연관 검색어 서비스를 중심으로
Analysis and Evaluation of Term Suggestion Services of Korean Search Portals: The Case of Naver and Google Korea 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper