포털 사이트의 핵심 서비스인 검색서비스는 입력되는 검색어 중에서 짧은 순간에 급상승하는 검색어를 대상으로 순간 검색빈도가 높은 것을 기준으로 순위별로 제시하는 것이므로 일정기간 동안 관심도가 높은 검색어를 곧바로 알려주기는 힘들다. 따라서 이를 극복하고 검색어 변화에 대한 향상된 분석결과가 나오게 하여 보다 지능적인 정보검색 서비스를 제공하기 위한 노력이 필요하다. 이를 위하여 본 논문에서는 실시간검색어의 관심도와 지속도, 그리고 주목도를 측정할 수 있는 기준을 제시한다. 그리고 그 기준에 맞추어 일정기간 동안 시간, 일간, 주간, 월간 실시간검색어에 대한 변화의 측정과 집계를 하고 이를 통해 관심도가 높은 이슈, 관심이 길게 지속된 이슈, 변화가능성이 커서 앞으로 주목해야 할 이슈를 평가한다.
포털 사이트의 핵심 서비스인 검색서비스는 입력되는 검색어 중에서 짧은 순간에 급상승하는 검색어를 대상으로 순간 검색빈도가 높은 것을 기준으로 순위별로 제시하는 것이므로 일정기간 동안 관심도가 높은 검색어를 곧바로 알려주기는 힘들다. 따라서 이를 극복하고 검색어 변화에 대한 향상된 분석결과가 나오게 하여 보다 지능적인 정보검색 서비스를 제공하기 위한 노력이 필요하다. 이를 위하여 본 논문에서는 실시간검색어의 관심도와 지속도, 그리고 주목도를 측정할 수 있는 기준을 제시한다. 그리고 그 기준에 맞추어 일정기간 동안 시간, 일간, 주간, 월간 실시간검색어에 대한 변화의 측정과 집계를 하고 이를 통해 관심도가 높은 이슈, 관심이 길게 지속된 이슈, 변화가능성이 커서 앞으로 주목해야 할 이슈를 평가한다.
The search service, which is a core service of the portal site, presents search queries that are rapidly increasing among the inputted search queries based on the highest instantaneous search frequency, so it is difficult to immediately notify a search query having a high degree of interest for a ce...
The search service, which is a core service of the portal site, presents search queries that are rapidly increasing among the inputted search queries based on the highest instantaneous search frequency, so it is difficult to immediately notify a search query having a high degree of interest for a certain period. Therefore, it is necessary to overcome the above problems and to provide more intelligent information retrieval service by bringing improved analysis results on the change of the search queries. In this paper, we present the criteria for measuring the interest, continuity, and attention of real-time search queries. In addition, according to the criteria, we measure and summarize changes in real-time search queries in hours, days, weeks, and months over a period of time to assess the issues that are of high interest, long-lasting issues of interest, and issues that need attention in the future.
The search service, which is a core service of the portal site, presents search queries that are rapidly increasing among the inputted search queries based on the highest instantaneous search frequency, so it is difficult to immediately notify a search query having a high degree of interest for a certain period. Therefore, it is necessary to overcome the above problems and to provide more intelligent information retrieval service by bringing improved analysis results on the change of the search queries. In this paper, we present the criteria for measuring the interest, continuity, and attention of real-time search queries. In addition, according to the criteria, we measure and summarize changes in real-time search queries in hours, days, weeks, and months over a period of time to assess the issues that are of high interest, long-lasting issues of interest, and issues that need attention in the future.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이에 본 논문에서는 ‘현재 포털의 관심 이슈를 알려주세요’ 라는 요구에 대해 실시간검색어의 일정기간 관심도를 평가하여 일간(최근 1일), 주간(최근 1주일), 월간(최근 4주)에 대한 관심도 점수 합계가 상위에 속하는 검색어를 제시해주고, ‘현재까지 포털의 지속 이슈를 알려주세요’ 라는 요구에 대해 실시간검색어의 일정기간 지속도를 평가하여 일간(최근 1일), 주간(최근 1주일), 월간(최근 4주)에 대한 지속도가 각각 상위로 나타나는 검색어를 제시해주며, ‘향후 포털의 주목 이슈를 알려주세요’라는 요구에 대해 일간(최근 1일), 주간(최근 1주일), 월간(최근 4주)에 대한 지속도 평가를 위한 집계를 근거로 그 기간 동안의 각 주별, 일자별, 시간별 평균변화율을 구하여 평균변화율이 일간, 주간, 월간 최고 상승과정에 속하는 검색어를 ,제시해줌으로써 인공지능 비서가 대답하는 것으로 삼을 수 있게 하고자 한다.
이에 본 논문에서는 이를 극복하고, 최근 들어 더욱 발전하고 있는 인공지능 비서에게 실시간검색어 관련 요청사항을 질의하면 이에 대한 적절한 답변을 해주는 서비스가 되도록 하는 지능적인 정보검색 서비스를 제공하기 위한 노력으로 일정기간 동안 실검순위에 따른 상대적 관심도 점수를 계산하고 이를 기초로 그 기간 동안 실시간검색어의 변화량을 측정하고 집계하여 분석함으로써 실시간검색어에 대한 관심도, 지속도, 주목도를 파악하여 관심 이슈, 지속 이슈, 주목 이슈를 추출하는 방법을 제시하였다.
제안 방법
본 논문의 실험데이터는 네이버와 다음(Daum) 각각에 대해 실시간검색어 순위에 따른 관심도 점수를 부여하여 수집한 후, 분석을 실시할 때 병합하여 사용한다.
이들 항목들을 기준으로 그룹핑하고 각 항목별 집계를 통하여 집계표를 만들어 이를 기초로 정렬과 분석을 통해 월간(4주), 주간(최근 1주), 일간(최근 1일) 관심도,지속도, 주목도를 평가한다.
이에 본 논문에서는 ‘현재 포털의 관심 이슈를 알려주세요’ 라는 요구에 대해 실시간검색어의 일정기간 관심도를 평가하여 일간(최근 1일), 주간(최근 1주일), 월간(최근 4주)에 대한 관심도 점수 합계가 상위에 속하는 검색어를 제시해주고, ‘현재까지 포털의 지속 이슈를 알려주세요’ 라는 요구에 대해 실시간검색어의 일정기간 지속도를 평가하여 일간(최근 1일), 주간(최근 1주일), 월간(최근 4주)에 대한 지속도가 각각 상위로 나타나는 검색어를 제시해주며, ‘향후 포털의 주목 이슈를 알려주세요’라는 요구에 대해 일간(최근 1일), 주간(최근 1주일), 월간(최근 4주)에 대한 지속도 평가를 위한 집계를 근거로 그 기간 동안의 각 주별, 일자별, 시간별 평균변화율을 구하여 평균변화율이 일간, 주간, 월간 최고 상승과정에 속하는 검색어를 ,제시해줌으로써 인공지능 비서가 대답하는 것으로 삼을 수 있게 하고자 한다. 이를 위해서 빅데이터 분석 도구로 널리 사용하는 R언어를 통해[19] 실시간검색어를 수집하고 저장하고 집계하고 분류하여 관심도, 지속도, 주목도를 평가한다.
현재 관심도가 높은 관심 이슈로 일간(최근 1일), 주간(최근 1주일), 월간(최근 4주)에 대한 관심도 점수 합계가 상위에 속하는 검색어를 제시해주고, 현재까지 일정 기간 관심도가 유지되는 지속기간에 근거하여 월간, 주간, 일간 지속 이슈를 실시간검색어의 일정기간 지속도를 평가하여 일간(최근 1일), 주간(최근 1주일), 월간(최근 4주)에 대한 지속도 상위 검색어를 제시해주며, 각 지속 이슈를 기반으로 일간(최근 1일), 주간(최근 1주일),월간(최근 4주)에 대한 각 주별, 일자별, 시간별 평균변화율을 구하여 평균변화율이 일간, 주간, 월간 최고에 속하는 검색어에 해당되는 주목 이슈를 알 수 있게 하였다. 이는 향후 인공지능 비서의 실시간검색어 기반 여러 이슈의 질의에 대한 대답으로 삼을 수 있다는 측면에서 의의가 있고, 향후 가치 있는 응용을 다양하게 만들 수 있기 때문에 발전 가능성이 높다.
대상 데이터
그러나 2분 간격으로 시시각각 변화하는 실검순위만으로는 실제적인 순간 관심도를 나타내기 힘들므로 실검순위에 따른 상대적 점수를 부여하여 실시간검색어의 중요성을 평가하는 척도로 삼는 것이 값의 크기에 따라 관심도가 높은 것으로 볼 수 있으므로 보다 바람직하디고 할 수 있다. 따라서 실시간검색어를 수집할 때 매 순간 실검순위에 따른 상대적 점수를 계산하여 데이터를 획득한다. 실검순위에 따른 관심도 점수 계산은 다음과 같은 식에 의해 수행한다.
실시간검색어는 현재 네이버의 경우 ‘급상승검색어’라는 제목으로 1~10위, 11~20위 두 부분으로 서비스하고 있고, 다음(Daum)의 경우 ‘실시간이슈검색어’라는 제목으로 1~10위 까지 서비스하고 있다. 본 논문에서는 실시간검색어의 변화량을 분석하여 평가하기 위해서 사용되는 데이터는 대표적인 두 포털 사이트의 홈페이지에서 제공하는 실시간검색어 상위 10개씩을 2018년 7월 3일에서 2018년 7월 30일까지 4주간 2분 간격으로 수집한 것이다. 여기서 수집되는 데이터 항목은 포털종류, 검색어,주, 일, 시, 분, 실검순위, 관심도 점수 등이다.
후속연구
주로 음악 감상, 언어번역, 뿐만 아니라 일부 감성 대화 서비스까지도 제공하고 있다. 앞으로 이러한 추세의 영향으로 포털 사이트의 핵심 서비스라 할 수 있는 정보검색 서비스를 데이터마이닝의 기초인 텍스트마이닝을 기반으로 보다 지능화시켜서 실시간검색어와 관련된 추가적인 질의응답 서비스로 발전시킬 것으로 예상된다[8-10].
특히 일정 기간별 관심, 지속, 주목 이슈에 대한 연속성을 유지시키기 위해 실시간검색어의 수집기간을 늘려서 중단 없이 동적으로 분석하여 그 결과를 서비스하도록 하는 한편, 연간 분석으로 확대시키고, 현재시점을 기준으로 주야간, 평일과 휴일 단위로 세분화하여 분석하는 추가적인 연구가 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
현제 포털사이트가 제공하는 실시간검색어의 문제점은 무엇인가?
그러나 현재 포털 사이트에서 제공하는 실시간검색어는 사용자의 관심도가 실시간으로 급상승하는 검색어의 순간 검색율이 높은 것 순으로 제시하므로 현재까지 시간, 일간, 주간, 월간 상위 관심도를 갖는 검색어나 상위지속도를 갖는 검색어를 알기 힘들고 더구나 최근의 변화율이 높은 상위 주목도를 갖는 검색어를 찾는 것은 더욱 힘들다[11-13]. 그러므로 이를 극복하고 검색어 변화에 대한 향상된 분석결과가 나오게 하여 보다 지능적인 정보검색 서비스를 제공하기 위한 노력이 필요하다[14-16].
정보검색 서비스는 현재 어떤 발전을 하고있는가?
특히 모바일 웹의 발전과 확산이 두드러진 환경 속에서 IoT 연결의 확대가 급속도로 이루어짐으로써 클라우드 컴퓨팅이 일반화되고, 이를 기반으로 빅데이터의 중요성이 널리 알려지고, 빅데이터 분석과 신경망 학습에 의한 인공지능의 비약적인 발전이 이루어지고 있다[2-5].
실시간검색어는 어떤 사이트에서 어떻게 서비스 되고 있는가?
실시간검색어는 현재 네이버의 경우 ‘급상승검색어’라는 제목으로 1~10위, 11~20위 두 부분으로 서비스하고 있고, 다음(Daum)의 경우 ‘실시간이슈검색어’라는 제목으로 1~10위 까지 서비스하고 있다. 본 논문에서는 실시간검색어의 변화량을 분석하여 평가하기 위해서 사용되는 데이터는 대표적인 두 포털 사이트의 홈페이지에서 제공하는 실시간검색어 상위 10개씩을 2018년 7월 3일에서 2018년 7월 30일까지 4주간 2분 간격으로 수집한 것이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.