구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템 설계 및 구현 A design and implementation of the management system for number of keyword searching results using Google searching engine원문보기
인터넷 상에 많은 정보들이 발생하면서 검색 엔진은 사용자에게 필요한 흩어진 정보를 모아주는 중요한 역할을 하고 있다. 일부 검색 엔진에서는 검색어가 포함된 검색 결과 페이지뿐만 아니라 검색 결과 수도 함께 제공하고 있다. 구글 검색엔진에서 제공하는 검색 결과 수는 인터넷에서 해당 검색어에 대한 전체적인 추세를 파악하는데 활용될 수 있다. 본 논문에서는 구글 검색엔진에서 제공하는 검색결과 수를 효과적으로 관리할 수 있는 구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템을 설계하고 구현하고자 한다. 제안하는 시스템은 웹으로 작동하며 검색 에이전트, 저장 노드, 검색 노드로 구성되어 키워드 및 검색 결과 수를 관리하고 검색을 수행한다. 최종 검색 결과로는 검색 키워드, 검색 결과 수, 검색 결과 수를 활용하여 두 키워드의 거리를 계산하는 NGD(Normalized Google Distance)가 제공된다.
인터넷 상에 많은 정보들이 발생하면서 검색 엔진은 사용자에게 필요한 흩어진 정보를 모아주는 중요한 역할을 하고 있다. 일부 검색 엔진에서는 검색어가 포함된 검색 결과 페이지뿐만 아니라 검색 결과 수도 함께 제공하고 있다. 구글 검색엔진에서 제공하는 검색 결과 수는 인터넷에서 해당 검색어에 대한 전체적인 추세를 파악하는데 활용될 수 있다. 본 논문에서는 구글 검색엔진에서 제공하는 검색결과 수를 효과적으로 관리할 수 있는 구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템을 설계하고 구현하고자 한다. 제안하는 시스템은 웹으로 작동하며 검색 에이전트, 저장 노드, 검색 노드로 구성되어 키워드 및 검색 결과 수를 관리하고 검색을 수행한다. 최종 검색 결과로는 검색 키워드, 검색 결과 수, 검색 결과 수를 활용하여 두 키워드의 거리를 계산하는 NGD(Normalized Google Distance)가 제공된다.
With lots of information occurring on the Internet, the search engine plays a role in gathering the scattered information on the Internet. Some search engines show not only search result pages including search keyword but also search result numbers of the keyword. The number of keyword searching res...
With lots of information occurring on the Internet, the search engine plays a role in gathering the scattered information on the Internet. Some search engines show not only search result pages including search keyword but also search result numbers of the keyword. The number of keyword searching result provided by the Google search engine can be utilized to identify overall trends for this search word on the internet. This paper is aimed designing and realizing the system which can efficiently manage the number of searching result provided by Google search engine. This paper proposed system operates by Web, and consist of search agent, storage node, and search node, manage keyword and search result, numbers, and executing search. The proposed system make the results such as search keywords, the number of searching, NGD(Normalized Google Distance) that is the distance between two keywords in Google area.
With lots of information occurring on the Internet, the search engine plays a role in gathering the scattered information on the Internet. Some search engines show not only search result pages including search keyword but also search result numbers of the keyword. The number of keyword searching result provided by the Google search engine can be utilized to identify overall trends for this search word on the internet. This paper is aimed designing and realizing the system which can efficiently manage the number of searching result provided by Google search engine. This paper proposed system operates by Web, and consist of search agent, storage node, and search node, manage keyword and search result, numbers, and executing search. The proposed system make the results such as search keywords, the number of searching, NGD(Normalized Google Distance) that is the distance between two keywords in Google area.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 구글 검색엔진을 활용하여 개별 키워드의 검색결과 수뿐만 아니라 복수개의 키워드를 동시에 검색한 결과 수까지도 관리할 수 있는 구글 검색 엔진을 활용한 키워드 검색결과 수 관리 시스템을 제안한다.
본 논문에서는 복수개의 키워드를 동시에 검색하여 그 검색결과를 자동으로 추출하고 이를 관리할 수 있는 할 수 있는 구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템을 설계하고 구현하고자 한다. 본 논문에서 제안하는 시스템은 크게 검색 에이전트, 저장 노드, 검색 노드로 구성되어 동작하며, 최종 검색 결과로는 검색 키워드, 검색 결과 수, 검색 결과 수를 활용하여 두 키워드의 거리를 계산하는 NGD(Normalized Google Distance)[3]가 제공된다.
본 논문에서는 복수개의 키워드를 동시에 검색하여 그 검색결과를 자동으로 추출하고 이를 관리할 수 있는 할 수 있는 구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템을 설계하고 구현하였다. 본 논문에서 제안하는 시스템은 크게 검색 에이전트, 저장 노드, 검색 노드로 구성되어 동작한다.
가설 설정
본 논문에서는 NGD를 구하는 식 (1)에서 M의 값을 [3]에서 최대범위로 보았던 9⋅109 로가정하여 계산하였다.
제안 방법
검색 에이전트에서 검색 명령을 내리면 검색 노드에서는 실제 검색을 위한 검색 프로그램이 동작하면서 검색이 이루어지며 본 논문에서는 PHP 스크립트로 구현하였다. PHP 스크립트에서는 검색 키워드를 PHP의 urlencode()함수를 이용하여 인코딩 한 후 검색 엔진에서 검색 키워드가 들어가는 특정 위치에 입력하여 검색한다.
본 논문에서는 복수개의 키워드를 동시에 검색하여 그 검색결과를 자동으로 추출하고 이를 관리할 수 있는 할 수 있는 구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템을 설계하고 구현하고자 한다. 본 논문에서 제안하는 시스템은 크게 검색 에이전트, 저장 노드, 검색 노드로 구성되어 동작하며, 최종 검색 결과로는 검색 키워드, 검색 결과 수, 검색 결과 수를 활용하여 두 키워드의 거리를 계산하는 NGD(Normalized Google Distance)[3]가 제공된다.
본 논문에서는 복수개의 키워드를 동시에 검색하여 그 검색결과를 자동으로 추출하고 이를 관리할 수 있는 할 수 있는 구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템을 설계하고 구현하였다. 본 논문에서 제안하는 시스템은 크게 검색 에이전트, 저장 노드, 검색 노드로 구성되어 동작한다. 최종 검색 결과로는 검색 키워드, 검색 결과 수, 검색 결과 수를 활용하여 두 키워드의 거리를 계산하는 NGD(Normalized Google Distance)가 제공된다.
검색 결과 처리기는 검색 노드에서 검색을 수행한 후에 저장노드에 입력된 검색 결과 값을 활용하여 사용자에게 최종적으로 다양한 형태의 결과를 보여주는 역할을 수행한다. 본 논문에서는 두 키워드의 정보거리인 NGD값을 제공한다. 본 논문에서는 NGD를 구하는 식 (1)에서 M의 값을 [3]에서 최대범위로 보았던 9⋅109 로가정하여 계산하였다.
대상 데이터
본 논문에서 설계한 시스템은 리눅스 환경에서 구현되었다. 제안하는 시스템에 사용한 운영체제는 UBUNTU 14.
5, 검색을 수행하는 프로그램은 PHP5, JAVASCRIPT, HTML5를 사용하여 구현하였다. 본 논문에서는 검색에 8대의 검색 노드를 사용하였다. 그림 6은 웹을 통해 접근하는 시스템 초기화면이다.
검색 에이전트로부터 검색 명령을 받은 검색 노드들은 SQL 쿼리에 지정된 LIMIT 수만큼의 키워드 쌍에 대한 검색을 수행한다. 본 논문에서는 한 번의 검색에 50개의 키워드에 대한 검색을 수행한다. 검색 노드는 검색을 위한 키워드를 불러올 때 저장 노드에서 관리하는 기본적인 속성에 공백이 있을 경우 검색을 중지하고 임의의 시간을 대기한 후 다시 검색을 수행한다.
본 논문에서 설계한 시스템은 리눅스 환경에서 구현되었다. 제안하는 시스템에 사용한 운영체제는 UBUNTU 14.04로 검색 에이전트, 검색노드, 저장노드에 모두 사용되었다. 저장노드의 검색 키워드 및 검색 결과 수를 관리하는 데이터베이스로 MYSQL-SERVER 5.
데이터처리
04로 검색 에이전트, 검색노드, 저장노드에 모두 사용되었다. 저장노드의 검색 키워드 및 검색 결과 수를 관리하는 데이터베이스로 MYSQL-SERVER 5.5, 검색을 수행하는 프로그램은 PHP5, JAVASCRIPT, HTML5를 사용하여 구현하였다. 본 논문에서는 검색에 8대의 검색 노드를 사용하였다.
성능/효과
검색을 수행한 후 검색 결과 화면에서 검색 결과 수를 의미하는 ‘검색결과 약’ 과 ‘개’사이의 숫자를 파싱하여 검색 결과 수로 저장 노드의 Result속성에 저장된다.
본 논문에서 제안하는 시스템을 활용하여 임의의 키워드 집합에서 서로 관련이 깊은 두 키워드 쌍을 쉽게 찾을 수 있고, 또한 이러한 대용량 키워드 쌍의 집합들에 대한 시간에 따른 관련성의 변화 등을 파악할 수 있는 시작점이 될 수 있다.
저장 노드에 검색 키워드가 입력되면 검색 버튼을 통해 검색 노드에서 실제 검색이 이루어진다. 저장 노드에 저장된 검색 결과 값으로 NGD 값을 계산하고 결과 보기 버튼을 통해 저장 노드의 키워드, 검색 결과수, 검색 결과 수를 활용하여 계산한 NGD 값이 최종 검색 결과로 클라이언트에게 제공된다. 최종 검색 결과는 검색 결과 순으로 출력하거나 NGD 순으로 출력할 수 있다.
본 논문에서 제안하는 시스템은 크게 검색 에이전트, 저장 노드, 검색 노드로 구성되어 동작한다. 최종 검색 결과로는 검색 키워드, 검색 결과 수, 검색 결과 수를 활용하여 두 키워드의 거리를 계산하는 NGD(Normalized Google Distance)가 제공된다.
후속연구
향후 연구 과제로는 제안 시스템의 확장성에 관한 부분과 실제 데이터로 적용시켜 활용하는 부분 등이 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
제안하는 시스템에서 검색 에이전트의 역할은 무엇인가?
검색 에이전트는 제안하는 시스템에서 사용자가 원하는 키워드를 저장 노드에 입력하고, 검색 노드의 검색 수행, NGD 값 계산 최종 검색 결과를 사용자에게 제공하는 역할을 한다.
구글 검색 엔진은 어떤 기술을 사용하여 검색 결과를 제공하는가?
구글 검색 엔진은 어떤 페이지가 다른 페이지에 얼마나 참조되었는가를 판단하는 페이지랭크(PageRank)기술[1]을 사용하여 검색 결과를 제공하는데, 현재 서비스를 제공하는 대부분의 검색엔진과는 달리 검색 키워드가 포함된 검색 결과 페이지뿐만 아니라 ‘검색 결과의 수’도 함께 보여주고 있다. 이러한 검색 결과의 수는 그 활용방법에 따라 다양한 분야에서 활용될 수 있다.
저장 노드의 검색 키워드 쌍에는 어떤 정보들이 들어있는가?
저장 노드는 검색 키워드 쌍과 이에 관한 여러 정보를 관리한다. 검색 키워드 쌍에 관한 정보에는 키워드 쌍의 내용은 물론 각 키워드들의 검색 결과 수, 키워드 쌍을 함께 검색한 결과 수가 포함된다. 아울러 검색노드에 아직 검색이 완료되지 않은 검색 키워드 쌍을 찾을 수 있도록 하는데 필요한 여러 정보도 관리한다.
참고문헌 (8)
S. Brin and L. Page, "The Anatomy of a large-scale hypertextual Web search engine", Computer Networks and ISDN Systems, vol.30, no.1-7, pp.107-117, Apr. 1998.
Google Flu Trend [Internet]. Avaliable: https://www.google.org/flutrends/about/
R. L. Cilibrasi and P. M. Vitanyi, "The google similarity distance", IEEE Transactions on, Knowledge and Data Engineering, vol. 19, no. 3, pp.370-383, Mar. 2007.
Google Trend [Internet]. Available: https://www.google.com/trends
J. Ginsberg, M. H. Mohebbi, R. S. Patel, L. Brammer, M. S. Smolinski and L. Brilliant, "Detecting influenza epidemics using search engine query data," Nature, vol. 457, pp. 1012-1014, Feb. 2009.
H. Achrekar, A. Gandhe, R. Lazarus, S. H. Yu, and B. Liu, "Predicting flu trends using Twitter data," The First International Workshop on Cyber-Physical Networking Systems, pp.702-707, Apr. 2011.
Google Ngram Viewer [Internet]. Available: https://books.google.com/ngrams
F. H. Messerli, "Chocolate Consumption, Cognitive Function, and Nobel Laureates," The New England And Journal Of Medicine, vol. 367, pp. 1562-1564, Oct. 2012.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.