$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"
쳇봇 이모티콘
안녕하세요!
ScienceON 챗봇입니다.
궁금한 것은 저에게 물어봐주세요.

논문 상세정보

웹 검색엔진 분류 및 하이브리드 검색엔진의 필요성

Classification of Web Search Engines and Necessity of a Hybrid Search Engine

초록

2017년 기준, 데스크탑과 모바일 영역에서 90% 이상의 압도적인 점유율을 보이는 검색엔진은 Google로써, 대다수의 사람들은 Google 이 검색하는 영역이 웹의 전체라고 생각할 것이다. 그러나 웹 연구 결과에 의하면 전체 웹 데이터의 불과 10% 만이 Google에 의해 검색가능하다고 한다. 대부분의 영역은 딥 웹이라고 불리며 Google 과는 다른 종류의 검색엔진들에 의해 검색된다. 해당 엔진들은 자신만의 딥 웹 데이터베이스를 구축 후 특화된 알고리즘을 사용하여 높은 정확성과 전문성의 검색결과를 제공한다. 현재 사용되고 있는 검색엔진들 중, 전체 웹 영역을 검색하는 엔진은 존재하지 않는다. 광범위에 걸쳐 그리고 유효하면서 정확 신속한 검색을 수행하기 위한 최적의 방법은 Google 같은 일반적인 검색엔진과 딥 웹 검색엔진들을 동시에 적용하여 결과를 도출하는 것이다. 본 논문에서는 이러한 검색엔진을 하이브리드검색엔진이라 명하고 기존 검색엔진들에 비해 갖는 차이점 및 특징에 대해 살펴본 후 개괄적인 프레임을 제시한다.

Abstract

Abstract In 2017, it has been reported that Google had more than 90% of the market share in search-engines of desktops and mobiles. Most people may consider that Google surely searches the entire web area. However, according to many researches for web data, Google only searches less than 10%, surprisingly. The most region is called the Deep Web, and it is indexable by special search engines, which are different from Google because they focus on a specific segment of interest. Those engines build their own deep-web databases and run particular algorithms to provide accurate and professional search results. There is no search engine that indexes the entire Web, currently. The best way is to use several search engines together for broad and efficient searches as best as possible. This paper defines that kind of search engine as Hybrid Search Engine and provides characteristics and differences compared to conventional search engines, along with a frame of hybrid search engine.

질의응답 

키워드에 따른 질의응답 제공
핵심어 질문 논문에서 추출한 답변
딥 웹
딥 웹이 검색 엔진으로 접근이 허용되지 않는 이유는?
딥 웹을 구성하고 있는 대다수의 데이터원 들은 전문적인 데이터베이스로 구축되어 있기에 허가받지 못한 사용자들은 접근 자체를 할 수 없을 뿐 더러 해당 데이터들은 일반 검색엔진들에게 색인을 허용하지 않기 때문

문제는 우리가 손쉽게 이용하는 구글, 야후, Bing 등과 같은 검색 엔진으로는 접근이 허용되지 않는다는 것이다. 왜냐하면 딥 웹을 구성하고 있는 대다수의 데이터원 들은 전문적인 데이터베이스로 구축되어 있기에 허가받지 못한 사용자들은 접근 자체를 할 수 없을 뿐 더러 해당 데이터들은 일반 검색엔진들에게 색인을 허용하지 않기 때문이다. 끊임 없이 변하고 있는 표면 웹 데이터와 더불어 그 양을 측정할 수없는 딥 웹의 데이터까지, 사용자의 요구에 부합하는 정보를 얼마나 정확하고 빠르게 그리고 가능한 많이 웹 세상으로부터 도출하는가는 데이터 주도의 빅데이터 세상에서 검색 엔진들이 필수적으로 갖추어야 하는 능력일 것이다.

딥 웹의 데이터
딥 웹의 데이터는 무엇인가?
표면 웹에 존재하는 데이터와 비교해서 훨씬 더 전문적 이고 정확하게 수준 높은 지식을 전달하는 도메인 특화된 데이터

전체 웹 정보의 90% 이상 (일반적으로, 96% 정도의 비중을 차지하고 있는 것으로 고려)을 차지하고 있는 딥 웹의 데이터들2) 은, 표면 웹에 존재하는 데이터와 비교해서 훨씬 더 전문적 이고 정확하게 수준 높은 지식을 전달하는 도메인 특화된 데이터라고 할 수 있다. 그림 1은 딥 웹을 구성하고 있는 전문 영역들에 대한 개괄적인 분류 또한 보인다.

딥 웹
딥 웹의 데이터 증가의 문제점은?
문제는 우리가 손쉽게 이용하는 구글, 야후, Bing 등과 같은 검색 엔진으로는 접근이 허용되지 않는다는 것이다

뿐만 아니라, 딥 웹은 전체 웹 영역에서 가장 빠르게 데이터가 증가하고 있는 영역이다. 문제는 우리가 손쉽게 이용하는 구글, 야후, Bing 등과 같은 검색 엔진으로는 접근이 허용되지 않는다는 것이다. 왜냐하면 딥 웹을 구성하고 있는 대다수의 데이터원 들은 전문적인 데이터베이스로 구축되어 있기에 허가받지 못한 사용자들은 접근 자체를 할 수 없을 뿐 더러 해당 데이터들은 일반 검색엔진들에게 색인을 허용하지 않기 때문이다.

질의응답 정보가 도움이 되었나요?

저자의 다른 논문

참고문헌 (0)

  1. 이 논문의 참고문헌 없음

이 논문을 인용한 문헌 (0)

  1. 이 논문을 인용한 문헌 없음

문의하기 

궁금한 사항이나 기타 의견이 있으시면 남겨주세요.

Q&A 등록

원문보기

원문 PDF 다운로드

  • ScienceON :

원문 URL 링크

원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)

이 논문 조회수 및 차트

  • 상단의 제목을 클릭 시 조회수 및 차트가 조회됩니다.

DOI 인용 스타일

"" 핵심어 질의응답