검색 엔진은 정보를 검색하는데 가장 인기 있는 방법이다. 인터넷 사용자들은 자신이 필요한 정보와 관련된 많은 웹 페이지를 불어오는 검색 엔진을 찾는데 관심을 가진다. 웹의 지속적인 성장을 위해 우리가 구할 수 있는 정보 풀을 계속해서 확장시키고, 유용한 웹 문서를 찾기 위해 SE에 의존해야 한다. 이 과정에서 사용자의 평가 관련성이 주요 이슈이다. 최근 검색엔진의 경우 단순히 관련 순위에 따른 텍스트 매칭 방식(예: 의미 일치, 사용자 클릭, 다양한 ...
검색 엔진은 정보를 검색하는데 가장 인기 있는 방법이다. 인터넷 사용자들은 자신이 필요한 정보와 관련된 많은 웹 페이지를 불어오는 검색 엔진을 찾는데 관심을 가진다. 웹의 지속적인 성장을 위해 우리가 구할 수 있는 정보 풀을 계속해서 확장시키고, 유용한 웹 문서를 찾기 위해 SE에 의존해야 한다. 이 과정에서 사용자의 평가 관련성이 주요 이슈이다. 최근 검색엔진의 경우 단순히 관련 순위에 따른 텍스트 매칭 방식(예: 의미 일치, 사용자 클릭, 다양한 쿼리 재 형성방법 등)에 더해 여러 가지 다양한 요인들을 찾는 방식으로 작동된다. 우리의 연구 목적은 추천 쿼리와 검색 엔진에 대한 평가 방법을 제시하는 것이다. 키워드 기반의 엔터티 검색(예: Apple)은 해당 값(엔터티)이 여러 번 발생하고, 모호한 특성을 가지고 있기 때문에 다양한 결과를 제공하지만, 낮은 정확도를 보여준다. 이러한 문제를 해결하기 위해, 우리의 연구는 확장 기반의 추천 쿼리 기법을 제안한다. 우리가 제안하는 기법은 엔터티 코퍼스(말뭉치)를 사용하여 추천 쿼리를 생성한다. 또한, Bing과 Yandex같은 검색 엔진의 상대적 성능을 측정하는 평가 메커니즘을 제안한다. 이 연구는 오랫동안 인기있었던 IoT와 밀접한 관계가 있는 주제 검색 결과에 대한 순위 리스트를 도출하는 자동화 기법을 제안한다. 또한, 순위 리스트의 재지정 프로세스를 위해 웹 페이지 상의 새로운 내용과 위치의 증가와 감소 내역 정보를 사용한다. 평가 척도로는 DCG (Discounted Cumulative Gain), nDCG(Normalized Discounted Cumulative Gain), MAP(Mean Average Precision)를 활용하였다. 실험 결과 제안된 기법이 일반적인 쿼리에 대해 MAP @ 5 = 0.60, DCG5 = 4.43, nDCG5 = 0.95; 타임 스탬프 쿼리의 경우 DCG5 = 4.14 및 nDCG5 = 0.93; 지리적 위치 기반 쿼리의 경우 DCG5 = 4.15 및 nDCG5 = 0.96 점수를 가진다. 이러한 결과는 제안하는 시스템이 사용자가 IOT와 관련 정보에 접근하는데 유용한다는 것을 의미한다.
검색 엔진은 정보를 검색하는데 가장 인기 있는 방법이다. 인터넷 사용자들은 자신이 필요한 정보와 관련된 많은 웹 페이지를 불어오는 검색 엔진을 찾는데 관심을 가진다. 웹의 지속적인 성장을 위해 우리가 구할 수 있는 정보 풀을 계속해서 확장시키고, 유용한 웹 문서를 찾기 위해 SE에 의존해야 한다. 이 과정에서 사용자의 평가 관련성이 주요 이슈이다. 최근 검색엔진의 경우 단순히 관련 순위에 따른 텍스트 매칭 방식(예: 의미 일치, 사용자 클릭, 다양한 쿼리 재 형성방법 등)에 더해 여러 가지 다양한 요인들을 찾는 방식으로 작동된다. 우리의 연구 목적은 추천 쿼리와 검색 엔진에 대한 평가 방법을 제시하는 것이다. 키워드 기반의 엔터티 검색(예: Apple)은 해당 값(엔터티)이 여러 번 발생하고, 모호한 특성을 가지고 있기 때문에 다양한 결과를 제공하지만, 낮은 정확도를 보여준다. 이러한 문제를 해결하기 위해, 우리의 연구는 확장 기반의 추천 쿼리 기법을 제안한다. 우리가 제안하는 기법은 엔터티 코퍼스(말뭉치)를 사용하여 추천 쿼리를 생성한다. 또한, Bing과 Yandex같은 검색 엔진의 상대적 성능을 측정하는 평가 메커니즘을 제안한다. 이 연구는 오랫동안 인기있었던 IoT와 밀접한 관계가 있는 주제 검색 결과에 대한 순위 리스트를 도출하는 자동화 기법을 제안한다. 또한, 순위 리스트의 재지정 프로세스를 위해 웹 페이지 상의 새로운 내용과 위치의 증가와 감소 내역 정보를 사용한다. 평가 척도로는 DCG (Discounted Cumulative Gain), nDCG(Normalized Discounted Cumulative Gain), MAP(Mean Average Precision)를 활용하였다. 실험 결과 제안된 기법이 일반적인 쿼리에 대해 MAP @ 5 = 0.60, DCG5 = 4.43, nDCG5 = 0.95; 타임 스탬프 쿼리의 경우 DCG5 = 4.14 및 nDCG5 = 0.93; 지리적 위치 기반 쿼리의 경우 DCG5 = 4.15 및 nDCG5 = 0.96 점수를 가진다. 이러한 결과는 제안하는 시스템이 사용자가 IOT와 관련 정보에 접근하는데 유용한다는 것을 의미한다.
Search engines are the most popular source of information retrieval. Every web user is interested in finding the best search engine which can fetch the highest number of relevant pages against his\her information need. The continuing growth of the web consistently expands the information pool availa...
Search engines are the most popular source of information retrieval. Every web user is interested in finding the best search engine which can fetch the highest number of relevant pages against his\her information need. The continuing growth of the web consistently expands the information pool available to us and we must increasingly rely on SE to find useful web documents. In this process of user evaluation relevance is the main issue. State of the art search engines is working to explore various other factors other than text matching for relevance ranking (like semantical matching, click through, various query reformulation methods etc.). Our study aims to present a query suggestion and evaluation methods for search engines. Keyword-based entity searches (e.g., Apple) fetch diverse results because of the multiple occurrences and ambiguous nature of the entity and show low precision. To address this problem, this paper presents an expansion-based query suggestion scheme. Our scheme uses the attribute-oriented corpus to produce query suggestions. Secondly, we proposed evaluation mechanism to measure the relative performance of search engines: Bing and Yandex. This work proposes an automatic scheme that populates a sustainable optimal rank list of search results with higher precision for IoT-related topics. Additionally, we use newness and geo-sensitivity-based boosting and dampening of web pages for the re-ranking process. The two evaluation matrices we used, first for checking the standard rank, we use an evaluation matrix based on the discounted cumulative gain (DCG), normalized DCG (nDCG), and mean average precision (MAPn). The experimental results show that the proposed scheme achieves scores of MAP@5 = 0.60, DCG5 = 4.43, and nDCG5 = 0.95 for general queries; DCG5 = 4.14 and nDCG5 = 0.93 for time-stamp queries; and DCG5 = 4.15 and nDCG5 = 0.96 for geographical location-based queries. These outcomes validate the usefulness of the suggested system in helping a user to access IoT-related information.
Search engines are the most popular source of information retrieval. Every web user is interested in finding the best search engine which can fetch the highest number of relevant pages against his\her information need. The continuing growth of the web consistently expands the information pool available to us and we must increasingly rely on SE to find useful web documents. In this process of user evaluation relevance is the main issue. State of the art search engines is working to explore various other factors other than text matching for relevance ranking (like semantical matching, click through, various query reformulation methods etc.). Our study aims to present a query suggestion and evaluation methods for search engines. Keyword-based entity searches (e.g., Apple) fetch diverse results because of the multiple occurrences and ambiguous nature of the entity and show low precision. To address this problem, this paper presents an expansion-based query suggestion scheme. Our scheme uses the attribute-oriented corpus to produce query suggestions. Secondly, we proposed evaluation mechanism to measure the relative performance of search engines: Bing and Yandex. This work proposes an automatic scheme that populates a sustainable optimal rank list of search results with higher precision for IoT-related topics. Additionally, we use newness and geo-sensitivity-based boosting and dampening of web pages for the re-ranking process. The two evaluation matrices we used, first for checking the standard rank, we use an evaluation matrix based on the discounted cumulative gain (DCG), normalized DCG (nDCG), and mean average precision (MAPn). The experimental results show that the proposed scheme achieves scores of MAP@5 = 0.60, DCG5 = 4.43, and nDCG5 = 0.95 for general queries; DCG5 = 4.14 and nDCG5 = 0.93 for time-stamp queries; and DCG5 = 4.15 and nDCG5 = 0.96 for geographical location-based queries. These outcomes validate the usefulness of the suggested system in helping a user to access IoT-related information.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.