최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.5 no.9, 2016년, pp.451 - 464
이선구 (다음소프트 마이닝랩) , 온병원 (군산대학교 통계컴퓨터과학과) , 정수목 (삼육대학교 컴퓨터학부)
Nowadays, entity search such as Google Product Search and Yahoo Pipes has been in the spotlight. The entity search engines have been used to retrieve web pages relevant with a particular entity. However, if an entity (e.g., Chinatown movie) has various meanings (e.g., Chinatown movies, Chinatown res...
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
엔터티 검색은 어떠한 경우에 검색결과의 정확성이 현저히 떨어지는가? | 네이버 또는 구글 검색 엔진에서 ‘암살’과 같은 영화 엔터티를 검색하면, 그 엔터티(entity)1)와 관련 있는 웹 페이지들(relevant web pages)이 검색된다. 그러나 엔터티의 의미가 모호(ambiguous)하거나 여러 의미를 가진 경우에는 검색 결과의 정확성은 현저히 떨어진다. Fig. | |
GSS란? | 관련 있는 웹 페이지를 수집하여 ‘골드 스탠더드 세트(gold standard set; GSS)’로 정의한다. GSS는 해당 엔터티와 관련 있는 모든 웹 페이지들을 포함하는 실제 정답 세트이다. 질의어마다 검색된 상위 10개의 웹 페이지들을 ‘검색된 문서 집합(retrieved document set; RDS)’라고 하면, 질의어들의 정확성을 평가하기 위해 정밀도(precision), 재현율(recall), 조화평균(F-measure) 값들을 측정할 수 있다. | |
검색된 문서 집합에서 질의어의 정확성을 평가하기 위해 측정하는 값은? | GSS는 해당 엔터티와 관련 있는 모든 웹 페이지들을 포함하는 실제 정답 세트이다. 질의어마다 검색된 상위 10개의 웹 페이지들을 ‘검색된 문서 집합(retrieved document set; RDS)’라고 하면, 질의어들의 정확성을 평가하기 위해 정밀도(precision), 재현율(recall), 조화평균(F-measure) 값들을 측정할 수 있다. 정밀도는 검색된 웹 페이지들 중 관련 있는 웹 페이지들의 비율이고, 재현율은 관련 있는 웹 페이지들 중 실제로 검색된 웹 페이지들의 비율이다. |
K. Balog, M. Bron, and M. Rijke, "Query modeling for entity search based on terms, categories, and examples," The ACM Transactions on Information Systems, Vol.29, No.4, pp.22, 2011.
R. Blanco, P. Mika, and S. Vigna, "Effective and efficient entity search in RDF data," in Proceedings of the 10 th International Semantic Web Conference, Bonn, Germany, 2011.
T. Cheng, X. Yan, and K. Chang, "Supporting entity search: A large-scale prototype search engine," in Proceedings of ACM SIGMOD/PODS Conference, Beijing, China, 2007.
T. Cheng and K. Chang, "Entity search engine: Towards agile best-effort information integration over the web," in Proceedings of the 3 rd Biennial Conference on Innovative Data Systems Research, CA, USA, 2007.
T. Cheng, X. Yan, and K. Chang, "EntityRank: Searching entities directly and holistically," in Proceedings of the 33 rd International Conference on Very Large Data Bases, Vienna, Austria, 2007.
S. Endrullis, A. Thor, and E. Rahm, "Entity search strategies for mashup applications," in Proceedings of IEEE 28 th International Conference on Data Engineering, Washington DC, USA, 2012.
E. Elmacioglu, Y. Tan, S. Yan, M. Kan, and D. Lee, "PSNUS: Web people name disambiguation by simple clustering with rich features," in Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics, Prague, Czech, 2007.
G. Hu, J. Liu, H. Li, Y. Cao, J. Nie, and J. Gao, "A supervised learning approach to entity search," Information Retrieval Technology, Vol.4182, pp.54-66, 2006.
M. Ikeda, S. Ono, I. Sato, M. Yoshida, and H. Nakagawa, "Person name disambiguation on the web by two-stage clustering," in Proceedings of the 18 th International Conference on World Wide Web, Madrid, Spain, 2009.
B. Jansen and A. Spink, "An analysis of web documents retrieved and viewed," in Proceedings of the 16 th International Conference on Internet Computing and Big Data, NV, USA, 2003.
J. Lee and S. Cheon, "Recommendation query ranking system for the search query expansion," Journal of KIISE, Vol.36, No.2(c), 2009.
S. Yoon, "Using query word senses and user feedback to improve precision of search engine," Journal of Korea Society for Information Management, Vol.26, No.4, pp.81-91, 2009.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.