$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

시맨틱검색엔진의 성능평가에 관한 연구
A Study on the Performance Evaluation of Semantic Retrieval Engines 원문보기

한국비블리아학회지 = Journal of the Korean Biblia Society for Library and Information Science, v.22 no.2, 2011년, pp.141 - 160  

노영희 (건국대학교 인문과학대학 문헌정보학과)

초록
AI-Helper 아이콘AI-Helper

본 연구에서는 유동성이 크고 데이터의 규모도 상당한 도서관에 일반화시켜 적용할 수 있는 지식베이스검색엔진을 제안하였다. 이를 위해 총 세 개의 지식베이스(트리플 구조 온톨로지, 의미거리기반 의미망지식 베이스, 키워드중심의 도치색인파일)를 구축하였고, 이의 성능을 측정하기 위해 각각 세 개의 검색엔진(추론 규칙기반 제나검색엔진, 개념기반 검색엔진, 키워드기반 루씬검색엔진)을 구축하였다. 시스템 성능평가 결과, 종합적으로 개념기반 검색엔진이 가장 높은 성능을 보여주었고, 다음으로 온톨로지기반 제나검색엔진, 다음으로 일반 키워드 검색엔진 순으로 나타났다.

Abstract AI-Helper 아이콘AI-Helper

This study suggested knowledge base and search engine for the libraries that have the largescaled data. For this purpose, 3 components of knowledge bases(triple ontology, concept-based knowledge base, inverted file) were constructed and 3 search engines(search engine JENA for rule-based reasoning, C...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 둘째, 온톨로지 및 추론엔진의 성능을 비교·평가하고자 하였다.
  • 본 논문에서는 시맨틱검색환경을 구축하기 위해서 OWL 기반의 온톨로지를 구축하고 메타데이터를 생성하였다. OWL은 W3C에서 시맨틱 웹의 온톨로지 언어로 표준화된 언어로써 다양한 OWL공리를 제공한다.
  • 본 논문에서의 온톨로지기반의 시맨틱 추론의 목적은 온톨로지로부터 생성된 메타데이터에 대해 OWL에서 제공하는 공리를 사용하여 추론하고 이러한 추론된 사실을 바탕으로 사용자로부터 입력된 질의문으로 시맨틱검색을 수행하기 위함이다. 본 논문에서의 시맨틱검색은 ‘Description Logic’ 기반의 온톨로지를 바탕으로 생성된 메타데이터에 대해 전방향 추론기법을 사용하여 검색하기 때문에 기존의 키워드검색이나 일반적인 질의응답시스템에서 찾기 힘든 정보에 대한 검색이 가능하다.
  • 본 연구는 지금까지 다양한 각도에서 연구되어온 온톨로지 및 추론엔진에 관한 연구를 일반화할 수 있는 방안을 제시하는데 있다. 특히 유동성이 크고 데이터의 규모도 상당한 도서관에 일반화 시켜 적용하는 것이 필요한데, 지금까지 이론적으로만 연구될 수밖에 없었던 문제점들을 발견하고 개선해 보고자 하였다.
  • 지금까지 수행된 연구들의 경우 시맨틱검색 시스템을 개발하는데 주력하고 있거나 좀 더 나아간다면 키워드검색기법과의 성능차이를 비교하는 정도의 연구를 수행했다. 본 연구에서는 국내외적으로 그 성능이 검증되고 있는 제나기반 시맨틱검색시스템을 구현하고, 의미망기반 개념기반 검색시스템의 성능을 비교하고자 하였다.
  • 본 연구에서는 기초 언어자원을 효과적으로 구축할 수 있는 방법론을 모색하고 그 성능을 평가한 1차 연구결과를 기반으로 추론에 기반한 의미검색 환경을 구현할 수 있도록 하고자 하였다(Noh 2011). 즉, 1차 연구에서 구축된 온톨로지는 정보관리학회지에 수록된 논문기사 189건이며, 누리미디어의 DBPia로부터 추출된 데이터이다.
  • 본 연구에서는 실험을 위해 지식베이스와 검색엔진을 구축 및 개발하였다. 총 세개의 지식베이스(트리플구조 온톨로지, 의미거리기반 의미망지식베이스, 키워드중심의 도치색인파일)를 구축하였고, 이의 성능을 측정하기 위해 각각 세 개의 검색엔진(추론규칙 기반 제나검색엔진, 개념기반 검색엔진, 키워드기반 루씬검색엔진)을 구축하였다.
  • 본 연구에서는 온톨로지에 추론엔진을 적용한 시맨틱검색관련 연구를 살펴보았으며, 시맨틱검색기법과 기존의 키워드검색기법의 성능을 평가한 연구들 중심으로 분석하였다.
  • 본 연구에서는 위에서 구축된 검색엔진의 성능을 가장 일반적인 평가방법으로 사용되고 있는 재현율과 정확률로 평가하였다. 세 개의 검색엔진의 성능을 평가한 결과는 다음 <표 2>,<그림 4>와 같다.
  • 둘째, 온톨로지 및 추론엔진의 성능을 비교·평가하고자 하였다. 성능평가를 위한 방법론은 다양하겠지만 본 연구에서는 가장 일반적인 성능평가 방법인 재현율과 정확률, 그리고 이 둘의 조합인 F1척도를 사용하여 그 성능을 평가하고자 하였다.
  • 일반적인 웹의 목적은 사람 사이의 원활한 커뮤니케이션과 더불어 컴퓨터시스템들 간의 효과적인 커뮤니케이션이라 할 수 있다. 이 목적의 실현은 인터넷 자원을 소화할 수 있는 하부구조의 정립을 전제한 매우 복잡하고 시급한 과제라 할 수 있다. 단일 인터페이스로 모든 유형의 정보(텍스트, 음악, 동영상, 이미지 등)에 접근하는 방법과 용이성과 융통성을 그 특징으로 하는 HTML의 광범위한 수용으로 인터넷 정보량은 폭발적으로 증가했고 그 결과 전문색인 기반 검색엔진의 효율은 현격히 낮아졌다.
  • 그러나 최근에는 정보통신기술의 발전으로 하드웨어시스템의 성능이 향상되었음을 감안하여 제고할 필요가 있는 검색기법이라 판단된다. 이에 본 연구에서는 개념기반 정보검색기법을 시맨틱 웹 검색기법과 그 성능을 비교함으로써 실제 적용성 및 검색 성능의 향상을 도모하고자 하였다.
  • 특히 본 연구에서는 지금까지 연구되고 적용되어 온 온톨로지 구축방법을 이용하되, 구축된 온톨로지로부터 이용자의 요구에 적합한 자료를 탐색하는 검색기법의 적용에 있어서, 개념기반 정보검색기법(Concept-based Information Retrieval Techniques)을 적용하였다. 즉, 본 연구에서는 개념기반 정보검색기법을 시맨틱 웹 검색기법인 제나와 그 성능을 비교함으로써 실제 적용성 및 검색 성능의 향상을 도모하고자 하였다.
  • 본 연구는 지금까지 다양한 각도에서 연구되어온 온톨로지 및 추론엔진에 관한 연구를 일반화할 수 있는 방안을 제시하는데 있다. 특히 유동성이 크고 데이터의 규모도 상당한 도서관에 일반화 시켜 적용하는 것이 필요한데, 지금까지 이론적으로만 연구될 수밖에 없었던 문제점들을 발견하고 개선해 보고자 하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
일반적인 웹의 목적은 무엇인가? 일반적인 웹의 목적은 사람 사이의 원활한 커뮤니케이션과 더불어 컴퓨터시스템들 간의 효과적인 커뮤니케이션이라 할 수 있다. 이 목적의 실현은 인터넷 자원을 소화할 수 있는 하부구조의 정립을 전제한 매우 복잡하고 시급한 과제라 할 수 있다.
전문색인 검색의 근본적인 단점은? 단일 인터페이스로 모든 유형의 정보(텍스트, 음악, 동영상, 이미지 등)에 접근하는 방법과 용이성과 융통성을 그 특징으로 하는 HTML의 광범위한 수용으로 인터넷 정보량은 폭발적으로 증가했고 그 결과 전문색인 기반 검색엔진의 효율은 현격히 낮아졌다. 단순히 용어의 발생빈도수를 따라 정보를 차등취급하는 방법은 웹 문서에 기술된 모든 내용에 거의 일률적인 중요성을 부여하는 것이며 이것은 전문색인 검색의 근본적인 단점이라고 할 수 있다.
DAML+OIL(DARPA Agent Markup Language+Ontology Inference Layer) 마크업 언어의 취약점은? RDF와 RDF 스키마를 기반으로 이 두 언어에 부족한 모델링 요소를 확장, 강화하여 개발된 언어가 DAML+OIL(DARPA Agent Markup Language+Ontology Inference Layer) 마크업 언어이다. 그러나 이 언어의 취약점은 용어간의 의미 혼동을 일으킬 수 있다는 것이며 이러한 단점을 보완하기 위해 이 언어와 거의 완벽한 호환성을 유지한 OWL이 제시된 것이다. 이 언어는 웹 문서 및 응용프로그램에 내재한 클래스와 속성들 간의 관계 정의 기능을 강화함으로써 DAML의 단점을 보완하도록 발전된 언어이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (30)

  1. 강래구. 2007. 시맨틱 웹 환경에서 온톨로지기반의 지능형 상품 검색 시스템 설계 및 구현. 석사학위논문. 조선대학교. 

  2. 김영민, 이상준. 2003. 시맨틱을 이용한 연구 논문 검색 시스템. 한국인터넷정보학회, 4(3): 15-22. 

  3. 김태환, 전호철, 최중민. 2008. 시맨틱 웹 서비스 기반 커뮤니티 정보 검색 시스템. 한국컴퓨터종합학술대회 논문집, 35(1): 299-304. 

  4. 박종욱. 2008. 온톨로지기반 검색을 이용한 지능형 통계 검색 모델에 관한 연구. 석사학위논문. 공주대학교. 

  5. 박지형, 박상언, 이명진, 홍준석, 김우주. 2007. 다중 온톨로지를 이용한 시맨틱 웹 포털에서의 의미형 검색. 한국지능정보시스템학회, 11: 463-467. 

  6. 박진석, 양기철, 오정진. 2004. 시맨틱 웹 기반 박물관 유물 검색을 위한 온톨로지 설계 및 구현. 한국콘텐츠학회, 2(2): 269-274 

  7. 심재문. 2008. 온톨로지 추론엔진 성능 평가 및 지능형 엔진 선택 기법에 대한 연구. 석사학위논문. 경희대학교. 

  8. 이재원, 박성찬, 이상근, 박재휘, 김한준, 이상구. 2010. 개념 망을 통한 전자 카탈로그의 시맨틱검색 및 추천. 한국전자거래학회, 15(3): 131-145. 

  9. 정은경. 2003. 시맨틱 웹 환경에서의 온톨로지 기반 정보검색 시스템. 석사학위논문. 제주대학교. 

  10. 하상범, 한은영, 최호준. 2005. OWL 기반의 SPARQL을 이용한 시맨틱검색. 한국정보과학회, 32(2): 706-708. 

  11. 한동일, 권혁진, 정학진. 2007. 시맨틱검색시스템의 구현과 평가에 관한 연구. 한국IT서비스학회, 7(3): 253-269. 

  12. Carroll, J. J., L. Dickinson, D. Dollin, D. Reynolds, A. Seaborne, and K. Wilkinosn. 2004. "Jena: Implementing the Semantic Web Recommendations." Proceedings of the 13th International World Wide Web Conference, New York. 74-83. 

  13. Chen, H. and V. Dhar. 1991. "Cognitive Process as a Basis for Intelligent Retrieval Systems Design." Information Processing & Management, 27(5): 405-432. 

  14. Christophides, V., et al. 2003. "The ICSFORTH SWIM: A Powerful Semantic Web Integration Middleware." In Proceedings of the First International Workshop on Semantic Web and Databases(SWDB), Co-located with VLDB 2003. 

  15. Haarslev, V., R. Moller, and M. Wessel. 2004. "Querying the Semantic Web with Racer + nRQL." Proceedings of the Ki-04 Workshop on Applications of Description Logics. 

  16. Karvounarakis, G., A. Magganaraki, S. Alexaki, V, Christophides, D. Plexousakis, Michel Scholl, and Karsten Tolle. 2003. "Querying the Semantic Web with RQL." Computer Networks, 42(5): 617-640. 

  17. Kevin, W., C. Sayers, and H. Kuno. 2003. "Efficient RDF Storage and Retrieval in Jena 2." Proceedings of First International Workshop on Semantic Web and Databases, 131-151. 

  18. Lee, M. C., H. K. Jan, Y. S. Paik, S. E. Jinf, and S. Lee. 2006. "A Ubiquitous Device Collaboration Infrastructure: Celadon." 3rd Workshop on Software Technologies for Future Embedded & Ubiquitous Systems. 

  19. Ma, L., G. Xie, T. Yang, and L. Zhang. 2006. "IODT: IBM Integrated Ontology Development Toolkit." [cited 2009.12.16]. Available at: , 2004. 

  20. Maedche A, B. Motik, L. Stojanovic, R. Studer, and R. Volz. 2003. "Ontologies for Enterprise Knowledge Management." IEEE Intelligent Systems, 18(2): 26- 33. 

  21. Noh, Younghee. 2001. "A Study on the Estimation of Performance of the Conceptbased Information Retrieval Model for Searching the Web." Journal of Information Science, 28(5): 407-415. 

  22. Noh, Younghee. 2011. "A Study on Constructing the Ontology of LIS Journal." Journal of the Korean Society for Information Management, 28(2): 177-193. 

  23. Pan, J. 2006. "HAWK: OWL Repository and Toolkit 1.5 Releases." [cited 2009.10.6]. Available at: . 

  24. Parsia, B., B. Sirin, M. Grov, and R. Alford. 2003. "Mindswap Project: Pellet." Available at: . 

  25. Prud'Hommeaux, E. and A. Seaborne. 2006. SPARQL Query Language for RDF. W3C Working Draft 4. 

  26. Salton, G., Edward A. Fox, and Harry Wu. 1983. "Extended Boolean Information Retrieval." Communications of ACM, 26(12): 1022-1036. 

  27. Seaborne, Andy. 2003. A Query Language for RDF. W3C Member Submission 9-January-2004. [cited 2009.10.15]. Available at: . 

  28. Sirin, E., B. Parsia, B. C. Grau, A. Kalyanpur, and Y. Katz. 2007. "Pellet: A Practical OWL-DL Reasoner." Journal of web Semantics, 5(2): 1-26. 

  29. Wessel, M. and R. Moler. 2005. "A High Performance Semantic Web Query Answering Engine." International Workshop on Description Logics(DL2005), Edinburgh, Scotland, UK. 

  30. Zhou, J., L. Ma, Q. Liu, L. Zhang, Y. Yu, and Y. Pan. 2006. "Minerva: A Scalable OWL Ontology Storage and Inference System." The Semantic Web-ASWC 2006, Volum LNCS 4185, 429-443. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로