$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

가지형 패턴의 시퀀스화를 이용한 XML 문서 필터링
FiST: XML Document Filtering by Sequencing Twig Patterns 원문보기

정보과학회논문지. Journal of KIISE. 데이타베이스, v.33 no.4, 2006년, pp.423 - 436  

권준호 (서울대학교 전기컴퓨터공학부) ,  문봉기 ,  이석호 (서울대학교 전기컴퓨터공학부)

초록
AI-Helper 아이콘AI-Helper

최근 XML 문서 필터링에 기반한 출판 -구독 (publish-subscribe) 시스템이 많은 관심을 받고 있다. 전형적인 출판 구독 시스템에서, 구독자들은 XPath 언어로 명세된 프로파일로 자신들의 관심을 표현하고, 새로운 내용들은 사용자 프로파일에 대하여 매칭 여부를 판단하여 관심을 가지고 있는 사용자들에게만 배달된다. 구독자의 수와 그들의 프로파일이 증가할수록, 시스템의 확장성이 출판 구독 시스템의 중요한 성공 요소가 된다. 이 논문에서는 XPath 로 명세된 가지형 패턴과 입력 XML 문서들을 Prufer의 방법을 사용하여 시퀀스로 변환하는 FiST라 불라는 새로운 필터링 시스템을 제안한다. FiST 시스템은 가지형 패턴을 구성하는 선형 경로들에 대하여 각각 매칭을 수행하고 후처리 과정에서 그 결과들을 병합하는 방법을 이용하는 대신에 가지형 패턴 전체를 사용하여 입력 문서에 대하여 매칭을 수행한다. 또한 효율적인 필터링을 위하여 시퀀스들을 해시 기반의 동적 인덱스로 구성한다. 실험 결과를 통해 전체 매칭 접근 방법이 다양한 환경에서 낮은 필터링 비용과 좋은 확장성을 가짐을 알 수 있다.

Abstract AI-Helper 아이콘AI-Helper

In recent years, publish-subscribe (pub-sub) systems based on XML document filtering have received much attention. In a typical pub-sub system, subscribing users specify their interest in profiles expressed in the XPath language, and each new content is matched against the user profiles so that the ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이를 위해서 FiST는 XML 가지형 패턴 (사용자 프로파일)과 XML 문서들을 Priifer 시퀀스로 변환한다. 이 논문에서는 Priifer 시퀀스를 사용하여 점 진 적 서브 시퀀스 매칭을 수행하는 단계와 브랜치 검증을 통하여 잘못된 결과들을 버리는 정제 단계로 구성된 필터링 알고리즘을 제안하였다. 또한 다양한 환경에서 FiST 시스템이 최신의 연구인 YFilter 시스템보다 좋은 결과를 나타냄을 실험으로서 보였다.
  • 이 논문에서는 XML 문서 필터링 시스템 FiST를 제 안 하였다. 이전의 연구들은 가지형 패턴을 여러 개의 선 형 경로들로 분해하여 각각의 선형 경로에 대하여 매칭을 수행하고 그 결과를 합쳐는 반면에, FiST 시스템은 입력 XML 문서에 대하여 전체 가지형 패턴 매칭을 수행할 수 있다.
  • 일반적으로 XML 필터링 시스템에서는 사용자들이 XPath 언에U를 사용하여 사용자 프로파일을 명세한다. 이 논문에서는 가지 형 패턴 (twig pattern)으로 표현되는 사용자 프로파일을 다룬다. 가지형 패턴은 자식 (child) 과 후손 (descendant) XPath 축(axis)을 포함하는 2개 이상의 선형 경로(linear path)로 구성된다.
  • 이 논문에서는 가지형 패턴에서의 노드들의 순서가 문서에서의 노드들의 순서와 일치하는 순서 매칭만을 다룬다.
본문요약 정보가 도움이 되었나요?

참고문헌 (16)

  1. Anders Berglund, Scott Boag, Don Chamberlin, Mary F. Fernandez, Michael Kay, Jonathan Robie and Jrme Simon, XML Path Language (XPath) 2.0 W3C Working Draft 16. Technical Report WD-xpath-20-20020816, World Wide Web Consortium, August 2002 

  2. Karim Muller, 'Semi-Automatic Construction of a Question Treebank,' In Proceedings of the 4th International Conference on Language Resources and Evaluation, Lisbon, Portugal, 2004 

  3. H. Prufer, 'Neuer Beweis eines Satzes tiber Permutationen,' Archiv fur Mathematik und Physik, 27: 142-144, 1998 

  4. Praveen R. Rao and Bongki Moon, 'PRIX: Indexing and Querying XML Using Prufer Sequences,' In Proceedings of the 20th IEEE International Conference on Data Engineering, pp. 288-299, Boston, MA, March 2004 

  5. Mehmet Altinel and Michael J. Franklin, 'Efficient Filtering of XML Documents for Selective Dissemination of Information,' In Proceeding of the 26th VLDB Conference, pp. 53-64, Cairo, Egypt, September 2000 

  6. Yanlei Diao, Mehmet Altinel, Michael J. Franklin, Hao Zhang and Peter Fischer, 'Path sharing and predicate evaluation for high-performance XML filtering,' ACM Trans. Database Systems, Vol. 28, No.4, pp. 467-516, 2003 

  7. Chee Yong Chan, Pascal Felber, Minos N. Garofalakis and Raieev Rastogi, 'Efficient Filtering of XML Documents with XPath Expressions,' In Proceedings of the 18th IEEE International Conference on Data Engineering, pp. 235-244, San Jose, CA, February 2002 

  8. Ashish Kumar Gupta and Dan Suciu, 'Stream processing of XPath queries with predicates,' In Proceeding of the 2003 ACM-SIGMOD conference, pp. 419-430, San Diego, CA, June 2003 

  9. T. Green, A. Gupta, G. Miklau, M. Onizuka, and D. Suciu, 'Processing XML Streams with Deterministic Automata and Stream Indexes,' ACM Trans. on Database Systems, Vol. 29 No.4, pp. 752-788, December 2004 

  10. Nicolas Bruno, Luis Gravano, Nick Koudas and Divesh Srivastava, 'Navigation- vs. Index-Based XML Multi-Query Processing,' In Proceedings of the 19th IEEE International Conference on Data Engineering, pp. 139-150, Bangalore, India, March 2003 

  11. Feng Tian, Berthold Reinwald, Hamid Pirahesh, Tobias Mayr and jussi Myllymaki, 'Implementing a Scalable XML Publish/Subscribe System Using a Relational Database System,' In Proceeding of the 2004 ACM-SIGMOD Conference, pp. 479-490, Paris, France, June 2004 

  12. Quanzhong Li and Bongki Moon, 'Indexing and Querying XML Data for Regular Path Expressions,' In Proceeding of the 27th VLDB Conference, pp. 361-370, Rome, Italy, September 2001 

  13. N. Bruno, N. Koudas, D. Srivastava, 'Holistic Twig Joins: Optimal XML Pattern Matching,' In Proceeding of the 2002 ACM-SIGMOD conference, pp. 310-321, Madison, WI, June 2002 

  14. David Megginson, Simple API for XML, http://sax.sourceforge.net/ 

  15. Apache Xerces C++ Parser. http://xml.apache.org/xerces-c/ 

  16. Angel Luis Diaz and Douglas Lovell, XML Generator. http://www.alphaworks.ibm.com/tech/xml-generator 

저자의 다른 논문 :

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로