$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

부분매칭 경로질의를 위한 포스트픽스 공유에 기반한 스트리밍 XML 데이타 필터링 기법
A Filtering Technique of Streaming XML Data based Postfix Sharing for Partial matching Path Queries 원문보기

정보과학회논문지. Journal of KIISE. 데이타베이스, v.33 no.1, 2006년, pp.138 - 149  

박석 (서강대학교 컴퓨터학과) ,  김영수 (삼성전자 정보통신총괄)

초록
AI-Helper 아이콘AI-Helper

센서 네트워크나 유비쿼터스 환경이 보급되면서 최근에는 저장되어 있는 데이타가 아닌 계속적으로 빠르게 지나가는 스트리밍 데이타에 대한 연구가 활발하게 이루어지고 있다. 기존의 Publish-Subscribe 시스템도 인터넷의 발달로 데이타가 실시간으로 빠르게 들어오는 스트리밍 데이터의 형태를 가지게 되면서 스트리밍 데이타 연구에 관심을 가지게 되었고 이 중에서도 웹 환경의 표준으로 많이 사용되는 XML에 관심을 가지게 되었다. Publish-Subscribe 시스템에서 서버에 들어오는 스트리밍 XML 데이타에 대해서 질의에 빠르게 매치(match)되는 것을 찾기 위한 스트리밍 XML 데이타 필터링 기법이 오토마타를 이용해서 연구되었으며, 이중에서 비결정적 오토마타를 사용한 방법이 YFilter이다. 비결 정적 오토마타를 사용하는 YFilter의 경우 질의 앞부분의 공통된 오퍼레이터를 한번에 계산하기 위해서 XPath 질의의 공통된 앞부분을 공유하고 질의의 루트부터 처리하는 하향식 방식을 사용하고 있다. 하지만, 부분매칭 경로질의의 경우에는 질의의 앞부분 공유를 방해하고 질의를 루트에서부터 처리할 필요가 없기 때문에 YFilter에서 부분매칭 경로질의가 증가하면 처리량이 떨어지는 문제가 발생한다. 본 논문에서는 이 문제 대해 XPath 질의의 공통된 뒷부분 공유에 기반한 상향식 방식을 사용하는 PoSFilter를 한가지 해결책으로 제시한다. 그리고 YFilter와 PoSFilter의 처리량을 비교를 통해서 PoSFilter의 경우 부분매칭 경로질의가 증가할 때 YFilter보다 좋은 처리량을 나타내는 것을 검증한다.

Abstract AI-Helper 아이콘AI-Helper

As the environment with sensor network and ubiquitous computing is emerged, there are many demands of handling continuous, fast data such as streaming data. As work about streaming data has begun, work about management of streaming data in Publish-Subscribe system is started. The recent emergence of...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 그다음에 가 들어오면 스택에 다시 상태1을 푸쉬하고 이 들어오면 스택의 탑의 상태1에서 email 엘리먼트로 어디로 이동할 수 있는지 살펴본다.
  • 나) 다음에 질의가 들어오면 우선 기존에 들어온 XPath 질의 오토마타의 마지막 상태들을 저장한 리스트를 보고 이 안에서 들어온 질의가 기존의 질의들과 칠의의 앞부분이 공유될 수 있는지 살펴본다. 질의의 앞부분이 공유될 수 있다면 공유하여 최대 공유될 수 있는 오토마타 상태를 저장해둔다.
  • 하지만, YFilter의 경우 부분 매칭 경로 질의가 증가하면 처리량이 떨어지는 문제점이 존재했다. 본 논문에서는 이런 문제점을 해결하기 위해서. 새로운 스트리밍 XML 필터링 기법으로 PoS- Fiiter를 제안하고 있다.
  • Publish-Subscribe 시스템[1, 2]은 데이타가 서버에 들어올 때 그 데이타들 중에서 원하는 데이타를 얻기 위해서 사용자가 질의를 등록하면 이 질의들은 서버에 저장되고 사용자들이 등록한 질의에 대해서 들어오는데 이 타에 매치하는 질의가 있다면 해당 질의를 등록한 사용자에게 매치된 데이타를 보내주는 시스템이다. 본 연구에서는 이 시스템에서 발생하는 데이타가 스트리밍 XML 데이타인 경우인 XML-based Publish- Subscribe 시스템에 대해 연구하고 있으며, 이 경우에 스트리밍 XML 데이타의 형태로 들어온 XML 문서가 사용자가 등록한 XPath 질의에 매치되면 해당 XML 문서를 질의를 보낸 사용자에게 보내준다. Publish- Subscribe 시스템에서 스트리밍 XML 데이타 필터링 기법은 스트리밍 XML 데이타 형태로 들어온 XML 문서가 어떤 질의에 매치되는지 빠르게 알려주기 위한 기법이다, 그림 1은 Publish-Subscribe 시스템의 한 예를 보여주고 있다.
  • 이 실험에서는 사용자가 등록한 모든 질의가 부분 매칭 경로 질의이고 질의의 수가 증가할 때 YFilter와 PoSFilter의 처리량의 변화를 알아보려고 한다. 그림 9는 질의가 모두 부분 매칭 경로 질의이며 질의의 개수가 100, 500, 1000일 때의 결과를 나타내고 있다.
  • 이 실험에서는 정해진 질의 수에 대해서 부분 매칭 경 로질의 비율이 변할 때 그에 따른 두 개의 필터링 기법의 처리량을 비교하기 위한 실험이다. 질의의 수는 100이고 부분 매칭 경로 질의의, 비율이 0%, 20%, 40%, 60%, 80%, 100%로 변경된다.
  • 스트리밍 XML 필터링 기법에서는 XPath의 질의 종류 중에서 어떤 질의가 들어올지 모르기 때문에 질의 종류에 따라 처리량이 떨어지는 것은 문제가 된다. 하지만 YFilter의 경우에는 질의의 공통적인 앞부분 공유 (prefix sharing)에 기반한 하향식(top- down) 비결정적 오토마타를 사용하기 때문에 부분 매칭 경로 질의가 증가하면 처리량이 떨어지는 문제점이 존재한다 본 논문은 부분 매칭 경로 질의에서 처리량이 떨어지는 문제에 대한 새로운 필터링 기법으로 질의 뒷부분 공유(postfix sharing)에 기반한 상향식(bottom-up) 비결정적 오토마타를 사용하는 해결책을 제시한다. 제시한 해결책은 부분 매칭 경로 질의의 비율이 증가하면 기존의 YFilter보다 좋은 처리량을 나타낸다.

가설 설정

  • . XPath의 위치 경로 탐색을 우선적으로 고려하기 위해서 XPath 질의에서 predicate를 제외한 질의로 가정한다.
  • . 스트리밍 XML 데이타 필터링 기법에서 가정하는 질의는 지금 들어오고 있는 스트리밍 XML 문서에 대한 질의만을 가정한다. 즉, 지나간 문서는 저장되지 않기 때문에 질의 처리를 하지 않는다.
  • 가) 우선 맨 처음 질의가 들어온 경우에는 공유할 오토마타 상태가 없기 때문에 새로운 오토마타 상태를 생성하며 새로운 오토마타 상태를 생성할 경우 이 상태들을 나타내기 위해 생성하는 상태의 순서에 따라 번호를 매긴다.
  • 실험을 위한 스트리밍 XML 데이타로 XMark[8]에서 제공하는 온라인 옥션을 위한 DTD를 사용하였다. 여기에서 가정하는 온라인 옥션은 옥션의 사용자가 자신이 원하는 물건의 정보를 얻기 위해서 XPath 질의를 서버에 등록하고 이 옥션에서는 물건을 팔거나 산다는 정보를 스트리밍 XML 데이타 형태로 실시간으로 받아들인다. 여기에서는 옥션의 사용자가 등록한 XPath 질의를 크게 루트에서 시작하는 질의와 부분 매칭 경로 질의의 두 가지로 나눈다.
본문요약 정보가 도움이 되었나요?

참고문헌 (13)

  1. B. Babcock, S. Babu, M. Datar, R. MotWani, J. Widom, 'Models and Issues In Data Stream Systems,' In Proceeding of the PODS, 2002, pp.1-16 

  2. Mehmet Altinel, Michael J. Franklin, 'Efficient Filtering of XML Documents for selective Dissemination of Information,' In Proceeding of the VLDB, 2000, pp.53-64 

  3. Yanlei Diao, Michael J. Franklin, 'High-Performance XML Filtering: an overview of YFilter,' Bulletin of the IEEE, 2003, pp.1-8 

  4. Yanlei Diao, Peter Fischer, Michael J. Franklin, Raymond To, 'YFilter: Efficient and scalable Filtering of XML Documents,' In Proceeding of the ICDE, 2002 

  5. Yanlei Diao, Mehmet Altinel, Michael J. Franklin, Hao Zhang, Peter Fischer, 'Path Sharing and Predicate Evaluation for High-Performance XML Filtering,' ACM Transcations on Database Systems, 2003, pp. 467-516 

  6. Todd J. Green, Gerome Miklau, Makoto Onizuka, and Dan Suciu, 'Processing XML Streams with Deterministic Automata,' In Proceeding of the LNCS, 2003, pp. 173-189 

  7. Todd J. Green, Gerome Miklau, Makoto Onizuka, and Dan Suciu, 'Processing XML Streams with Deterministic Automata and Stream Indexes,' In Proceeding of the TODS, 2004 

  8. Albrecht Schmidt, Florian Waas, Martin Kersten, Michael J. Carey, Ioana Manolescu, Ralph Busse, 'XMark: A Benchmark for XMl Data Management,' In Proceeding of the VLDB, 2002, pp.974-985 

  9. Tim Furche, 'Optimizing multiple queries against XML streams,' http://www.pms.ifi.lmu. de/publikationen/diplomarbeiten/Tim.Furche/mqspex.pdf 

  10. Chin-Wan Chung, Jun-Ki Min, Kyuseok Shim, 'APEX: An Adaptive Path Index for XML data,' In Proceeding of the SIGMOD, 2002, pp.121-132 

  11. S. Babu and J. Widom, 'Continuous Queries over data Streams,' In Proceeding of the SIGMOD, 2001, pp.109-120 

  12. Jianjun Chen, David J. DeWitt, Feng Tian, Yuan Wang, 'NiagaraCQ: A Scalable Continuous Query System for Internet databases,' In Proceeding of the SIGMOD, 2000, pp.379-390 

  13. P.Th. Eugster, P.Felber, R. Guerraoui, A. M. Kermarrec, 'The Many Faces of Publish/ Subscribe,' ACM Computing Serveys, 2003, pp.114-131 

저자의 다른 논문 :

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로