$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

중첩 윈도우를 가진 데이터 스트링을 위한 효율적인 조인 알고리즘
An Efficient Join Algorithm for Data Streams with Overlapping Window 원문보기

정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터, v.15 no.5, 2009년, pp.365 - 369  

김현규 (KAIST 전산학과) ,  강우람 (KAIST 전산학과) ,  김명호 (KAIST 전산학과)

초록
AI-Helper 아이콘AI-Helper

일반적으로 중첩 윈도우스트림 질의에서 흔히 이용된다. 그럼에도 불구하고, 기존의 연구에서는 범플링 윈도우나 튜플-드리븐 윈도우 등의 기본적인 윈도우만을 가정하고 조인 알고리즘을 다루었다. 본 논문에서는 보다 일반화된 윈도우의 형태인 중칩 윈도우상에서 조인을 효율적으로 처리하기 위한 알고리즘을 제안한다. 제안하는 알고리즘은 기본적으로 점증 조인 후 합병하는 방법을 이용한다. 그리고, 대량의 입력으로부터 메모리 오버플로우가 빈번하게 발생하는 상황에서 연속적으로 윈도우 조인 결과를 생성하는 방법에 중점을 두었다. 제안하는 방법은 (1) 점증 조인과 중복을 허용한 완전 조인을 선택적으로 이용하는 방법, (2) 조인 결과의 지연을 최소화하기 위한 필체 대상 선정 방법과 (3) 가용 시간 처리 방법 등을 포함한다. 그리고, 실험을 통해 점증 조인과 완전 조인을 선택적으로 이용하는 것이 하나만 이용하는 기존 방식에 비해 성능이 우수함을 보인다.

Abstract AI-Helper 아이콘AI-Helper

Overlapping windows are generally used for queries to process continuous data streams. Nevertheless, existing approaches discussed join algorithms only for basic types of windows such as tumbling windows and tuple-driven windows. In this paper, we propose an efficient join algorithm for overlapping ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이는 새로운 입력 Bi十1이 전달되었을 때, 새로운 조인 결과 Ri+1 를 지연 없이 생성하기 위함이다. 기존 스트림 연구에서 언급하듯이, 스트림 응용에서는 최신의 데이터를 가능한 실시간에 처리하는 것이 중요하다[1丄 따라서 제안하는 방법에서는 가용 시간 처리 모드에서 최신 데이터를 지연 없이 생성하도록 최적화하고자 하였다.
  • 본 논문에서는 보다 일반화된 윈도우의 형태인 중첩윈도우를 가정하고, 이를 효율적으로 처리하기 위한 조인 알고리즘을 소개한다. 중첩 윈도우는 기본적으로 중복 처리를 내재한다.
  • 본 논문에서는 보다 일반화된 윈도우의 형태인 중첩윈도우를 가정하고, 이를 효율적으로 처리하기 위한 조인 알고리즘을 제안하였다. 제안하는 알고리즘은 메모리의 상황에 따라 점증 조인과 완전 조인을 적절히 활용하며, 중첩 윈도우의 특성을 반영하여 조인 결과의 지연을최소화하기 위한 교체 대상 선정 방법과 가용 시간 처리방법을 제시하였다.
  • 완전 조인보다 빠르게 수행된다. 본 논문이 대상으로 하는 메모리가 부족한 환경에서도 이런 결과를 나타내는지 실험을 통해 확인하고자 하였다.

가설 설정

  • 기존의 데이터베이스와 동일하게, 스트림에 있어서도조인은 중요한 역할을 차지한다[3]. 위 로드 밸런싱 예에서 세 개의 라우터 A, B, C로 구성된 하나의 경로를가정해 보자. 해당 경로의 지연 값을 계산하는데 있어경로를 지나는 패킷을 식별하기 위해, 아래와 같은 질의를 이용할 수 있다.
  • 그리고윈도우 정의에 있어서 각 스트림의 RANGE 값이 같고, 역시 각 스트림의 SLIDE 값이 모두 같은(예를 들어 Q1 과 같은) 경우를 다룬다. 이러한 제약은 중첩 윈도우를다룰 때, 하나의 윈도우를 기본 윈도우로 쉽게 구분할수 있게 하여 처리 모델을 단순화시키는 잇점이 있다또한 대칭 해시 조인(Symmetric hash join)[5]이 조인의 기본 알고리즘으로 사용된다고 가정한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (10)

  1. Babcock et al., Models and Issues in Data Stream Systems, Proc. of ACM PODS, pp. 1-16, 2002 

  2. Cranor el at., Gigascope: A Stream Database for Network Applications, Proc. of ACM SIGMOD 2003 

  3. Harmad et al., Scheduling for Shared Window Joins over Data Streams, Proc. of VLDB 2003 

  4. Li et al., Semantics and Evaluation Techniques for Window Aggregates in Data Streams, Proc. of ACM SIGMOD, pp. 311-322, 2005 

  5. Viglas et al,, Maximizing the Output Rate of Multi-Way Join Queries over Streaming Informa-tion Sources, Proc. of VLDB, pp. 285-296, 2003 

  6. Ding et al., Joining Punctuated Streams, Proc. of EDBT, pp. 587-604, 2004 

  7. Golab et al., Processing Sliding Window Multi-Joins in Continuous Queries over Data Streams, Proc. of VLDB, pp. 500-511, 2003 

  8. Urban et al., XJoin: A Reactively-Scheduled Pipe-lined Join Operator, IEEE Data Engineering Bulletin 2000 

  9. Hash-Merge Join: A Non-blocking Join Algorithm for Producing Fast and Early Join Results, ICDE 2004 

  10. Das et al., Approximate Join Processing over Data Streams, Proc. of SIGMOD, pp. 40-51, 2003 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로