$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

다중 윈도우 조인을 위한 튜플의 도착 순서에 기반한 효과적인 부하 감소 기법
Effective Load Shedding for Multi-Way windowed Joins Based on the Arrival Order of Tuples on Data Streams 원문보기

정보과학회논문지. Journal of KIISE. 데이타베이스, v.37 no.1, 2010년, pp.1 - 11  

권태형 (한국과학기술원 전산학과) ,  이기용 (한국과학기술원 전산학과) ,  손진현 (한양대학교 전자컴퓨터공학부) ,  김명호 (한국과학기술원 전산학과)

초록
AI-Helper 아이콘AI-Helper

최근 다중 데이터 스트림에 대한 연속 질의 처리에 관한 연구가 활발하게 진행되고 있다. 데이터 스트림에서 튜플들의 도착 속도가 폭증하여 시스템의 메모리 용량을 초과하는 경우, 일부 튜플을 버림으로써 시스템이 과부하 상태가 되지 않도록 하는 기법을 부하 감소(load shedding)라 한다. 본 논문에서는 다중 데이터 스트림에 대한 다중 윈도우 조인을 위한 효과적인 부하 감소 기법을 제안한다. 기존의 부하 감소 기법들은 버릴 튜플을 선택하기 위해 튜플들의 조인 키 값을 이용하여 각 튜플이 생성할 조인 결자 개수(생산성)를 예측하고, 생산성이 최소가 되는 튜플을 버린다. 그러나 이러한 방법들은 조인 키 값이 다시 나타나지 않거나, 조인 키 값의 분포가 일정하게 유지되지 않는 경우 튜플들의 생산성을 올바르게 예측하기 어렵다. 본 논문은 이러한 경우를 위해 튜플들의 조인 키 값 대신, 튜플의 데이터 스트림에 대한 도착 순서를 사용하여 튜플들의 생산성을 예측하는 방법을 사용한다. 제안하는 방법은 조인 키 값으로 튜플들의 생산성을 예측하가 어려운 상황에서 튜플의 도착 순서를 통해 각 튜플의 생산성을 효과적으로 예측할 수 있도록 해준다. 다양한 실험과 분석을 통해 제안하는 새로운 부하 감소 기법이 기존 기법에 비해 더욱 효과적이고 효율적으로 부하를 감소시킬 수 있음을 보인다.

Abstract AI-Helper 아이콘AI-Helper

Recently, there has been a growing interest in the processing of continuous queries over multiple data streams. When the arrival rates of tuples exceed the memory capacity of the system, a load shedding technique is used to avoid the system becoming overloaded by dropping some subset of input tuples...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서 우리는 다중 윈도우 조인 질의를 위한 효과적인 부하감소 알고리즘을 제안한다. 스트림의 윈도우에 할당된 메모리가 가득 찼을 때, 이 스트림에 새로운튜플이 도착된다면(윈도우 시간 경과로 인한 자연 도태튜플이 없는 경우), 우리는 신규 튜플을 저장하기 위해새로운 메모리가 필요하다.
  • 본 논문에서 우리는 다중 윈도우 조인에서 도착순서 패턴을 가진 경우에 효과적으로 부하감소를 수행할 수 있는 새로운 알고리즘을 제안했다. 제안하는 알고리즘은 실세계 응용들에서 자연발생적으로 생기는 튜플들의 도착순서의 패턴을 이용하여 부하감소를 수행한다.
  • 본 논문에서 우리는 튜플이 스트림의 윈도우에 최초로 도착하는 순서에 기준을 두는 새로운 부하감소 알고리즘을 제안한다. 조인 질의에서 데이터 스트림의 개수가 n이라고 하자.
  • [9]은 메모리 부하감소를 위해 출현빈도를 기준으로 하는 부하감소 기법을 제안했다. 이 논문에서는 튜플 £의생산성은 현재 조인 윈도우들에서 자신의 윈도우를 제외한 나머지 것들에서 I의 조인키 값과 동일한 튜플들의곱으로 표현된다. 또한, 속도 향상을 위해 전체 스트림은 스캔하지 않고 한계 에러 범위 내에서 스케치 기법을 사용한다[6].
  • 3개의 네트워크 라우터가 있다고 하자. 이 중 라우터 Ri, R2, 晶를 지나는 패스의 패킷 사용량을 모니터링 한다고 하자. 각 라우터는 튜플을 발생시키고, 각 튜플은 라우터를 통과하는 패킷의 정보를 가지고 있다.

가설 설정

  • (2) 결과 기준 알고리즘: 입력 튜플에 대해 그 튜플이 과거에 생성했던 결과 튜플의 개수를 누적하여 우선순위를 표현. (3) 무작위 기준 알고리즘: 입력 튜플을 제외한 나머지튜플들에서 무작위로 부하감소를 수행함. 또한, 세 개의알고리즘은 3장에서 설명한 AMJoin의 프레임워크를 적용하며, 부하감소의 우선순위를 결정하는 부분만 다르게적용한다.
  • …X 또한, 吼를 의 윈도우라고 한다. I仍 는 $에 나타나는 튜플들을 저장하고 있으며, 튜플의 개수 혹은 발생시간에 따라 제약조건예를 들어 튜플 100 개 혹은 1시간)을 가지고 있으며, 편의상 지정된 크기의 메모리 공간이 할당된다고 가정한다. 그림 1은 논문에서 사용되는 조인 처리 모델을 보여준다.
  • 각 라우터는 튜플을 발생시키고, 각 튜플은 라우터를 통과하는 패킷의 정보를 가지고 있다. 패킷 정보는 패킷 아이디(여기서는 알파벳)로 유일하게 식별된다고 가정한다. 우리는 해당 패스를 지나는 패킷 사용량을 모니터링하기 위해 3-way 조인을 수행한다.
  • 대해서 기술한다. 기본적으로, 우리가 제안하는 방법과 2장 관련연구에서 언급한 기존 방법들은 모두 해시기반 조인을 사용한다고 가정한다. 이경우 부하감소를 위해 가장 많은 비용이 소요되는 부분은 우선순위를 결정하고 유지하는 부분이다.
  • BiHT와 EPTi (IMMn)는 조인 윈도우 呼i(lMiMn)와 함께 메모리에서 유지된다. 설명의 편의를 위해 모든 조인 키들이 동일하다고 가정하며, 한 개의 해시함수 九를 사용한다고 가정한다. 데이터 스트림 S에서 튜플 가 도착하면, 다음의 조인과정이 연속적으로 실행된다.
본문요약 정보가 도움이 되었나요?

참고문헌 (13)

  1. A. Das, J. Gehrke and M. Riedewald. Approximate Join Processing over Data Streams. Proceedings of the 2003 ACM SIGMOD international conference on Management of data, San Diego, California, USA, pp.40-51, 2003. 

  2. C. Cranor, T. Johnson, O. Spataschek and V. Shkapenyuk. Gigascope: A Stream Database for Network Applications, Proceedings of the ACM SIGMOD International Conference On Management of Data, San Diego, California, USA, pp.647-651, 2003. 

  3. J. Gehrke and S. Madden. Query Processing in Sensor Networks. IEEE Pervasive computing, vol.3, no.1, pp.46-55, 2004. 

  4. L. Golab and M. T. Ozsu. Processing Sliding Window Multi-Joins in Continuous Queries over Data Streams. Proceedings of the 29th International Conference on Very Large Data Bases, Berlin, Germany, vol.29, pp.500-511, 2003. 

  5. M. A. Hammad, W. G. Aref and A. K. Elmagarmid. Stream Window Join: Tracking Moving Objects in Sensor-Network Databases. Proceedings of 15th International Conference on Scientific and Statistical Database Management, Cambridge, Massachusetts, USA, pp.75-84, 2003. 

  6. A. Dobra, M. Garofalakis, J. Gehrke, and R. Rastogi. Processing complex aggregate queries over data streams. Proceedings of the 2002 ACM SIGMOD international conference on Management of data, Madison, Wisconsin, USA, pp.61-72, 2002. 

  7. B. Gredik, K. Wu, P. S. Yu and L. Liu. A Load Shedding Framework and Optimizations for Mway Windowed Stream Joins. IEEE 23rd International Conference on Data Engineering, pp. 536-545, 2007. 

  8. Y. Bai, H. Wang and C. Zaniolo. Load Shedding in Classifying Multi-Source Streaming Data: A Bayes Risk Approach. Proceedings of the Seventh SIAM International Conference on Data Mining, Minneapolis, Minnesota, USA, pp.425-430, 2007. 

  9. Y. Law and C. Zaniolo. Load Shedding for Window Joins on Multiple Data Streams. IEEE 23rd International Conference on Data Engineering, pp.674- 683, 2007. 

  10. U. Srivastava and J. Widom. Memory-Limited Execution of Windowed Stream Joins. Proceedings of the 30th VLDB Conference, Toronto, Canada, pp.324-335, 2004. 

  11. S. D. Viglas, J. F. Naughton and J. Burger. Maximizing the Output Rate of Multi-Way Join Queries over Streaming Information Sources. Proceedings of the 29th International Conference on Very Large Data Bases, Berlin, Germany, vol.29, pp.285-296, 2003. 

  12. T. Kwon, H. Kim, M. Kim and J. Son, An Advanced Join Algorithm for Multiple Data Streams Using a Bit-vector Hash Table. IEICE Transaction on Information and Systems, vol.E92-D, no.7, pp.1429-1434, 2009. 

  13. H. Yu, EP. Lim and J. Zhang. On In-network Synopsis Join Processing for Sensor Networks. Proceedings of the 7th International Conference on Mobile Data Management, Nara, Japan, pp.32- 39, 2006. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로