$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

데이터 액세스 확률의 제곱근 법칙을 이용한 상호 관련 데이터 할당 기법
An Interdependent Data Allocation Scheme Using Square Root Rule of Data Access Probability 원문보기

The journal of the institute of internet, broadcasting and communication : JIIBC, v.15 no.5, 2015년, pp.75 - 84  

권혁민 (세명대학교 정보통신학부)

초록
AI-Helper 아이콘AI-Helper

데이터 할당 기술은 데이터 방송 시스템의 성능을 향상시키기 위해서 필수적이다. 본 논문은 질의 프로파일과 질의 요청 확률이 주어진 환경에서 다중 데이터 질의를 처리하기 위하여 방송채널에 데이터를 할당하는 주제를 연구하여 IDAS(Interdependent Dta Allocation Scheme)로 명명된 새로운 데이터 할당 기법을 제안한다. 제안된 기법은 각 데이터의 방송빈도를 자신의 상대적 액세스 확률의 제곱근 값에 비례하게 설정하는 전략을 채택한다. IDAS 기법은 요청 확률이 높은 질의들을 빠르게 처리할 수 있고 적절한 수준의 질의 데이터 인접성을 보일 수 있기 때문에 질의 응답 시간의 성능을 향상시킬 수 있다. 제안된 기법의 성능 평가를 위해 시뮬레이션이 수행되었다. 실험 결과에 따르면, 평균 응답시간의 성능에서 IDAS는 다른 기법보다 우수한 성능을 보인다.

Abstract AI-Helper 아이콘AI-Helper

A data allocation technique is essential to improve the performance of data broadcast systems. This paper explores the issues for allocating data items on broadcast channels to process multiple-data queries in the environment where query profiles and query request rates are given, and proposes a new...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • DAMA 기법은 다른 기법들과는[6-9] 다르게 질의 프로파일과 요청 확률을 정형화하기 어려운 환경에서 각 데이터의 액세스 확률만을 이용하여 다중 데이터 질의를 처리하기 위한 연구를 수행했다. 다중 데이터 질의는 가장 늦게 수신된 데이터에 의해 응답시간이 결정된다.
  • 이에 따라 이에 대한 많은 연구들이[1-11] 수행되었는데, 클라이언트가 제기하는 질의의 특성에 따라 하나의 데이터를 액세스하는 단일 데이터 질의를 위한 기법들과 다수의 데이터를 액세스하는 다중 데이터 질의를 위한 기법들로 분류할 수 있다. 그리고 데이터 할당 기법은 방송채널의 수에 따라 단일 방송채널과 다중 방송채널 환경의 기법으로 분류할 수 있는데, 단일 채널 환경은 질의 응답시간의 개선에 한계가 있기 때문에 본 연구에서는 다중 방송채널 환경에 한하여 연구를 수행한다.
  • 데이터 할당 기법의 주요 평가기준은 질의의 평균 응답시간이므로 본 논문은 이를 중심으로 성능을 평가한다. 성능평가 실험에서 실험 시작시의 초기 편향(initial bias)을 제거하기 위하여 초기 십만 개 질의들의 실행 결과는 무시하였다.
  • 본 논문에서는 이와 같은 단점을 극복하기 위하여, 각 데이터의 액세스 확률에 적절한 가중치를 부여하는 방법을 고안하여, 적절한 데이터 충돌 확률을 보이면서도 질의 응답시간의 성능을 개선할 수 있는 새로운 데이터 할당 기법을 제안할 것이다. 본 논문의 구성은 다음과 같다.
  • 본 논문은 방송 방식의 데이터 전달 방법을 채택한 다중 방송채널 환경의 정보시스템에서 다중 데이터 질의를 효율적으로 처리하기 위한 연구를 수행하여 IDAS라 명명된 새로운 데이터 할당 기법을 제안했다. 본 논문이 제안한 기법은 질의 프로파일과 질의 요청 확률을 취합하여 각 데이터의 상대적 액세스 확률을 구한 후, 이 값의 제곱근 값에 비례하게 각 데이터의 방송 빈도를 결정한다.
  • 그러나 필요 이상으로 동일 데이터를 너무 많이 할당하면 요청 확률이 낮은 질의의 평균 응답시간이 너무 길어져 오히려 전체 평균 응답시간 성능은 저하될 것이다. 본 논문은 이와 같은 점을 고려해서 질의 프로파일과 요청 확률을 취합하여 각 데이터들의 방송 빈도를 적절히 설정하여 응답시간 성능을 개선할 수 있는 새로운 데이터 할당 기법을 제안한다. 단일 데이터 질의에서 각 데이터들의 상대적 방송빈도를 액세스 확률의 제곱근 값에 비례하게 설정할 때 가장 최적의 응답시간 성능을 발휘한다[11].
  • 본 실험에서는 θ 값의 변화에 따른 평균 응답시간의 성능추이를 살펴보았다.

가설 설정

  • 2) 전체 질의들은 qj(1≤j≤m)로 표현되는 m 개의 질의로 구성되는데, 각 질의의 요청 확률은 p(qj)로 표현하며 내림차순으로 정렬되어 있다고 가정한다.
  • 6) 각 방송채널에는 동일한 수의 데이터가 배치되는데, 만일 방송채널에 T 개의 데이터가 할당되었다면 방송주기는 T 이다. 방송채널에서 각 데이터가 방송되는 구간을 슬롯(slot)으로 표현하는데, 각 슬롯은 슬롯번호로서 구분한다.
  • 는 각각 {a, b, c}, {x, y}를 액세스 하고 {a, b, c}의 방송 횟수는 3, {x, y}의 방송 횟수는 2로 가정하자. 그리고 방송주기는 12라고 가정하고 그림 2를 살펴보자. 식 (5)에 의해 {a, b, c}의 방송 간격은 4, {x, y}의 방송 간격은 6이 될 것이다.
  • 이는 전적으로 질의가 액세스하는 데이터들이 방송채널에 인접해서 배치되어 있나 여부에 기인한다. 이에 대한 이해를 돕기 위해 어떤 방송채널에 400개의 데이터가 할당되어 있다고 하고, 질의 q1이 {d101, d201, d301, d401}를 액세스한다고 가정하자. 만일 이 데이터들이 슬롯번호 {1, 2, 3, 4}와 같이 서로 인접해서 할당되어 있다면, q1의 평균 응답시간은 대략 방송주기의 반인 200 tick이 될 것이다.
  • 클라이언트가 제기하는 질의들은 불균등한 액세스 형태를 모델링하기 위해 많이 사용되는 zipf 분포 모델을[1] 따른다고 가정한다. zipf 분포 모델에서 각 질의 요청 확률은 식 (6)으로 표현되는데, 여기서 θ 값은 각 질의의 요청 확률이 어느 정도 편향되어 있는지를 나타내는 인수로서, θ 값이 0일 경우에는 각 질의의 요청 확률은 모두 동일하며 θ 값이 커질수록 각 질의들의 요청 확률간의 차이가 커지게 된다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
단일 데이터 질의 환경을 위한 대표적인 기법에는 무엇이 있는가? 단일 데이터 질의 환경을 위한 대표적인 기법에는 DP(Dynamic Programming)[2]와 RDP(Restricted Dynamic Programming)[3] 기법들이 있는데, 이 기법들은 각 방송 채널이 평형(Flat) 방송된다는 가정 하에 응답시간이 최소화되도록 데이터를 분할하여 각 채널에 할당했다. 비록 이 기법들이 방송채널별 평형 방송을 하는 시스템 모델에서는 최적 성능을 발휘하지만, 같은 채널에 할당된 데이터들을 그들의 인기도에 관계없이 동일 빈도로 방송하기 때문에 응답시간의 성능을 향상시키는 데는 한계가 있었다.
데이터 할당 기법 중 평형(FLAT) 기법은 무엇인가? 단일 데이터 질의를 위한 기법에는 평형(FLAT)[1], DP[2], 그리고 NODA[5] 등과 같은 기법들이 있는데, 이들은 모두 데이터의 액세스 확률에 기초하여 데이터를 분할하여 방송채널에 할당했다. 가장 단순한 평형(FLAT) 기법은 각 방송채널에 동일 개수의 데이터를 배정하고, 각 채널은 이들을 라운드-로빈 형태로 평형 방송한다. 평형 기법은 구현이 용이한 장점이 있지만, 모든 데이터들을 동일 빈도로 방송하기 때문에 평균 응답시간의 성능이 낮다는 단점이 있다.
MA2D 기법의 단점은 무엇인가? MA2D 기법은 이 단점을 개선하기 위하여, 질의 프로파일과 질의 요청 확률에서 각 데이터의 상대적 요청 횟수를 파악한 후 이를 정규화하여, 한 방송주기에서 각 데이터를 자신의 정규화 값에 비례하게 할당하는 기법을 제안했다. 그러나 이 기법은 요청 횟수에 너무 큰 가중치를 부여하는 경향이 있기 때문에 요청 확률이 낮은 질의의 응답시간이 너무 길어지는 단점이 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (12)

  1. S. Acharya, "Broadcast Disks: Disseminationbased Data Management for Asymmetric Communication Environments," Ph.D. thesis, Brown University, 1998. 

  2. W. G. Yee, S. Navathe, E. Omiecinski, and C. Jermaine, "Efficient Data Allocation over Multiple Channels at Broadcast Servers," IEEE Trans. on Computers, Vol. 51, No. 10, pp. 1231-1236, Oct. 2002. 

  3. S. Wang and H.L. Chen, "An O(N log K) Restricted Dynamic Programming Algorithm for Data Allocation over Multiple Channels," IEICE trans. on communications, Vol. E88-B, No. 9, pp. 3756-3764, Sep. 2005. 

  4. H.M. Kwon, "TLDP: A New Broadcast Scheduling Scheme for Multiple Broadcast- Channel Environments," The Journal of the Institute of Webcasting, Internet and Telecommunication, Vol. 11, No. 2, pp. 63-72, 2011. 

  5. H.M. Kwon, "A Near Optimal Data Allocation Scheme for Multiple Broadcast-Channel Environments," The Journal of the Institute of Webcasting, Internet and Telecommunication, Vol. 12, No. 1, pp. 17-27, 2012. 

  6. H.P. Hung, J.W. Huang, J.L. Huang, and M.S. Chen, "Scheduling dependent items in data broadcasting environments," ACM SAC 2006. 

  7. S.W. Park and S.W. Jung, "Interdependent Data Allocation a scheme over Multiple Wireless Vroadcast Channels," Journal of KIISE : Database, Vol. 36, No. 1, pp. 30-43, 2009. 

  8. Y.D. Chung and M.H. Kim, "Effective Data Placement for Wireless Broadcast," Distributed and Parallel Databases, Vol 9, No. 2, 2001 

  9. J.L. Huang and M.S. Chen, "Dependent data broadcasting for unordered queries in a multiple channel mobile environment," IEEE Trans. on Knowledge and Data Engr., Vol. 16, No. 6, 2004. 

  10. H.M. Kwon, "A Broadcast Data Allocation Scheme for Multiple-Data Queries Using Moving Average of Data Access Probability," The Journal of the Institute of Webcasting, Internet and Telecommunication, Vol. 14, No. 5, pp. 35-43, 2014. 

  11. C. Hsu, G. Lee, A.L.P. Chen, "A near optimal algorithm for generating broadcast programs on multiple channels," Proc. ACM 10th Int'l Conf. CIKM, Atlanta, Georgia, pp. 303-309, 2001. 

  12. H. Schwetman, 'CSIM Users' Guide for Use with CSIM Revision 16', Microelectronics and Computer Technology Corporation, 1992. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로