$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

Cloud P2P OLAP: 클라우드 컴퓨팅 환경에서의 Peer-to-Peer OLAP 질의처리기법 및 인덱스 구조
Cloud P2P OLAP: Query Processing Method and Index structure for Peer-to-Peer OLAP on Cloud Computing 원문보기

인터넷정보학회논문지 = Journal of Korean Society for Internet Information, v.12 no.4, 2011년, pp.157 - 172  

주길홍 (경인교육대학교 컴퓨터교육과) ,  김훈동 ((주)윌비솔루션 기술연구소) ,  이원석 (연세대학교 컴퓨터과학과)

초록
AI-Helper 아이콘AI-Helper

최근 분산 OLAP은 분산 환경에 적용하기 위하여 DHT기반의 P2P OLAP과 그리드 OLAP연구가 활발하게 진행되고 있다. 그러나 클라우드 컴퓨팅 환경에 적용하기 위하여 P2P OLAP은 structured P2P 특성 때문에 다차원 범위 질의에 문제점이 있고, Grid OLAP은 인접성 및 시계열 고려가 없기 때문에 쿼리 자체의 서브 �V 조회 알고리즘 연구에 치중되어 있다. 따라서 본 논문은 클라우드 컴퓨팅에 적합한 환경 제공을 위해 사용자의 조회 결과가 시계열적 특성으로 여러 사용자에 의해 재사용이 가능하고, 서버상의 휘발성 조회 큐브가 사용자 로컬 메모리에서 직접 분석 질의 시 효율이 좋다는 것에 초점을 두어 중앙관리 P2P방식을 제안하였다. 또한 빠른 질의 결과 및 다차원 범위질의를 위한 다단계 Hybrid P2P방식에 인덱스 부하 분산 및 성능 향상을 위한 클라우드 시스템을 접목하여 Cloud P2P OLAP을 제안하였다. 이를 위한 인덱스 구조로는 큐브 위상관계 트리와 인접성 2차원 Quadtree에, 시계열 Interval-트리를 접목하였으며, 이는 조회나 갱신 시에 일반 OLAP에 비해 큰 효율성을 보였다.

Abstract AI-Helper 아이콘AI-Helper

The latest active studies on distributed OLAP to adopt a distributed environment are mainly focused on DHT P2P OLAP and Grid OLAP. However, these approaches have its weak points, the P2P OLAP has limitations to multidimensional range queries in the cloud computing environment due to the nature of st...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • MOLAP은 빠른 응답을 보이지만, 디스크 공간이 한정되어 모든 조합의 모든 셑을 실체화(Materialized) 하는 데에는 물리적인 한계가 있어, 대규모 데이터의 분석용으로는 적당하지 않다. 따라서 본 논문은 ROLAP의 유연성 및 확장성에, MOLAP의 속도상의 이점을 제공하고자, 클라이언트 큐브 캐시를 관리 가능한 P2P로 공유하는 시스템과, P2P 노드의 큐브 데이터에 대한 정교한 인덱스 구조를 중앙관리 가능하도록 하는 클라우드 시스템 상의 서버 구조를 제안하였다.
  • 본 논문에서 제안하는 Cloud P2P OLAP은 클라우드 시스템을 도입하여 유동적으로 인스턴스를 추가 및 삭제 할 수 있으며, 이로부터 시스템의 확장성 및 가용성을 극대화 할 수 있다. 따리서 선형적인 성능 향상도 꾀할 수 있도록 하였다. 마지막으로 본 논문은 클라우드와 P2P를 결합한 아키텍처를 OLAP 분야에서 사용할 수 있도록 처음으로 제안하였다는 측면에서 매우 의미 있는 연구라고 할 수 있다.
  • 본 논문에서는 ROLAP의 유연성 및 확장성에 MOLAP의 속도상의 이점을 제공하고자 수많은 사용자의 클라이언트를 재활용 가능한 분산 노드화하여 각 노드간에 P2P로 큐브 캐시를 공유하는 시스템을 제안하였다. 이를 최적화된 알고리즘으로 고안하여 비교 및 검증을 수행하였다.
  • 본 논문에서는 추가적으로 Quadtree가 균형이 보장되지 않아 조회 성능에서는 불리한 약점을 가지고 있는 단점을 보완하기 위해 인덱스를 재구성하는 전처리 알고리즘을 추가로 제안하였다. OLAP은 주기적으로 실체화 뷰를 야간시간에 갱신하는 작업을 하는데 이 시점에 Cloud P2P OLAP 또한 인덱스를 재구성 하도록 구성함을 통해 일단위로 균형을 보장 하도록 할 수 있다.
  • 구글의 Bigtable은 B+ 트리와 유사한 인덱스 개념을 다단계의 관리 가능한 분산 시스템으로 확장하여서 높은 효과를 보였다[1]. 본 논문은 이러한 분산 중앙 관리 인덱스 구조에 초점을 두어 OLAP에 다단계의 Hybrid P2P를 접목하였다. 효율적인 인덱스 관리가 제한된 형태로 OLAP에 P2P나 Grid를 도입한 개념은 이미 몇몇 유사 연구가 진행 된 바 있으나, 본 논문에서는 추가로 기존 연구가 간과 하였던 아래와 같은 특성을 전제로 서버에서 범위 질의 및 시계열 관리가 가능한 보다 향상된 알고리즘을 제안하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
클라우드 시스템의 단점은 무엇인가? 현재 클라우드 시스템이 많은 각광을 받고 있지만, 클라우드 시스템을 데이터베이스 시스템에 적용하기 위하여 서는 해결해야 할 문제점이 많이 있다[2]. 클라우드 상의 데이터베이스 클러스터링 및 대용량 스토리지 서비스는 가상화된 시스템 하에서 일반적인 시스템보다 훨씬 큰 입출력 부하를 가져오면서, 가용성 지대를 넘어서는 경우 보다 많은 네트워크 비용도 소모하는 단점을 지니고 있다.
클라우드의 시스템의 정의는 무엇인가? 클라우드의 시스템의 정의는 여러 가지가 존재하지만, 일반적으로 대규모 서버의 연결된 집단을 통한 플랫폼, 인프라 혹은 서비스 시스템을 말한다. 여기에는 개인 컴퓨터도 포함될 수 있어, 제안하는 Cloud P2P OLAP 시스템에서의 Cloud와 P2P와의 접목은 퍼블릭 클라우드와 프라이빗 클라우드가 접목 된 하이브리드 클라우드 시스템으로 분류가 가능하다.
클라우드 시스템이 각광을 받고 있는 가장 큰 이유는 무엇인가? 여기에는 개인 컴퓨터도 포함될 수 있어, 제안하는 Cloud P2P OLAP 시스템에서의 Cloud와 P2P와의 접목은 퍼블릭 클라우드와 프라이빗 클라우드가 접목 된 하이브리드 클라우드 시스템으로 분류가 가능하다. 클라우드 시스템이 각광을 받고 있는 가장 큰 이유는, 시스템 리소스를 유연하고, 확장 가능하게 사용 할 수 있으며, 이 역시도, 사용한 만큼만 비용 지불 하면 된다는 점 때문이다. 현재 클라우드 시스템이 많은 각광을 받고 있지만, 클라우드 시스템을 데이터베이스 시스템에 적용하기 위하여 서는 해결해야 할 문제점이 많이 있다[2].
질의응답 정보가 도움이 되었나요?

참고문헌 (25)

  1. F. Chang, J. Dean, S. Ghemawat, WC. Hsieh, DA. Wallach, M. Burrows, T. Chandra, A. Fikes and RE. Gruber, "Bigtable: A distributed storage system for structured data", Journal ACM Transactions on computer Systems, Vol.26, No.2, pp. 1-14, 2008. 

  2. C. Loboz, S.Smyl and S.Nath, research .microsoft.com, "DataGarage: Warehousing Massive Amounts of Performance Data on Commodity Servers", Microsoft Research Technical Report MSR-TR-2010-22, NE Computing, 2010. 

  3. S. Russell, V. Yoon and G. Forgionne, "Cloud-based Decision Support Systems and Availability Context: The Probability of Successful Decision Outcomes", Information Systems and E-Business Management, Vol.8, No.3, pp.189-205, 2010. 

  4. J. Dean and S. Ghemawat, "MapReduce: Simplified data processing on large clusters", Communications of the ACM, Vol.51, No.1, pp. 107-113, 2008. 

  5. C. Zhang, H. De Sterck, A. Aboulnaga, H. Djambazian and Rob Sladek, "Case Study of Scientific Data Processing on a Cloud Using Hadoop", High Performance Computing Systems and Applications, vol.5976, No.1, pp.400-415, 2010. 

  6. 김진수, 김태웅, "OwFS: 대규모 인터넷 서비스를 위한 분산 파일 시스템", 한국정보과학회 정보과학회지, 제27권 제5호, pp.77-85, 2009. 

  7. A. Thusoo, J. Sen Sarma, N. Jain, Z. Shao, P. Chakka, N. Zhang, S. Antony, H. Liu and R. Murthy, "Hive - A Petabyte Scale Data Warehouse Using Hadoop", proceeding of international conference on data engineering, pp.996-1005, 2010. 

  8. A. Thusoo, Z. Shao, S. Anthony, D. Borthakur, N. Jain, J. Sen Sarma, R. Murthy and H. Liu, "Data warehousing and analytics infrastructure at facebook", Proceeding of international conference on Management of data, 1013-1020, 2010. 

  9. M. Arnedo,M. del, P. VillamilandR. Villanueva, "Improving Performance of Declarative Query Execution in DHT-Based Systems", International Conference on Internet and Web Applications and Services, pp.223-228, 2010. 

  10. P. Kalnis, WS. Ng, BC. Ooi, D. Papadias and K. Tan, "An adaptive peer-to-peer network for distributed caching of olap results". Proceeding of international conference of Management of data, pp.25-36, 2002. 

  11. P. Kalnis, W. Ng, B. Ooi and K. Tan, "Answering similarity queries in peer-to-peer networks", Information Systems, Vol.31, No.1, pp.57-72, 2006. 

  12. M. Espil and AA. Vaisman, "Aggregate queries in peer-to-peer OLAP", Proceeding of the ACM international workshop on data warehousing, pp.102-111, 2004. 

  13. A. Vaisman, M. Espil and M. Paradela, "P2P OLAP: Data model, implementation and case study", Information Systems, Vol.34, No.2, pp.231-257, 2009. 

  14. E. Tanin, A. Harwood and H. Samet, "Using a distributed quadtree index in peer-to-peer networks", The VLDB Journal, Vol.16, No.2, pp.165-178, 2007. 

  15. M. Lawrence and A. Rau-Chaplin, "The OLAP-enabled grid: Model and query processing algorithms", International Symposium on High-performance Computing in an Advanced Collaborative Environment, pp.4, 2006. 

  16. A. Vaisman, M. Espil and M. Paradela, "P2P OLAP: Data model, implementation and case study", Information Systems, Vol.34, No.2, pp.231-257, 2009. 

  17. A. Mondal, Y. Lifu and M. Kitsuregawa, "P2pr-tree: An r-tree-based spatial index for peer-to-peer environments", Current Trends in Database Technology EDBT2004 Workshops, pp.516-516. 2004. 

  18. P. Ganesan, B. Yang and H. Garcia-Molina, "One torus to rule them all: multi-dimensional queries in P2P systems". Proceeding of the international workshop on the Web and Database, pp.19-24, 2004. 

  19. Windows Azure Platform, "Windows Azure, Microsoft Hosting, Online Application, Application Hosing", http://www.microsoft.com/windowsazure/windowsazure/, 2010. 

  20. SalesForce.com Platform, "Force.com The leading cloud platform for business apps". http://www.salesforce.com/platform/, 2010. 

  21. Google AppEngine Platform, "Run your web apps on Google's infrastructure. Easy to build, easy to maintain, easy to scale.". http://code.google.com/intl/en/appengine/, 2010. 

  22. msdn.microsoft.com, ".NET Framework LINQ Introduce", http://msdn.microsoft.com/ko-kr/library/bb397897(VS.90).aspx, 2010 

  23. F. Dehne, M. Lawrence and A. Rau-Chaplin. "Cooperative caching for grid-enabled OLAP". International Journal of Gridand Utility Computing, Vo.1, No.2, pp.169. 2009. 

  24. Extreme Computing Group, "All Azure Benchmark Test Cases". http://azurescope.cloudapp.net/BenchmarkTestCases/, 2010. 

  25. L. Arge, M. Berg, H. Haverkort and K. Yi. "The priority R-tree: A practically efficient and worst-case optimal R-tree". ACM Transactionson Algorithms(TALG), Vol.4, No.1, pp.1-30. 2008. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로