$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

대용량 압축 데이터베이스를 위한 비대칭 색인 관리 기법
Asymmetric Index Management Scheme for High-capacity Compressed Databases 원문보기

한국산학기술학회논문지 = Journal of the Korea Academia-Industrial cooperation Society, v.17 no.7, 2016년, pp.293 - 300  

변시우 (안양대학교 디지털미디어학과) ,  장석우 (안양대학교 디지털미디어학과)

초록
AI-Helper 아이콘AI-Helper

전통적인 기존의 데이터베이스는 높은 성능을 얻기 위하여 느린 하드 디스크에서 관련된 레코드가 연속적으로 저장되어 있는 레코드 기반 모델을 활용한다. 그러나 읽기 집중적인 데이터 분석 시스템을 위해서는 컬럼 기반 압축 데이터베이스가 월등한 판독 성능으로 인하여 더 적합한 모델이 되고 있으며, 최근 플래시 메모리 SSD가 고속 분석용 시스템에 적합한 저장 매체로 선호되고 있다. 본 논문에서는 세로로 저장하는 컬럼 기반 스토리지 모델을 소개하고, 대용량 데이터웨어하우스 시스템을 위한 새로운 인덱스와 데이터 관리 기법을 제안한다. 제안된 인덱스 관리 기법은 두 개의 인덱스를 사용하는 비대칭 인덱스 이중화이며, 갱신용 마스터 인덱스와 판독용 컴팩트 인덱스를 활용하여 특히 읽기가 집중된 빅 데이터베이스에서 우수한 검색 성능을 얻는다. 그리고 본 데이터 관리 기법은 관련된 컬럼 압축과 두 개의 플래시 메모리 SSD를 이중화하여 높은 판독 성능과 처리 안정성에 도움을 준다. 고부하 워크로드 조건의 성능 평가 결과를 기반으로, 본 데이터 관리 기법이 기존 기법보다 검색 처리 및 응답 시간 측면에서 더 우수함을 보이고자 한다.

Abstract AI-Helper 아이콘AI-Helper

Traditional databases exploit a record-based model, where the attributes of a record are placed contiguously in a slow hard disk to achieve high performance. On the other hand, for read-intensive data analysis systems, the column-based compressed database has become a proper model because of its sup...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 인덱스 관점에서 살펴보며, 메모리 데이터베이스에서 B-Tree도 많이 사용된다.[5] 본 연구에서는 일반 데이터 베이스의 기본 색인인 B+-Tree를 본 컬럼-지향 플래시메모리 저장 환경에 적합하게 개선하여, 검색 속도를 높이고, 저장 안정성을 개선할 수 있는 색인 이중화 기법인 AID-Tree (Asymmetric Index Duplication Tree) 및 관리 기법을 제안한다. AID-Tree 기법은 이중화와 더불어 B-Tree의 비활용 영역을 제거한 압축과 내장된 압축 인덱스 기반의 고속 검색을 활용한다.
  • 특히 데이터가 미러링 되어 중복되어 있는 경우에는 두 경로에서 데이터를 접근할 수 있게 되므로 그 효율을 더 높아질 수 있다. 본 연구에서는 기존의 단일 인덱스가 아닌 서로 다른 두 개의 인덱스 개념을 도입하여 안정성과 성능을 개선하게 된다. 본 제안 기법에서는 디스크 기반 및 메인 메모리 기반 색인 중에서 가장 지속적으로 사용되며 공통적인 모태 속성을 가진 B-Tree색인을 근간으로 하여 보편성을 살리되, 대용량 압축 데이터베이스 및 고속 플래시 메모리에 효과적인 색인 관리 및 데이터 검색 기법을 제안한다.
  • 즉, 과거와는 달리 이제 대용량 데이터베이스의 인덱스를 다시 생성하기에는 이제는 너무 많은 시간이 필요하고, 그 지연시간동안 운영은 겨우 되더라도 해당 인덱스가 없으므로 그 검색 성능은 매우 저하되게 된다. 본 연구의 목표는 이러한 인덱스의 기존 관리개념을 탈피하여, 새로운 방식으로 이중화 저장 관리하여 저비용으로 안정성과 검색성을 높이고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
컬럼-기반 저장소는 어떤 방법인가? 빅 데이터 분석 분야에서 효과적인 컬럼-기반 저장소[1]는 세로의 필드 단위로 분리, 저장, 검색하는 새로운 방법이다. 판독 위주의 데이터베이스 환경에서는 특정 컬럼에 데이터가 군집되어 있는 컬럼 저장 구조가 효율적이며, C-Store[2]가 알려져 있다.
세로-저장 스토리지의 장점은? 기본적으로 세로-저장 스토리지는 테이블 저장시 세로로 분리 저장하므로, 유사성이 높은 데이터들이 서로 군집되어, 압축, 저장, 검색에 매우 효과적인 구조이다.과거에는 하드 디스크가 대세였고 스토리지도 이에 적응하였으므로, 하드 디스크의 접근 특성을 고려하였고, 당연히 저장 연산 처리에 가장 효율적인 방식인 가로-기반 저장 방식으로 설계되었다.
인덱스 기법과 대용량 검색의 고속화 및 이중화 기법이 필요한 이유는 무엇인가요? 그러나 기존의 인덱스 관리 구조는 전통적인 스토리지에 초점이 맞추어져 있으므로, 최신 플래시 메모리 스토리지나 읽기가 대부분인 대용량 데이터웨어하우스의 구조에 맞게 개선되어야 한다. 즉, 차세대 플래시 기반의 압축에 효과적인 인덱스 기법과 대용량 검색의 고속화 및 이중화 기법이 필요하다.
질의응답 정보가 도움이 되었나요?

참고문헌 (11)

  1. D. Abadi, P. Boncz, P. Alto, "Column-oriented Database Systems," Proc. of the VLDB, Lyon, France , August pp. 24-28, 2009. DOI: http://dx.doi.org/10.14778/1687553.1687625 

  2. S. Ahn, K. Kim. "A Join Technique to Improve the Performance of Star Schema Queries in Column-Oriented Databases", Journal of Korean Institute of Information Scientist and Engineers, Vol. 40, No.3, pp. 209-218, 2013.6. 

  3. Y.Chang, J. Hsieh, and T. Kuo, "Endurance Enhancement of Flash-Memory Storage System: An Efficient Static Wear Leveling Design," Proc. of the 44th conference on Design automation, San Diego, USA, pp. 212-217, 2012 

  4. S. Byun. "Search Performance Improvement of Column-oriented Storages using Compression Index", Journal of Korea Academia-Industrial, Vol. 14, No.1, pp. 393-401, 2013. DOI: http://dx.doi.org/10.5762/KAIS.2013.14.1.393 

  5. L. Hongjun, N. Yuet Yeung, and T. Zengping, "T-Tree or B-Tree: Main Memory Database Index Structure Revisited", Proc. of 11th Australasian Database Conference, 2000 

  6. R. Elmasri and S. Navathe, Fundamentals of Database System, Addison-Wesley, 2010. 

  7. Y. Li, B. He, R. J. Yang, Q. Luo, and K. Yi, "Tree indexing on solid state drives," Proc. of the VLDB, vol. 3, no. 1-2, 2010, pp. 1195-1206. DOI: http://dx.doi.org/10.14778/1920841.1920990 

  8. M. Yoo, B. Kim. and D. Lee "Hybrid Hash Index for NAND Flash Memory-based Storage Systems", Journal of Korean Information Science, Vol. 38, No.2, pp. 120-128, 2012.4. DOI: http://dx.doi.org/10.1145/2184751.2184819 

  9. C. H. Wu, L. P. Chang, and T. W. Kuo, "An efficient B-tree layer for flash-memory storage systems," Proc. of 9th RTCSA, Tainan City, Taiwan, 2003, pp. 409-430. 

  10. M. Oberhumer, LZO" Available From: http://www.oberhumer.com/opensource//lzodoc.php(accessed Feb., 10, 2015) 

  11. Mesquite, User's Guide CSIM20 Simulation Engine (C++ Version), Available From: http://www.mesquite.com//documents/CSIM20_User_Guide-C++.pdf, (accessed Feb., 10, 2015) 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로