데이터 입출력의 지연 및 병목현상을 해결하기 위해, 여러 개의 디스크를 병렬 구조로 연결한 RAID 시스템이 널리 사용되고 있다. 현재 HDD에 비해 입출력 성능이 좋은 SSD 기반의 RAID 시스템이 활성화 되고 있으나, SSD를 사용하여 RAID 시스템을 구현 할 경우 SSD의 쓰기 횟수 제한 문제와 빈번한 쓰기 연산으로 인한 전력소모의 문제가 발생한다. 본 논문에서는 갱신 비용이 많이 드는 SSD 기반의 RAID 시스템에서 parity 디스크의 중복된 데이터를 제거하는 방법을 제안한다. 제안한 방법은 parity 데이터의 chunk 보다 작은 크기로 분할 하고, 중복된 데이터를 제거 하여 쓰기 연산을 줄이고 마모도 및 전력 소모를 낮춘다. 실험결과 EVENODD 코드를 사용한 RAID-6 시스템의 경우 제안한 방법이 전체 디스크의 약 16%, parity 디스크에서 31% 마모도의 감소를 보였으며, 30% 전력 감소를 보여 중복제거기법을 사용하지 않았을 때 보다 성능이 증가 한 것을 알 수 있다. RAID-5 시스템에서는 전체 디스크의 약 12%, parity 디스크의 32%의 마모도 감소를 보였고, 전력소모의 경우 36%의 전력 소모 감소를 보인다.
데이터 입출력의 지연 및 병목현상을 해결하기 위해, 여러 개의 디스크를 병렬 구조로 연결한 RAID 시스템이 널리 사용되고 있다. 현재 HDD에 비해 입출력 성능이 좋은 SSD 기반의 RAID 시스템이 활성화 되고 있으나, SSD를 사용하여 RAID 시스템을 구현 할 경우 SSD의 쓰기 횟수 제한 문제와 빈번한 쓰기 연산으로 인한 전력소모의 문제가 발생한다. 본 논문에서는 갱신 비용이 많이 드는 SSD 기반의 RAID 시스템에서 parity 디스크의 중복된 데이터를 제거하는 방법을 제안한다. 제안한 방법은 parity 데이터의 chunk 보다 작은 크기로 분할 하고, 중복된 데이터를 제거 하여 쓰기 연산을 줄이고 마모도 및 전력 소모를 낮춘다. 실험결과 EVENODD 코드를 사용한 RAID-6 시스템의 경우 제안한 방법이 전체 디스크의 약 16%, parity 디스크에서 31% 마모도의 감소를 보였으며, 30% 전력 감소를 보여 중복제거기법을 사용하지 않았을 때 보다 성능이 증가 한 것을 알 수 있다. RAID-5 시스템에서는 전체 디스크의 약 12%, parity 디스크의 32%의 마모도 감소를 보였고, 전력소모의 경우 36%의 전력 소모 감소를 보인다.
RAID systems have been widely used by connecting several disks in parallel structure. to resolve the delay and bottleneck of data I/O. Recently, SSD based RAID systems are emerging since SSDs have better I/O performance than HDD. However, endurance and power consumption problems due to frequent writ...
RAID systems have been widely used by connecting several disks in parallel structure. to resolve the delay and bottleneck of data I/O. Recently, SSD based RAID systems are emerging since SSDs have better I/O performance than HDD. However, endurance and power consumption problems due to frequent write operation in SSD based RAID system should be resolved. In this paper, we propose a de-duplication method of parity disk in SSD based RAID system with expensive update cost. The proposed method segments chunk of parity data into small pieces and removes duplicate data, therefore, it can reduce wear-leveling and power consumption by decreasing write operation for duplicated parity data. Experimental results show that bit update rate of the proposed method is 16% in total disk, 31% in parity disk less than that of existing method in RAID-6 system using EVENODD erasure code, and the power consumption of the proposed method is 30% less than that of existing method. Besides the proposed method is 12% in total disk, 32% in parity disk less than that of existing method in RAID-5 system, and the power consumption of the proposed method is 36% less than that of existing method.
RAID systems have been widely used by connecting several disks in parallel structure. to resolve the delay and bottleneck of data I/O. Recently, SSD based RAID systems are emerging since SSDs have better I/O performance than HDD. However, endurance and power consumption problems due to frequent write operation in SSD based RAID system should be resolved. In this paper, we propose a de-duplication method of parity disk in SSD based RAID system with expensive update cost. The proposed method segments chunk of parity data into small pieces and removes duplicate data, therefore, it can reduce wear-leveling and power consumption by decreasing write operation for duplicated parity data. Experimental results show that bit update rate of the proposed method is 16% in total disk, 31% in parity disk less than that of existing method in RAID-6 system using EVENODD erasure code, and the power consumption of the proposed method is 30% less than that of existing method. Besides the proposed method is 12% in total disk, 32% in parity disk less than that of existing method in RAID-5 system, and the power consumption of the proposed method is 36% less than that of existing method.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 SSD 기반의 RAID 시스템에서 갱신이 많은 parity 디스크에 RAID의 chunk 크기보다 작은 단위의 chunk 크기를 적용하여, 변하지 않은 parity 데이터의 중복된 데이터를 제거하여 디스크의 마모도를 줄이고 쓰기 연산을 낮추어 전력 소모를 감소시키는 방법을 제안한다.
본 논문에서는 SSD의 특징을 이용한 서버단위의 RAID 시스템의 문제점을 해결한다. 우선 RAID 시스템의 chunk-size 의 크기는 SSD의 page 크기보다 크다.
제안 방법
MLC 타입 SSD를 사용하여 RAID-5 시스템을 구축하고 같은 방법으로 실험 하였다.
MLC 타입의 SSD로 EVENODD 코드를 사용한 RAID-6 시스템과 RAID-5 시스템을 각각 구축하고, chunk 크기 별로 읽기/쓰기 성능을 비교하였다.
그림 13. RAID-5에서 전력소모 성능 비교.
그림 10. RAID-6에서 전력소모 성능 비교.
새로운 parity 값이 디스크에 저장되기 전 chunking을 수행 한다. 그 후 중복제거 연산을 수행하여, 새로운 해시 값을 만들고 기존의 해시 값과 비교하여, 중복된 데이터를 구별한다.
따라서 parity 디스크에 chunk 단위 보다 작은 크기로 de-duplication 기법을 적용함으로써 parity 데이터의 기존과 같은 부분의 중복을 줄일 수 있다. 그로 인해, 쓰기 연산이 줄어들게 되고, 마모도 및 전력소모를 낮추는 기법을 제안한다.
리눅스 환경에서 Jerasure 시뮬레이터를 사용하여 Erasure 코드 중 EVENODD를 사용하는 RAID-6와 RAID-5로 각각 구현하였으며, 동일하게 6개의 SSD를 저장장치로 사용하였다[7]. 실험 데이터로는 일반적인 PC 환경의 데이터들을 이용하여 실험하였다.
본 실험을 통하여 마모도 감소 및 전력 소모, 입/출력 성능에 대하여 측정 및 비교 분석 하였다.
대상 데이터
. 실험 데이터로는 일반적인 PC 환경의 데이터들을 이용하여 실험하였다. 표 1은 사용된 실험 환경을 보여준다.
데이터처리
그림 11. RAID-6에서 제안한 방법의 입출력 성능 비교.
이론/모형
이와 같은 특징 때문에 parity 데이터의 값이 크게 변하지 않았을 경우, 중복 데이터가 생기는 문제가 있다. 따라서 parity 디스크에 chunk 단위 보다 작은 크기로 de-duplication 기법을 적용함으로써 parity 데이터의 기존과 같은 부분의 중복을 줄일 수 있다. 그로 인해, 쓰기 연산이 줄어들게 되고, 마모도 및 전력소모를 낮추는 기법을 제안한다.
제안한 parity 디스크 중복제거 기법의 성능을 평가 하기 위하여 EVENODD를 사용하는 RAID-6 기법과 전통적인 RAID-5 기법에 각각 적용 하였다.
성능/효과
RAID-5 시스템과 EVENODD 코드를 사용한 RAID-6 시스템에서 비교 했을 떼, 읽기/쓰기 성능에서는 제안한 방법의 연산 복잡도가 올라가는 이유로, 기존의 방법이 제안한 방법에 비해 조금 나은 성능을 보였지만, 마모도와 전력소모의 경우 기존의 방법보다 성능이 향상되었음을 확인할 수 있었다.
RAID-5 역시 연산 복잡도로 인한 성능저하로 인해 제안한 방법이 기존의 방법보다 읽기는 5% 정도 쓰기는 10% 정도 낮은 성능을 보였다.
그림 12는 RAID-5의 마모도 기법을 비교한 실험이다. RAID-5의 마모도 실험에서는 제안한 방법이 전체 디스크에서 12% 정도 parity 디스크에서 32% 정도의 감소율을 보였다. 전력 소모의 경우 그림 13과 같이 제안한 방법이 36% 정도 전력 소모가 감소한 것을 볼 수 있었다.
RAID-5의 마모도 실험에서는 제안한 방법이 전체 디스크에서 12% 정도 parity 디스크에서 32% 정도의 감소율을 보였다. 전력 소모의 경우 그림 13과 같이 제안한 방법이 36% 정도 전력 소모가 감소한 것을 볼 수 있었다.
제안한 parity에 중복제거 기법을 적용하였을 경우, 기존의 방법이 읽기는 2%, 쓰기는 18% 정도 더 좋은 성능을 보여주었다. 그 이유는 parity 데이터의 중복제거 연산에 의한 복잡도가 올라갔기 때문이다.
제안한 방법은 parity 중복제거를 적용하지 않은 기존의 방법에 비해 30% 절감된 전력 소모율을 보였다.
제안한 방법을 통해 작은 갱신으로 인해 중복된 값이 많던 parity 데이터의 중복된 부분을 저장하기 전에 제거해 줌으로 인해 쓰기 연산의 감소를 가져올 수 있고, 쓰기 연산의 감소로 인해 전력 소모 또한 감소시킬 수 있다.
그림 9는 EVENODD 코드를 적용한 RAID-6 시스템에서 제안한 방법의 마모도 성능을 보여준다. 제안한 방법이 기존의 방법에 비해 전체 디스크에서 약 16%, parity 디스크에서는 31% 마모도가 감소됨을 알 수 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
RAID (Redundant Array of Independent Disks) 시스템이 도입된 배경은 무엇인가?
기술의 급속한 발달에 따라 메인 프로세서와 주 기억 장치의 성능이 급격하게 향상된 데 비해 비휘발성 보조기억 장치인 HDD (Hard Disk Driver)의 경우 공간 수용 능력에 비해 자기 기록 매체의 기계적인 한계로 인해 속도 면에서 성장하지 못하였다. 이러한 데이터 입출력의 지연 현상을 해결하기 위해, 여러 개의 디스크를 병렬 구조로 연결하여 일부 중복된 데이터를 나눠서 저장하여 데이터의 병목현상을 줄이고 전반적인 속도향상을 가져오기 위한 RAID (Redundant Array of Independent Disks) 시스템이 사용되고 있으며, RAID 시스템의 데이터를 나누어 저장하는 기술은 낮은 가격으로 신뢰성과 성능 향상 이라는 장점을 가지고 있다[1]. 기존의 RAID 방식의 경우 HDD를 사용하였지만, 비휘발성 메모리인 플래시 메모리가 등장하여 SSD(Solid State Disk)가 사용되고 있다.
RAID 시스템의 데이터를 나누어 저장하는 기술이 가진 장점은?
기술의 급속한 발달에 따라 메인 프로세서와 주 기억 장치의 성능이 급격하게 향상된 데 비해 비휘발성 보조기억 장치인 HDD (Hard Disk Driver)의 경우 공간 수용 능력에 비해 자기 기록 매체의 기계적인 한계로 인해 속도 면에서 성장하지 못하였다. 이러한 데이터 입출력의 지연 현상을 해결하기 위해, 여러 개의 디스크를 병렬 구조로 연결하여 일부 중복된 데이터를 나눠서 저장하여 데이터의 병목현상을 줄이고 전반적인 속도향상을 가져오기 위한 RAID (Redundant Array of Independent Disks) 시스템이 사용되고 있으며, RAID 시스템의 데이터를 나누어 저장하는 기술은 낮은 가격으로 신뢰성과 성능 향상 이라는 장점을 가지고 있다[1]. 기존의 RAID 방식의 경우 HDD를 사용하였지만, 비휘발성 메모리인 플래시 메모리가 등장하여 SSD(Solid State Disk)가 사용되고 있다.
SSD가 노트북 같은 모바일 기기에 들어가는 HDD와는 비슷한 전력 소비율을 보이는 이유는 무엇인가?
하지만 노트북 같은 모바일 기기에 들어가는 HDD와는 비슷한 전력 소비율을 보였다[3]. 이처럼 전력소비율이 비슷한 이유는 쓰기 연산에서 전력소비가 가장 많이 발생하기 때문이다. 플래시 메모리는 제자리 덮어쓰기가 안 되는 문제로 인해, 기존의 데이터를 무효로 표시하고 다른 곳에 쓰는 방법을 사용한다.
참고문헌 (7)
D. Patterson, G. Gibson, and R. Katz, "A Case for Redundant Arrays of Inexpansive Disks (RAID)," In Proc. of ACM SIGMOD Conf. on Management of Data, pp.109-116, 1988.
A. Kadav, M. Balakrishnan, V. Prabhakaran, D. Malkhi, "Differential RAID: Rethinking RAID for SSD Reliability," Workshop on Hot Topics in Storage and File Systems (HotStorage' 09) colocated with SOSP, October 2009.
D. Narayanan, E. Thereska, A. Donnelly, S. Elnikety, A. Rowstron. "Migrating server storage to SSDs: analysis of tradeoffs," In Proc. of the 4th ACM European Conference on Computer systems (Eurosys '09), pp. 145-158, 2009.
B. Yoo, Y. Won, S. Cho, S. Kang, J. Choi, S. Yoon, "SD Characterization: From Energy Consumption's Perspective," In Proc. of the 3rd USENIX conference on Hot Topic in Storage and File Systems (HotStorage' 11) June, 2011.
E. Lee, R. Kartz, "Performance Consequences of parity Placement in Disk Arrays," In Proc. of ASPLOS-IV Prec. pp.190-199, 1999.
Blaum, M., Brady, J., Bruck, J., and Menon, J. EVENODD: An efficient scheme for tolerating double disk failures in RAID architectures. IEEE Transactions on Computing 44, 2, Feb. 1995.
James S. Plank, "The RAID-6 liberation codes", In Proc. of the 6th USENIX Conference on File and Storage Technologies, San Jose, California, pp.1-14, February 2008.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.