본 논문은 임베디드 시스템, PC 및 고성능 서버에서 활발하게 사용되는 SSD(Solid-State Drive)를 기반으로 데이터의 중복성을 제거하는 기법을 연구한다. 중복제거 기법은 중복된 쓰기를 줄임으로써 저장 공간 이용률을 감소시키고 I/O 성능을 향상시킬 수 있다. 따라서 많은 데이터 서버와 백업 스토리지들이 중복제거 기법을 활용하고 있다. SSD에 중복제거 기법을 적용할 경우 다음의 추가적인 3가지 장점을 얻을 수 있다. 첫째, 저장 장치 이용률의 감소로 얻어진 공간을 오버프로비저닝 영역으로 활용하여 가비지 컬렉션의 부하를 줄일 수 있다. 둘째, WAF(Write Amplification Factor)을 줄여 수명과 신뢰성을 향상 시킬 수 있으며, 셋째, FTL(Flash Translation Layer)을 활용함으로써 중복된 데이터의 매핑 관리 부하를 줄일 수 있다. 하지만 SSD에서 중복률이 얼마나 되는지, 효율적인 중복 제거가 가능한지 등에 대한 이슈들이 존재한다. 이러한 이슈들을 분석하기 위하여, 본 논문에서는 SSD를 위한 중복 제거 구조를 설계한다. 이것은 핑거프린트 생성기, 핑거프린트 관리자, 매핑테이블 관리자로 구성된다. 또한 SHA-1 하드웨어 로직, 최근성 기반 핑거프린트 관리, 샘플링 기반 필터링 이라는 3가지 성능 향상 기술을 제안한다. 제안된 구조와 기술은 실제 SSD와 FPGA 탑재 임베디드 보드에서 평가되었다. 실험 결과 9가지 SSD 워크로드들에서 5~52% (평균 17%)의 중복률을 얻을 수 있었다. 쓰기 응답시간은 최대 48%, 평균 15%가 향상되었으며, 수명은 최대 3.4배, 평균 2.5배 향상시킬 수 있었다.
본 논문은 임베디드 시스템, PC 및 고성능 서버에서 활발하게 사용되는 SSD(Solid-State Drive)를 기반으로 데이터의 중복성을 제거하는 기법을 연구한다. 중복제거 기법은 중복된 쓰기를 줄임으로써 저장 공간 이용률을 감소시키고 I/O 성능을 향상시킬 수 있다. 따라서 많은 데이터 서버와 백업 스토리지들이 중복제거 기법을 활용하고 있다. SSD에 중복제거 기법을 적용할 경우 다음의 추가적인 3가지 장점을 얻을 수 있다. 첫째, 저장 장치 이용률의 감소로 얻어진 공간을 오버프로비저닝 영역으로 활용하여 가비지 컬렉션의 부하를 줄일 수 있다. 둘째, WAF(Write Amplification Factor)을 줄여 수명과 신뢰성을 향상 시킬 수 있으며, 셋째, FTL(Flash Translation Layer)을 활용함으로써 중복된 데이터의 매핑 관리 부하를 줄일 수 있다. 하지만 SSD에서 중복률이 얼마나 되는지, 효율적인 중복 제거가 가능한지 등에 대한 이슈들이 존재한다. 이러한 이슈들을 분석하기 위하여, 본 논문에서는 SSD를 위한 중복 제거 구조를 설계한다. 이것은 핑거프린트 생성기, 핑거프린트 관리자, 매핑테이블 관리자로 구성된다. 또한 SHA-1 하드웨어 로직, 최근성 기반 핑거프린트 관리, 샘플링 기반 필터링 이라는 3가지 성능 향상 기술을 제안한다. 제안된 구조와 기술은 실제 SSD와 FPGA 탑재 임베디드 보드에서 평가되었다. 실험 결과 9가지 SSD 워크로드들에서 5~52% (평균 17%)의 중복률을 얻을 수 있었다. 쓰기 응답시간은 최대 48%, 평균 15%가 향상되었으며, 수명은 최대 3.4배, 평균 2.5배 향상시킬 수 있었다.
In this paper, we propose a new redundant data elimination (as known as deduplication) scheme for SSD (Solid State Drive), which are popularly employed in embedded systems, desktop PCs and high performance servers. Traditionally, data servers and backup storages make use of deduplication since it ca...
In this paper, we propose a new redundant data elimination (as known as deduplication) scheme for SSD (Solid State Drive), which are popularly employed in embedded systems, desktop PCs and high performance servers. Traditionally, data servers and backup storages make use of deduplication since it can reduce storage utilization and improve I/O performance by removing duplicate writes. In SSD, we find out additional three benefits. The first one is that it can improve the garbage collection overhead by exploiting the reduced storage utilization as over-provisioning area. Second, it can give a potential to enhance the lifetime and reliability of SSD by decreasing WAF(Write Amplification Factor). Third, the mapping overhead can be alleviated by utilizing FTL(Flash Translation Layer). However, there are several issues about deduplication ratio and efficiency. To explore these issues, we design a deduplication architecture for SSD, which consists of the following three components: fingerprint generator, fingerprint manager and mapping manager. Also, we investigate three performance acceleration techniques, that we refer as SHA-1 hardware logic, recency based fingerprint management and sample based filtering. We have evaluated our proposal on a real SSD and FPGA-equipped embedded board. Experimental results have shown that we can achieve the duplication ratio ranging from 4% to 52%, with an average 17%, for the nine SSD workloads. The response time of a write request can be improved by up to 48% with an average of 15%, while the lifespan of SSDs are expected to increase up to 3.4 times with an average of 2.5 times.
In this paper, we propose a new redundant data elimination (as known as deduplication) scheme for SSD (Solid State Drive), which are popularly employed in embedded systems, desktop PCs and high performance servers. Traditionally, data servers and backup storages make use of deduplication since it can reduce storage utilization and improve I/O performance by removing duplicate writes. In SSD, we find out additional three benefits. The first one is that it can improve the garbage collection overhead by exploiting the reduced storage utilization as over-provisioning area. Second, it can give a potential to enhance the lifetime and reliability of SSD by decreasing WAF(Write Amplification Factor). Third, the mapping overhead can be alleviated by utilizing FTL(Flash Translation Layer). However, there are several issues about deduplication ratio and efficiency. To explore these issues, we design a deduplication architecture for SSD, which consists of the following three components: fingerprint generator, fingerprint manager and mapping manager. Also, we investigate three performance acceleration techniques, that we refer as SHA-1 hardware logic, recency based fingerprint management and sample based filtering. We have evaluated our proposal on a real SSD and FPGA-equipped embedded board. Experimental results have shown that we can achieve the duplication ratio ranging from 4% to 52%, with an average 17%, for the nine SSD workloads. The response time of a write request can be improved by up to 48% with an average of 15%, while the lifespan of SSDs are expected to increase up to 3.4 times with an average of 2.5 times.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.