최근에 데이터가 대용량화됨에 따라 정보 저장의 중요성이 부각되고 있다. 본 연구는 대용량 저장장 치에 많이 사용되는 2.5인치 HDD에 대해서 가속 시험결과를 토대로 연간 제품 고장률을 예측하고 사용 환경에 대한 연간 제품 고장률과의 차이를 최소화 시키는 새로운 방안을 제시하고자 한다. 반품된 2.5인치 HDD 309개의 정보를 분석하여 실사용 환경의 시간당 전송량을 구했고, 가속 수명시험으로부터 가속 시험조건의 시간당 전송량을 구한 후, 사용률에 대한 가속 계수를 산출했다. 온도에 대한 가속 계수, 사용률에 대한 가속 계수와 고장률로 연간 제품 고장률을 예측하였다. 가속 시험의 시간당 전송량 81.4GB/hour와 사용자 93.4 %까지 대표하는 실사용 환경의 시간당 전송량은 5.8 GB/hour로 산출한 사용률에 대한 가속 계수는 14.1이다. 실사용 환경의 연간 제품 고장률은 1년 이후 안정화 되었으며, 이때 연간 제품 고장률은 0.3~0.378 % 이내에서 변동 하였다. 본 연구를 통하여 예측된 연간 제품 고장률은 0.4 %로 실사용 환경의 연간 제품 고장률과 75~94%의 일치됨을 보였다. 본 연구는 제조사의 가속수명 결과로 실사용 환경을 연간 제품 고장률을 예측하는 방법에 영향을 줄 것이다.
최근에 데이터가 대용량화됨에 따라 정보 저장의 중요성이 부각되고 있다. 본 연구는 대용량 저장장 치에 많이 사용되는 2.5인치 HDD에 대해서 가속 시험결과를 토대로 연간 제품 고장률을 예측하고 사용 환경에 대한 연간 제품 고장률과의 차이를 최소화 시키는 새로운 방안을 제시하고자 한다. 반품된 2.5인치 HDD 309개의 정보를 분석하여 실사용 환경의 시간당 전송량을 구했고, 가속 수명시험으로부터 가속 시험조건의 시간당 전송량을 구한 후, 사용률에 대한 가속 계수를 산출했다. 온도에 대한 가속 계수, 사용률에 대한 가속 계수와 고장률로 연간 제품 고장률을 예측하였다. 가속 시험의 시간당 전송량 81.4GB/hour와 사용자 93.4 %까지 대표하는 실사용 환경의 시간당 전송량은 5.8 GB/hour로 산출한 사용률에 대한 가속 계수는 14.1이다. 실사용 환경의 연간 제품 고장률은 1년 이후 안정화 되었으며, 이때 연간 제품 고장률은 0.3~0.378 % 이내에서 변동 하였다. 본 연구를 통하여 예측된 연간 제품 고장률은 0.4 %로 실사용 환경의 연간 제품 고장률과 75~94%의 일치됨을 보였다. 본 연구는 제조사의 가속수명 결과로 실사용 환경을 연간 제품 고장률을 예측하는 방법에 영향을 줄 것이다.
The mass storage of data and the importance of storage capacity lately has emerged. In this paper, we suggest the new method which estimate life cycle from acceleration life test about 2.5 inch hard disk driver as mass storage, which minimize the difference between real market annual failure rate an...
The mass storage of data and the importance of storage capacity lately has emerged. In this paper, we suggest the new method which estimate life cycle from acceleration life test about 2.5 inch hard disk driver as mass storage, which minimize the difference between real market annual failure rate and estimated failure rate. we obtain market transfer capacity per hours from returned 2.5inch hard disk drives about 309 numbers and accelerating transfer capacity per hours from acceleration life test. we calculate acceleration factor about duty cycle and estimate annual failure rate from failure rate and acceleration factors: temperature acceleration factor, duty cycle acceleration factor, the transfer capacity per hour represent the 93.4 % of user is 5.8 GB/hour, the transfer capacity per hour from acceleration life test is 81.4 GB/hour. the acceleration factor of duty cycle is 14.1. annual failure rate is stabilized at market one year after, annual failure rate is between 0.3 and 0.378. estimated annual failure rate is 0.4, so it is matched at 75~94 % between estimate annual failure rate and market annual failure rate. This study influence the estimate method of annual failure rate by the result of acceleration life cycle of manufacture.
The mass storage of data and the importance of storage capacity lately has emerged. In this paper, we suggest the new method which estimate life cycle from acceleration life test about 2.5 inch hard disk driver as mass storage, which minimize the difference between real market annual failure rate and estimated failure rate. we obtain market transfer capacity per hours from returned 2.5inch hard disk drives about 309 numbers and accelerating transfer capacity per hours from acceleration life test. we calculate acceleration factor about duty cycle and estimate annual failure rate from failure rate and acceleration factors: temperature acceleration factor, duty cycle acceleration factor, the transfer capacity per hour represent the 93.4 % of user is 5.8 GB/hour, the transfer capacity per hour from acceleration life test is 81.4 GB/hour. the acceleration factor of duty cycle is 14.1. annual failure rate is stabilized at market one year after, annual failure rate is between 0.3 and 0.378. estimated annual failure rate is 0.4, so it is matched at 75~94 % between estimate annual failure rate and market annual failure rate. This study influence the estimate method of annual failure rate by the result of acceleration life cycle of manufacture.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서 제조사가 가속 수명으로부터 계산한 년 간 고장률과 일반 사용자나 구글, 카네기 멜론 대학교의 연구 기간에서 계산한 연간 제품 고장률과의 차이에 대한 원인을 알 수 있었다. 현재 까지 제조업자는 사용률에 대한 가속 factor를 실사용 환경의 정보로부터 구하지 않고, 온도에 대한 가속 계수만을 반영하여 MTTF, 연간 제품 고장률을 구하여 왔다.
본 연구에서는 2.5인치 HDD에 대해서 HDD 제조사가 수명예측에 사용하는 가속 수명시험(Acceleration life cycle test)의 결과로 정확도 높은 연간 제품 고장률을 예측하는 방법을 제공하여, HDD 제조자에게는 신뢰성 높은 제품개발에 도움을 주고, 실사용자에는 데이터의 예방 보존에 참조자료를 제공하고자 한다.
제안 방법
주소접근 방식의 비율은 순차적 주소 접근과 임의적 주소 접근이 5대 5로 시험을 진행하였다. Note PC에 연결된 2.5 인치 HDD를 사용 주소접근 방식을 분석한 결과, 순차적 접근 방식이 임의 접근 방식보다 6대 4의 비율로 높았으나 순차적 접근 방식도 시간 간격으로 나누면 임의 접근 방식으로 표현되는 것이 많아서 순차적 접근 방식과 임의 접근 방식을 5대 5의 비율로 가속 수명 시험을 진행하였다.
시장에서 반품된 HDD의 사용 장소에 따라서, 대형 컴퓨터 회사의 주문자 상표 부착품(original equipment manufacturing, OEM), 일반 소비자나 소규모 컴퓨터 조립회사에서 사용하는 유통품, 외장형 HDD에 사용되는 외장형품으로 구분하였다. OEM, 유통품, 그리고 외형형품에 저장되어 있는 SMART 정보와 SPM정보를 제조자가 지정한 위치에서 읽어 들인 후 데이터를 정리했다<표 1>.
식 (5)에 적용된 T는 전체 HDD 테스트 시간(total drive test hour), α는 신뢰수준(confidential level)이며 95%로 정했고, r은 시험 중에 발생한 불량 개수이다. 불량율과 온도에 대한 가속 factor, 온도에 대한 degradation factor, 사용률에 대한 가속 factor를 식 (6)에 대입하여 년 간 고장률을 온도별로 산출하였다(그림. 3).
시료에 공급된 전압은 12V와 5V모두 공급되었고, 최대성능의 95 %조건으로 1000시간 동안 실험 하였다.
시장에서 반품된 HDD의 사용 장소에 따라서, 대형 컴퓨터 회사의 주문자 상표 부착품(original equipment manufacturing, OEM), 일반 소비자나 소규모 컴퓨터 조립회사에서 사용하는 유통품, 외장형 HDD에 사용되는 외장형품으로 구분하였다. OEM, 유통품, 그리고 외형형품에 저장되어 있는 SMART 정보와 SPM정보를 제조자가 지정한 위치에서 읽어 들인 후 데이터를 정리했다<표 1>.
실 사용자의 시간당 데이터 전송량은 총 데이터 전송률에 총 전원 시간 (Total power on Hour)을 나누어서 산출하였다. 제조업체의 가속 시험결과로 얻어진 활성화 에너지(Activation energy) 0.
5 인치 HDD 309대에 저장되어 있는 SMART 데이터와 자체 매개변수 모니터링(Self parameter monitoring, SPM) 데이터를 분석했다. 연간 제품 고장률 산출을 위해서, 2009년 4월부터 2011년 5월사에 판매된 250 GB (Giga Byte, GB)용량의 HDD의 판매와 반품된 대수, 500 GB 용량의 HDD의 판매 대수와 반품된 대수를 조사하였다.
5이다. 온도에 대한 가속 factor, 사용률에 대한 가속 factor와 고장률로 사용조건(30 ˚C)에서 연간 제품 고장률(AFR)을 0.4 %로 예측 하였다.
<표 1>의 하루당 평균 읽기와 쓰기의 비율을 비교해 보면 읽기가 쓰기 대비해서 6대 4의 비율로 높으나, 시장에서 반품된 HDD의 불량 발생 전의 동작을 분석한 결과, 쓰기가 읽기 대비해서 6대 4의 비율로 높게 발생하여서 가속 시험의 읽기와 쓰기의 비율을 5대 5의 비율로 진행하였다. 주소접근 방식의 비율은 순차적 주소 접근과 임의적 주소 접근이 5대 5로 시험을 진행하였다.
실 사용자의 시간당 데이터 전송량은 총 데이터 전송률에 총 전원 시간 (Total power on Hour)을 나누어서 산출하였다. 제조업체의 가속 시험결과로 얻어진 활성화 에너지(Activation energy) 0.2775 eV, 시간당 데이터 전송량 84.1GB/hour를 분석에 활용하였다. 그리고 고장률을 계산하기 위해서 제조업체의 가속 수명 시험 결과를 활용 하였다<표 2>.
대상 데이터
제조사의 가속 수명 시험과 실 사용자의 사용 환경과의 차이를 분석하기 위해서, 2008년 4월부터 2011년 9월까지 제조사에 반품된, 2.5 인치 HDD 309대에 저장되어 있는 SMART 데이터와 자체 매개변수 모니터링(Self parameter monitoring, SPM) 데이터를 분석했다. 연간 제품 고장률 산출을 위해서, 2009년 4월부터 2011년 5월사에 판매된 250 GB (Giga Byte, GB)용량의 HDD의 판매와 반품된 대수, 500 GB 용량의 HDD의 판매 대수와 반품된 대수를 조사하였다.
이론/모형
6) HDD의 시간당 데이터 전송량은 확률분포에서 전체 분포의 90%이상을 점유하고 (percentage), 95% 신뢰구간의 아래 경계선 (Lower bound)과 윗 경계선 (Upper bound) 사이에 있는 시간당 데이터 전송량을 채택하였다. 고장률을 계산하기 위해서 국제 디스크 장비와 재료 협회(International disk drive equipment and material association, IDEMA)의 규격7)을 적용하여 윗쪽에만 신뢰한계(upper one-side confidence limit)를 두는 카이제곱 분포(Chi-square distribution)를 사용하였고, 신뢰 수준(confidential level)을 95%로 설정하였다.
분석 조건에서 정한 활성화 에너지를 0.2775 eV를 아레니우스 모형 식 (3)에 대입하여 온도 별 가속 factor를 산출하였고, 식 (4)에 대입하여 온도별 열화 계수(Degradation factor, DF)를 구하였다<표 3>.
실사용 환경에서 사용되는 HDD의 시간당 데이터 전송량을 구하기 위해서, 반품된 HDD 309대에서 SMART 정보와 SPM 정보를 읽어 들여 얻어진 시간당 데이터 전송량을 95% 신뢰구간을 가진 정규분포를 점유율 (Percentage) 측면으로 나타낸 확률분포를 구하기 위해서 윈도우용 미니탭 소프트웨어 version 4 (Minitab Inc, america)를 이용하였다.6) HDD의 시간당 데이터 전송량은 확률분포에서 전체 분포의 90%이상을 점유하고 (percentage), 95% 신뢰구간의 아래 경계선 (Lower bound)과 윗 경계선 (Upper bound) 사이에 있는 시간당 데이터 전송량을 채택하였다.
성능/효과
6) HDD의 시간당 데이터 전송량은 확률분포에서 전체 분포의 90%이상을 점유하고 (percentage), 95% 신뢰구간의 아래 경계선 (Lower bound)과 윗 경계선 (Upper bound) 사이에 있는 시간당 데이터 전송량을 채택하였다. 고장률을 계산하기 위해서 국제 디스크 장비와 재료 협회(International disk drive equipment and material association, IDEMA)의 규격7)을 적용하여 윗쪽에만 신뢰한계(upper one-side confidence limit)를 두는 카이제곱 분포(Chi-square distribution)를 사용하였고, 신뢰 수준(confidential level)을 95%로 설정하였다.
가속 시험에 사용된 HDD와 동일한 2.5인치 HDD에 대해서 2년 동안 실사용 환경의 AFR를 산출한 결과 1년 이후에 AFR이 0.3 %∼0.378 % 이내로 안정화 되었다.
구글 회사는 자신의 기반 시스템에 내장된 HDD의 사용 환경 및 스마트 (Self-monitoring analysis and reporting technology, SMART) 데이터를 분석하여 사용 환경이 수명예측에 큰 상관관계가 없으며, SMART 항목(Parameter)중 데이터 영역을 읽다가 발생한 에러 수(Scan errors), 읽기 동작 수행 중에 재시도(Retry)후, 주소를 재할당한 수 (Reallocation count), 작동하지 않는 시간에 데이터 영역을 읽다가 이상이 발생할 소지가 있는 영역을 재할당하는 수(Offline reallocation count), 그리고 읽기나 쓰기 동작 중 불량이 가끔 발생할 소지가 있는 수(Probational count)가 불량 발생 확률에 큰 영향을 준다고 발표 하였다.2)
현재 까지 제조업자는 사용률에 대한 가속 factor를 실사용 환경의 정보로부터 구하지 않고, 온도에 대한 가속 계수만을 반영하여 MTTF, 연간 제품 고장률을 구하여 왔다. 그리고 연구기간 (카네기 대학교, IDEMA)은 반품된 HDD를 전체 불량으로 간주하여 연간 제품 고장률을 산출하고, 여러 제품을 모두 합쳐서 연간 제품 고장률을 산출하였기 때문에 정확도가 떨어지는 것으로 나타났다. 반품된 HDD 309개 중에 143개는 불량이 재현되지 않았다.
둘째, 디스크 배열에 많이 사용되었던 소형 컴퓨터 시스템 연결(small computer system interface, SCSI)방식과 파이버 채널(fiber channel, FC)방식을 지원하는 하드디스크는 최근 디스크 배열에 많이 사용되고 있는 직렬 컴퓨터 연결(serial at attachment, SATA) 방식을 지원하는 하드디스크와 연간 제품 교체률(annual replacement rate, ARF)에 차이가 없었다.
따라서 예측된 AFR이 실사용 환경의 AFR과 비교하여 약 75 %∼94 %의 정확도를 보였다.
모든 용량을 합친 연간 제품 고장률이 1년 이후에 안정화됨을 확인 할 수 있었다.
본 연구를 통해서 반품된 HDD에 내장되어 있는 SMART와 SPM정보를 통해서 얻은 실 사용조건의 시간당 전송률은 5.8 GB/hour이다. 가속 시험의 시간당 전송률은 84.
셋째, 교체비율이 전통적인 욕조 곡선(bathtub curve)를 따르지 않고 사용 시스템에 따라 달랐다.
첫째, HDD 제조회사가 주장하는 연간 제품 고장률 0.88∼2 %는 실사용 환경의 연간 제품 고장률 과 일치하지 않았으며, 실 연간 제품 고장률은 2∼4 % 였으며, 최대 13 %까지 증가하는 올라가는 경우도 있었다.
판매 후 1년 뒤에 AFR이 안정화됨에 따라, HDD 모든 용량의 AFR이 1년 이후부터 2년까지의 0.3%∼0.378% 이내에 분포되어 있으므로, 계산된 AFR 0.4%의 정확성을 계산해 보면, 약 75% ∼ 94%의 정확도를 보였다.
후속연구
본 연구에서 사용한 연간 제품 고장률 예측방법은 앞으로 많은 실험을 통해서 더욱 개선되어야 할 것으로 판단되며 추후 대형 서버에 내장되는 2.5인치 HDD의 수명 예측에 대하여 활용할 될 수 있을 것이라 판단된다.
질의응답
핵심어
질문
논문에서 추출한 답변
반도체 디스크의 장점은?
최근 반도체 디스크(Solid State Disk, SSD)가 경제적인 면에서 가격이 저렴하고, 읽기와 쓰기면 에서의 성능이 우수하여 개인용 컴퓨터 (personal computer, PC)에 빠르게 보급되고 있다. 하지만 하드디스크(Hard disk driver, HDD) 보다 2배 이상 높은 가격을 형성하고 있어, 여전히 HDD가 개인용 컴퓨터에 많이 사용되고 있다.
실 사용자의 시간당 데이터 전송량은 어떻게 산출하였는가?
실 사용자의 시간당 데이터 전송량은 총 데이터 전송률에 총 전원 시간 (Total power on Hour)을 나누어서 산출하였다. 제조업체의 가속 시험결과로 얻어진 활성화 에너지(Activation energy) 0.
반도체 디스크의 단점은?
최근 반도체 디스크(Solid State Disk, SSD)가 경제적인 면에서 가격이 저렴하고, 읽기와 쓰기면 에서의 성능이 우수하여 개인용 컴퓨터 (personal computer, PC)에 빠르게 보급되고 있다. 하지만 하드디스크(Hard disk driver, HDD) 보다 2배 이상 높은 가격을 형성하고 있어, 여전히 HDD가 개인용 컴퓨터에 많이 사용되고 있다.
참고문헌 (10)
Chen S, Sun FB, Yang J, "A new method of hard disk drive MTTF projection using data from an early life test", Reliability and maintainability 1999 annual symposium, pp 252-257, 1999.
Feng-Bin Sun, Shaoang Zhang, "Does Hard Disk Drive Failure Rate Enter Steady-State After one Year?", Reliability and Maintainability Symposium, Proceedings. Vol.7, pp.356-361, January 2007.
Bianca Schroeder Garth A. Gibson, "Disk failures on thr real world: What does an MTTF of 1000000 hours mean to you ?", USENIX, Proceedings, FAST USENIX Conference on File and Storage Technologies, Vol.7, No.5, February 2007.
Euy-Hyun Cho, Jeong-kyu Park and Hui-Don Seo, "The Accelerated Life Test of 2.5 Inch Hard Disk In The Environment of PC using". Journal of Digital Contents Society, Vol 15 No.1, pp.17-27 2014.
10. Strom BD, Lee SC, Tyndall GW, "Hard disk drive reliability modeling and failure prediction", Institute of electrical and electronics engineers transaction on magnetics, 43(9): 3676-84, 2007.
IDEMA org, "Disk Drive Reliability Benchmark Test Specification". IDEMA Standards Document No R3-98, pp.1-5.
Yang J, Feng-Bin Sun, "A Comprehensive Review of Hard Disk Drive Reliability",Reliability and Maint ainability Symposium, Proceedings. Annual Vol.18, No.21, pp.403-409, January 1999.
HE Z, Yang H, Xie M, "Statistical modeling and analysis of hard disk drives(HDDs) failure". APMRC 년 2012 Digest, pp 1-2, 2012.
Sun FB, Zhang S, "Does hard disk drive failure rate enter steady-state after one year ?". Reliability and maintainability symposium proceedings, autumnal symposium, 2007 RAMS'07 Annual, pp 356-361, 2007.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.