$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

낮은 쓰기 성능을 갖는 비휘발성 메인 메모리 시스템을 위한 성능 및 에너지 최적화 기법
Performance and Energy Optimization for Low-Write Performance Non-volatile Main Memory Systems 원문보기

대한임베디드공학회논문지 = IEMEK Journal of embedded systems and applications, v.13 no.5, 2018년, pp.245 - 252  

정우순 (Daegu University) ,  이형규 (Daegu University)

Abstract AI-Helper 아이콘AI-Helper

Non-volatile RAM devices have been increasingly viewed as an alternative of DRAM main memory system. However some technologies including phase-change memory (PCM) are still suffering from relatively poor write performance as well as limited endurance. In this paper, we introduce a proactive last-lev...

주제어

표/그림 (11)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 위와 같은 상황이 발생하는 경우, 반출 요구 시점과 상관없이 더 많은 “Dirty” 상태를 갖는 캐시세트를 보다 긴급성을 가지고 처리할 필요가 있다. 따라서 본 연구에서는 우선순위에 기반한 백그라운드 선반출 처리를 위해 그림 5와 같이 우선순위를 정할 수 있는 3단계 선반출 큐 관리 기법을 제안한다. 제안된 관리 기법은 PCM에 쓰기가 완료될 때까지 해당 캐시라인을 임시로 저장하고 있는 하나의 데이터 큐 (Q0), 선반출 될 캐시라인을 가리키는 2개의 포인터 큐 (Q1, Q2)와 하나의 멀티플렉서로 구성되어 있다.
  • 본 연구에서는 그림 1과 같이 DRAM을 PCM을 비롯한 낮은 쓰기 성능을 갖는 비휘발성 메인 메모 리의 상위차원 캐시로 사용할 때, 캐시 실패나 버퍼 풀의 상황에서도 비휘발성 메모리의 낮은 쓰기 성능으로 인한 실행시간 지연을 최소화할 수 있는 정책인 선제적 반출 기법 (Proactive eviction technique)을 제안한다.
  • 제안된 기법의 가장 큰 목적은 포어그라운드로 수행되는 반출과정을 백그라운드로 변환하여 성능 지연을 최소화하는 것이 목표이다. 따라서 LRU에 해당하는 캐시라인 뿐 아니라 동일 캐시세트 내 에갱신비트가 설정된 다른 캐시라인들도 가능하면 많이 선반출 하는 것이 유리하겠지만, 너무 많은 캐시 라인을 선반출 할 경우 백그라운드 처리가 복잡하게 될 뿐 아니라, 빈번한 선반출로 인해 PCM에서의 에너지 소모가 증가된다.

가설 설정

  • 배경이 회색인 사각형은 해당 캐시세트에서 가장 높은 2개의 LRU에 해당하며, 반출 후보를 나타낸다 (임계값: 2). 위 경우, 선반출을 위한 임계값은 2로 설정되어 있기 때문에 하나의 캐시세트에서 최대 2개의 캐시라인이 선반출 되는 것을 허용하며 하나의 FIFO방식의 선반출 큐를 사용하는 것을 가정한다. 이 경우 PCM의 낮은 쓰기 성능 및 빈번한 선반출 요구로 인해 하나 이상의 캐시라인들이 선반출 후보로 선정된 채 선반출 큐에서 대기하여 지연이 발생할 수 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
PCM을 메인 메모리로 사용하는 시스템에서 PCM의 쓰기 동작은 주로 언제 발생하는가? 앞장에서 언급했듯, PCM을 사용하는 메모리 시스템에서 쓰기 동작이 발생할 경우 막대한 지연시간의 증가를 피할 수 없게 된다. PCM을 메인 메모리로 사용하는 시스템에서 PCM의 쓰기 동작은 일반적으로 상위차원의 캐시에서 캐시실패가 발생했을때 주로 발생한다. 캐시실패가 발생하면 캐시제어기는 해당 캐시세트 내에 새로운 데이터를 적재할 공간을 마련하기 위해 1) 캐시라인 중 하나를 교체 블록으로 선정, 2) 선정된 캐시라인의 갱신 (dirty) 비트가 1로 설정되었을 경우 해당 캐시라인의 내용을 메인 메모리 (여기서는 PCM)에 기록하는 반출 (Eviction 또는 Flush) 작업을 수행, 3) 반출이 완료되면 반출된 캐시라인의 위치에 새로운 캐시라인을 적재하는 동작을 한다.
상변화 메모리란? 특히, 상변화 메모리 (PCM, Phase-Change Memory) 기술은 나노미터 반도체 공정기술 (Nano-meter Semiconductor Processing Technology)을 통한 성능 및 집적도 개선이 가능하므로 이에 관한 활발한 연구가 진행되어 오고 있다 [1]. 상변화 메모리는 물질의 상태 (State)에 따라 물질의 전기 전도도 차이가 존재하는 특성을 이용한 비휘발성 메모리로서, 기존 DRAM과 유사한 읽기성능을 보이면서 집적도가 높은 특성이 있지만 쓰기 성능은 수백 ns에서 수 us로 매우 낮다 [1]. 이에 PCM의 낮은 쓰기 성능을 극복하기 위해 반도체 소자 수준에서부터, 마이크로구조, 시스템 수준까지 다양한 연구들이 이루어져 왔다 [2,3].
PCM/DRAM 병행구조의 단점은? 비휘발성 메모리를 메인 메모리로 활용하고자 하는 초기 연구들의 대부분은 쓰기 위주의 데이터는 DRAM에, 읽기 위주의 데이터는 PCM에 저장하는 PCM/DRAM 병행구조를 제시하였다 [4-7]. 이러한 방법은 PCM의 쓰기 횟수를 줄이는 데 많은 도움이 되지만, 이 방법을 구현하기 위해서는 컴파일러, 운영체제 또는 전용하드웨어를 통해 메모리 접근 통계를 유지/관찰해야 할 뿐 아니라, 일부 상황에서는 추가적인 DRAM과 PCM간의 데이터이동으로 인한 성능/내구성 저하의 부담이 뒤따른다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. R. F. Freitas, W. W. Wilcke, "Storage-class memory: the Next Storage System Technology," Journal of Research and Development, Vol. 52, No. 4/5, pp. 439-447, 2008. 

  2. T. Nirschl, J.B. Philipp, T.D. Happ, C.W. Burr, B. Rajendran, M. Lee, E. Joseph, "Write Strategies for 2 and 4-bit Multi-level Phase-change Memory," Proceedings of the IEEE International Electron Device Meeting, pp. 461-464, 2007. 

  3. M.K. Qureshi, M.M. Franceschini, J.P. Karidis, "Morphable Memory System: a Roust Architecture for Exploiting Multi-level Phase Change Memories," Proceedings of International Symposium on Computer Architecture, pp. 154-162, 2010. 

  4. B. Jung, J. Lee, "High Performance PCM&DRAM Hybrid Memory System," in IEMEK Journal of Embedded Systems and Applications, Vol. 11, No. 2, pp. 117-123, 2016 (in Korean), 

  5. G. Dhiman, R. Ayoub, T. Rosing, "PDRAM: a Hybrid PRAM and DRAM Main Memory System," Proceedings of the 46th Annual Design Automation Conference, pp. 464-469, 2009, 

  6. S. Lee, H. Banh, S. Noh, "CLOCK-DWF: A Write-History-Aware Page Replacement Algorithm for Hybrid PCM and DRAM Memory Architectures," IEEE Transactions on Computers, Vol. 63, No. 9, pp. 2187-2200, 2014. 

  7. X. Cai L. Jum M. Zhao, Z. Sun, Z. Jia, "A Novel Page Caching Policy for PCM and DRAM of Hybrid Memory Architecture," 13th International Conference on Embedded Software and Systems (ICESS), pp. 67-73, 2016. 

  8. M. K. Qureshi, M. M. Franceschini, L. A. Lastras-montano, "Improving Read Performance of Phase Change Memories via Write Cancellation and Write Pausing," in International Symposium On High-Performance Computer Architecture, 2010. 

  9. M. K. Qureshi, V. Slinivasan, J. A. Rivers, "Scalable High Performance Main Memory System Using Phase-change Memory Technology," in International Symposium on Computer Architecture, 2009. 

  10. S. Back, H. Lee, C. Nicopoulos, J. Kim, "Designing Hybrid DRAM/PCM Main Memory Systems Utilizing Dual Phase Compression," ACM Transaction on Design Automation or Electronic Systems, Vol. 20, No. 1, 2014 

  11. S. Haoux, G.W. Burr, M.J. Breitwisch, C.T.Rettner, Y.C. CHen, R.M. Shelby, C.H. Lam, “Phase-change Random Access Memory: a Scalable Technology,” IBM Journal of Research and Development, Vol. 52, No. 4/5, pp. 465-479, 2008. 

  12. P.S. Magnsusson, M. Christensson, J. Eskilson, D. Forsgren, G. Hallberg, J. Hogberg, B. Werner, “Simics: a Full System Simulation Platform,” Computer, Vol. 35, No. 2, pp. 50-58, 2002. 

  13. S. Kang W. Cho, B.H. Cho, K.J. Lee, C.S. Lee, H.R. Ohm Y.H. Ro, "A 0.1/ spl mu/m 1.8V 256Mb 66MHz Synchronous Burst PRAM," in International Solid-State Circuits Conference, pp. 487 - 496, 2006. 

  14. A. P. Ferreira, B. Childers, R. Melhem, D. Mossee, M. Yousif, "Using PCM in Next-generation Embedded Space Applications," IEEE Real-Time and Embedded Technology and Applications Symposium, 2010. 

  15. Samsung Electronics, "DDR2 registered SDRAM module, M393T5160QZA," Datasheet 저전력 시스템 

  16. C. Bienia, S.Kumar, J.P. Singh, K. Li, "The PARSEC Benchmark Suite: Characterization and Architecture Implications," Proceedings of the International Conference on Parallel Architectures and Compilation Technique, pp. 50-58, 2002. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로