최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기정보처리학회지 = Korea information processing society review, v.25 no.1, 2018년, pp.78 - 88
노승우 (한국과학기술정보연구원) , 최지은 (한국과학기술정보연구원) , 남덕윤 (한국과학기술정보연구원) , 박근철 (한국과학기술정보연구원) , 박찬열 (한국과학기술정보연구원)
초록이 없습니다.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
All2All 모드의 지연이 가장 큰 이유는 무엇인가? | All2All 모드는 타일, TD, 메모리 채널 사이에 의존성이 없어, 메모리 주소가 칩의 모든 TD에 균일하게 분산되기 때문에 가장 지연이 크다. Quadrant/hemisphere 모드는 가상의 4개 또는 2개 부분으로 나뉘어지고, 메모리 주소가 같은 부분의 TD로 해시된다. | |
제온파이 프로세서의 성능 모니터링은 무엇을 사용하여 정보를 얻는가? | 제온파이 프로세서의 성능 모니터링은 하드웨어 퍼포먼스 유닛(Hardware Performance Units)을 사용하여 많은 정보를 얻을 수 있다. 하드웨어 퍼포먼스 카운터(Hardware Performance Counter)는 하드웨어 관련 이벤트를 수집하는 레지스터로 프로세서의 성능 모니터링 시 사용된다. | |
cache 모드의 단점은 무엇인가? | cache 모드는 MCDRAM을 L3 캐시로 사용할 수 있어, 응용프로그램의 수정이 필요 없다. 단점은 캐시 미스가 발생했을 때 데이터가 크면 클수록 지연이 커진다. hybrid 모드는 cache 모드와 flat 모드를 혼합하여 사용한다. |
http://www.prace-ri.eu/best-practice-guide-knightslanding-january-2017/
A. Sodani, "Knights landing (KNL): 2nd Generation Intel(R) Xeon Phi processor." Hot Chips 27 Symposium (HCS) IEEE 2015, 2015.
최지은, 박근철, 남덕윤, "차세대 매니코어 프로세서 기반 성능 모니터링 이벤트를 활용한 응용 특성 분석 기법", 2017년 한국소프트웨어종합학술대회 논문집, 2017년 12월.
Harini R. "Intel(R) Xeon(R) Phi(TM) Processor Performance Monitoring Reference Manual" published on November 2, 2015, updated March, 2017.
Arnaldo Carvalho de Melo, "The New Linux 'Perf' tools", presentation from Linux Kongress, September, 2010.
PAPI, http://icl.cs.utk.edu/papi/
VTune, https://software.intel.com/en-us/intel-vtuneamplifier-xe
HPC Tools, https://developer.arm.com/products/software-development-tools/hpc/arm-performance-reports
S. Shende and A. D. Malony., "The TAU Parallel Performance System", International Journal of High Performance Computing Applications, Volume 20 Number 2, pp 287-311, 2006.
ARM Performance Reports, https://www.arm.com/products/development-tools/hpc-tools/cross-platform/performance-reports
McCalpin, John D.: "STREAM: Sustainable Memory Bandwidth in High Performance Computers", a continually updated technical report (1991-2007), available at: "http://www.cs.virginia.edu/stream/"
McCalpin, John D., 1995: "Memory Bandwidth and Machine Balance in Current High Performance Computers", IEEE Computer Society Technical Committee on Computer Architecture (TCCA) Newsletter, December 1995.
https://software.intel.com/en-us/articles/optimizing-memory-bandwidth-in-knights-landing-on-stream-triad
J. J. Dongarra, P. Luszczek, and A. Petitet "The LINPACK Benchmark: Past, Present, and Future." Concurrency and Computation: Practice and Experience vol. 15, no. 9, pp. 803-820, August, 2003.
A. Petitet, R. C. Whaley, J. Dongarra, A. Cleary "HPL-A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers", 2016. http://www.netlib.org/benchmark/hpl/
https://software.intel.com/en-us/node/725943
https://colfaxresearch.com/hpl-on-xeon-phi-x200/
Hemsoth, Nicole (June 26, 2014). "New HPC Benchmark Delivers Promising Results". HPCWire. Retrieved 2014-09-08.
Dongarra, Jack; Heroux, Michael (June 2013). "Toward a New Metric for Ranking High Performance Computing Systems" (PDF). Sandia National Laboratory. Retrieved 2016-07-04.
https://software.intel.com/en-us/mkl-linux-developer-guide-getting-started-with-intel-optimized-hpcg
http://en.community.dell.com/techcenter/high-performance-computing/b/general_hpc/archive/2017/01/17/hpcg-performance-study-with-intel-knl
※ AI-Helper는 부적절한 답변을 할 수 있습니다.