$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

중국의 자체 개발 칩을 내장한 “선웨이 타이후 라이트” 슈퍼컴퓨터, 93페타플롭 성능으로 세계 1위

China Debuts 93-Petaflops ‘Sunway’ with Homegrown Processors

2016-07-25

지난 6월 ISC (International Supercomputing Conference)에서 매년 발표하는 세계 슈퍼컴퓨터 순위에 중국이 또 한번 세계 1위자리를 지켰다. 2013년 이후 1위자리를 내준 적이 없는 중국은, 이번에도 100Petaflops 에 가까운 성능의 “쑨웨이 타이후 라이트 (이하 쑨웨이)” 슈퍼컴퓨터가 1위, 그리고 지난 3년간 1위였던 “타이엔-2” 시스템이 2위를 차지하며 슈퍼컴퓨터 초 강국으로 입지를 다졌다. 특히나 이번에 1위를 차지한 쑨웨이 시스템은 중국이 자체 개발, 제작한 CPU를 장착, 중국의 기술력이 이미 미국을 따라잡고 있음을 보여줬다. 원래 중국은 인텔의 Knight Landing CPU 를 사용하려 하였으나, 미국 정부에서 수출금지 품목으로 묶는 바람에 계획을 바꿀 수 밖에 없었다. 그럼에도 불구하고 2년이 채 안되는 짧은 시간 안에 국내 개발진 만으로 칩을 개발, 세계 1위 슈퍼컴퓨터를 만들어낸 상황이라 미국이 바짝 긴장할 수 밖에 없게 됐다.

쑨웨이 시스템은 이론상 최고성능이 125 Petaflops 이며, 실제 테스트에선 93Petaflops 의 성능을 보여 74.5%의 효율을 보이고 있다. 시스템 전체 규모는 총 40,960개의 노드 (총 1억65만개의 코어) 와 1.2PB 의 메모리 (노드 당 7.2TB) 를 가지고 있으며, 평균 15.37MW의 에너지 소비를 한다. 각 노드에는 4개의 CPE (Computing Processing Element) 가 Network on Chip (NoC) 구조로 연결되어 있고, 각 CPE 는 64개의 코어를 가지고 있다 (Intel 의 knight Landing 은 72개). 각 Chip 에는 MPE (Management Processing Element)와 MC (Memory Control) 유닛들이 있으며, 4개의 Chip 들이 NoC로 연결되어 하나의 소켓을 이루고 있다. 이런 구조로 각 노드당 264개의 코어가 연산에 사용된다. 각 노드 당 연산성능 속도는 3.06 Teraflops 이다.

쑨웨이 시스템은 Forttran, C/C++ 컴파일러와 여러 math library 들은 물론, OpenACC 또한 프로그래밍 환경으로 지원된다. 현재 시스템에는 2016년 Goldon Bell Award 후보로 지명되어 있는 3개의 application (기후변화 시뮬레이션, 해표면 모델링, 원자시스템 시뮬레이션 ; earth system modeling, ocean surface wave modeling, atomistic simulation, and phase-field simulation) 이 돌고있으며, 이는 쑨웨이 슈퍼컴퓨터가 단지 1위자리만을 노린 전시성 시스템이 아님을 보여준다 (3년전 타이엔 슈퍼컴이 발표됐을땐 전시성 시스템이란 의혹이 많았다). LINPACK 을 개발한 Jack Dongarra 교수에 의하면 쑨웨이 시스템의 성능이 상당이 앞서 있는것은 사실이나, LINPACK 외 의 다른 성능벤치마크 (예를 들면 HPCG) 에선 여러 약점들도 보이고 있다. 실제로 선웨이 시스템은 HPCG Benchmark 에서 단지 0.371Petaflops 만의 성능을 보여, 0.58 Petaflops 의 타이엔-2, 0.46 Petaflops 의 K-computer 에 크게 뒤진다. 이는 메모리 등에서의 병목현상들 때문으로 보이며, 앞으로 쑨웨이 시스템의 개선점으로 남아있다.

쑨웨이 시스템에 대한 기술적인 정보는 Haohuan Fu, Junfeng Liao, Lanning Wang, Zenya Song 등이 등록한 논문 "The Sunway TaihuLight supercomputer: system and applications (Sciece China. Information Sciences 59:072001:1-16)" 에서 얻을 수 있다.

관련연구자 Haohuan Fu, Junfeng Liao, Lanning Wang, Zenya Song, et al.
관련기관 Tsinghua University, National Supercomputing Center in WuXi, BEijing University, China Science Academy, etc.
과학기술분류 정보/통신
본문키워드(한글) 슈퍼컴퓨터, 쑨웨이 타이후 라이트, 타이엔
본문키워드(영문) Supercomputer, Sunway, Tiehn-2, Top500
원문언어 English
국가 미국
원문출판일 2016-07-01
출처 https://www.hpcwire.com/2016/06/19/china-125-petaflops-sunway/

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로