[논문]딥러닝과 병렬컴퓨팅 성능

이홍석

딥러닝과 병렬컴퓨팅 성능 원문보기

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

공유메모리에서 OpenMP를 이용한 병렬화를 적용하였다. 사실 OpenMP의 pragma 지시어는 인텔 제온파이 코프로세서에서도 쉽게 병렬화 루틴을 지원해준다.
실제로 2016년 3월 한국에서 있었던 알파고와 이세돌 9단의 바둑대결은 딥러닝 기반 인공지능 알고리즘이 얼마나 복잡하고 고난이도문제 해결에 영향을 줄 수 있음을 잘 보여주었다[2]. 또한 구글은 알파고 프로젝트 성공에 머물러있지 않고 최근 자사 오프소스 딥러닝 소프트웨어인 텐서플로우(Tensoflow)를[3] 공개하였다.
나타낸 것이다. 선형 주성분분석 PCA 코드를 사용하였고[7], 제온 파이를 이용한 병렬화는 호스트 메모리의 데이터를 제온 파이 메모리로 명시적인 복사 명령어를 사용하는 오프로드 기법을 적용하였다. 딥러닝 알고리즘의 병렬화는 데이터 병렬화 방법으로 했으며, 각 샘플을 독립적인 이벤트로 취급하면 각 프로세스 사이의 데이터 통신은 없이 거의 선형의 병렬성능 확장성을 얻을 수 있는 방법이다.
그 이유는 시그모이드 함수를 사용할 경우 딥러닝에 사용하는 많은 수의 은닉층을 사용할 경우 최적의 비용함수를 계산하는 과정에서 기울기-사라짐 문제가 발생하기 때문이다. 이 문제를 해결하기 위한 방안으로 선형 활성함수인 ReLU, 즉 八h) = max(O, /i)를 사용한다. 이 선형의 ReLU를 사용하면 시그모이드에 비교하여 계산 속도를 향상 시킬 수 있으며 또한 비용함수 최적화 과정에서 발생하는 기울기 사라짐 문제를 개선할 수 있다.
병렬프로그래밍기법은 우선 CPU에 있는 메모리에서 제온 파이 메모리로 데이터를 복사한다. 이후 제온 파이 244개 스레드를 이용하여 병렬화 프로그램인 OpenMP를 사용하여 병렬화를 하였다. 딥러닝 오토인코더 시뮬레이션 결과는 전체 이론성능의 약 50%에 해당하는 1.

대상 데이터

인텔 제온 파이 디바이스에 대하여 자세히 설명하면, 사용된 7120 모델은 61개의 스레드 코어를 가지고 있으며 각각의 코어는 4개 까지 하이퍼스레딩을 할 수 있어서 총 244개의 스레드를 사용할 수 있다. 파이 아키텍처에서 주 메모리와 레지스터 사이의 대역폭은 352 GB/s이다.

이론/모형

본 연구에서는 딥러닝 알고리즘의 병렬성능 향상을 위해서 최신 인텔 제온 파이 코프로세세6] 아키텍처를 사용하였다. 사용한 데이터는 임의의 난수를 발생한 단정도 값을 사용하였다.
사용한 데이터는 임의의 난수를 발생한 단정도 값을 사용하였다. 이번에 성능시험에 사용한 알고리즘은 딥러닝 오픈 코드 중 하나인 오토인코더를 사용하였다. 인텔 제온 파이 디바이스에서 병렬화는 오프로드(Offload), Native, Symmetric 등 3가지 방법이 있지만, 여기서는 오프로드 방법을 사용한다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

딥러닝과 병렬컴퓨팅 성능 원문보기

AI 본문요약
AI-Helper

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

참고문헌 (7)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

딥러닝과 병렬컴퓨팅 성능 원문보기

AI 본문요약 엑셀 다운로드 AI-Helper

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

참고문헌 (7)

이 논문을 인용한 문헌

저자의 다른 논문 :

이홍석 (8)

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

AI 본문요약
AI-Helper