$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

합성곱 신경망의 학습 가속화를 위한 방법
A Method for accelerating training of Convolutional Neural Network 원문보기

Journal of the convergence on culture technology : JCCT = 문화기술의 융합, v.3 no.4, 2017년, pp.171 - 175  

최세진 (서경대학교 컴퓨터공학과) ,  정준모 (서경대학교 전자공학과)

초록
AI-Helper 아이콘AI-Helper

최근 CNN(Convolutional Neural Network)의 구조가 복잡해지고 신견망의 깊이가 깊어지고 있다. 이에 따라 신경망의 학습에 요구되는 연산량 및 학습 시간이 증가하게 되었다. 최근 GPGPU 및 FPGA를 이용하여 신경망의 학습 속도를 가속화 하는 방법에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 NVIDIA GPGPU를 제어하는 CUDA를 이용하여 CNN의 특징추출부와 분류부에 대한 연산을 가속화하는 방법을 제시한다. 특징추출부와 분류부에 대한 연산을 GPGPU의 블록 및 스레드로 할당하여 병렬로 처리하였다. 본 논문에서 제안하는 방법과 기존 CPU를 이용하여 CNN을 학습하여 학습 속도를 비교하였다. MNIST 데이터세트에 대하여 총 5 epoch을 학습한 결과 제안하는 방법이 CPU를 이용하여 학습한 방법에 비하여 약 314% 정도 학습 속도가 향상된 것을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

Recently, Training of the convolutional neural network (CNN) entails many iterative computations. Therefore, a method of accelerating the training speed through parallel processing using the hardware specifications of GPGPU is actively researched. In this paper, the operations of the feature extract...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 NVIDIA GPGPU를 제어하는 CUDA를 이용하여 Convolution 및 Pooling layer에 대한 연산을 결합하여 학습 속도를 향상시키는 방법과 Fully connected layer를 병렬로 처리할 수 있는 방법을 제안한다. CUDA(Compute Unified Device Arcthiecture)는 GPGPU에서 수행하는 병렬 처리 알고리즘을 C 언어와 같은 산업 표준 연어를 사용하여 작성할 수 있도록 하는 프레임워크이다.
  • 기존 Convolution layer와 Pooling layer는 각각 분리되어 연산을 수행하며, 일반적으로 Convolution layer의 결과를 이용하여 Pooling 연산을 수행한다. 본 논문에서는 그림 3과 같이 Convolution 연산을 수행한 뒤 Pooling 연산을 수행하는 순차적인 구조를 개선하여 그림 4와같이 Convolution 연산을 수행하는 과정에서 한번에 Pooling 연산을 수행함으로써 데이터를 읽고 쓰는 동작을 감소시켜 학습 성능을 향상시킬 수 있는 방법을 제안하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
CUDA의 기능은 무엇인가? 본 논문에서는 NVIDIA GPGPU를 제어하는 CUDA를 이용하여 Convolution 및 Pooling layer에 대한 연산을 결합하여 학습 속도를 향상시키는 방법과 Fully connected layer를 병렬로 처리할 수 있는 방법을 제안한다. CUDA(Compute Unified Device Arcthiecture)는 GPGPU에서 수행하는 병렬 처리 알고리즘을 C 언어와 같은 산업 표준 연어를 사용하여 작성할 수 있도록 하는 프레임워크이다. 그림 1은 CUDA의 실행 모델이다.
CNN의 레이어는 어떻게 분류되는가? CNN을 이용한 학습은 CNN의 구조가 확장됨에 따라 연산량 및 학습 시간이 비례하여 증가한다는 단점이 있다. CNN은 Convolution layer와 Pooling layer로 구성된 특징추출부와 Fully connected layer로 구성된 분류부로 나뉜다. 특히 특징추출부의 Convolution layer는 전체 학습 시간에서 차지하는 비중이 80~90% 이상이다.
CNN의 구조적 특성이 가져오는 단점을 극복하는 방안은 무엇인가? CNN은 Convolution layer와 Pooling layer로 구성된 특징추출부와 Fully connected layer로 구성된 분류부로 나뉜다. 특히 특징추출부의 Convolution layer는 전체 학습 시간에서 차지하는 비중이 80~90% 이상이다.따라서 특징추출부에 대한 성능을 향상시키는 것을 통하여 학습 속도를 크게 향상 시킬 수 있다. 그림 1은 CNN에서 사용되는 Convolution 연산에 대한 의사 코드이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (11)

  1. G. Eason, B. Nobel, and I.N. Sneddon, "On certain integrals of Lipschitz-Hankel type involving products of Bessel functions", Phil. Trans. Roy. Soc. London, vol. A247, pp. 529-551, April 1955. 

  2. J. Clerk Maxwell, A Treatise on Electricity and Magnetism, 3rd ed., vol. 2. Oxford: Clarendon, 1892, pp.68-73. 

  3. I.S. Jacobs and C.P. Bean, "Fine particles, thin films and exchange anisotropy," in Magnetism, vol. III, G.T. Rado and H. Suhl, Eds. New York: Academic, 1963, pp. 271-350. 

  4. K. Elissa, "Title of paper if known," unpublished 

  5. R. Nicole, "Title of paper with only first word capitalized," J. Name Stand. Abbrev., in press. 

  6. Y. Yorozu, M. Hirano, K. Oka, and Y. Tagawa, "Electron spectroscopy studies on magneto-optical media and plastic substrate interface," IEEE Transl. J. Magn. Japan, vol. 2, pp. 740-741, August 1987 [Digests 9th Annual Conf. Magnetics Japan, p. 301, 1982]. 

  7. M. Young, The Technical Writer's Handbook. Mill Valley, CA: University Science, 1989. 

  8. NVIDIA Corporations, CUDA C Programming GUIDE, January, 2017 

  9. LeCun, Yann, and Yoshua Bengio. "Convolutional networks for images, speech, and time series." The handbook of brain theory and neural networks 3361, no.10 1995 

  10. Nan-Ying Liang, Guang-Bin Huang, "A Fast and Accurate Online Sequential Learning Algorithm for Feedforward Networks," IEEE Transaction on Neural Networks, Vol. 17, Issue 6, pp. 1411-1423, Nov. 2016 

  11. Rongqiang Qian, Zhao Wang, Frans Coenen, "Robust Chinese Traffic Sign Detection and Recognition with Deep Convolutional Neural Network," 2015 11th International Conference on Natural Computation(ICNC), 791-796, 2015. 

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로