최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기
이 논문에서는 FPGA에서 OpenCL을 이용하여 LSTM을 최적화하는 방법 두 가지를 제안한다.
첫 번째 방법은 LSTM 신경망의 각 층을 순차로 처리하지만 한 층을 여러CU(compute unit)로 병렬 처리해서 성능을 향상시킨다.
LSTM 각 층을 처리하기위해 입력, 계산, 출력을 담당하는 세 개의 커널을 사용한다.
계산을 담당하는 커널이 대부분의 처리시간을 소모하기 때문에 이 커널에 여러 CU를 할당한다.
두 번째 방법은 LSTM 각 층별로 독립적인 커널을 생성한다.
동일한 계산을 수행하는 커널을 층별로 따로 생성하는 방법은 중복 코드를 사용해서 ...
저자 | 김문수 |
---|---|
학위수여기관 | 아주대학교 IT융합대학원 |
학위구분 | 국내석사 |
학과 | IT융합공학과 |
지도교수 | 구형일 |
발행연도 | 2018 |
총페이지 | 28 p. |
키워드 | LSTM |
언어 | kor |
원문 URL | http://www.riss.kr/link?id=T14723901&outLink=K |
정보원 | 한국교육학술정보원 |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.