[논문]임베디드 보드에서의 인공신경망 압축을 이용한 CNN 모델의 가속 및 성능 검증

문현철; 이호영; 김재곤

임베디드 보드에서의 인공신경망 압축을 이용한 CNN 모델의 가속 및 성능 검증
Acceleration of CNN Model Using Neural Network Compression and its Performance Evaluation on Embedded Boards 원문보기

문현철 (한국항공대학교) , 이호영 (한국항공대학교) , 김재곤 (한국항공대학교)

최근 CNN 등 인공신경망은 최근 이미지 분류, 객체 인식, 자연어 처리 등 다양한 분야에서 뛰어난 성능을 보이고 있다. 그러나, 대부분의 분야에서 보다 더 높은 성능을 얻기 위해 사용한 인공신경망 모델들은 파라미터 수 및 연산량 등이 방대하여, 모바일 및 IoT 디바이스 같은 연산량이나 메모리가 제한된 환경에서 추론하기에는 제한적이다. 따라서 연산량 및 모델 파라미터 수를 압축하기 위한 딥러닝 경량화 알고리즘이 연구되고 있다. 본 논문에서는 임베디트 보드에서의 압축된 CNN 모델의 성능을 검증한다. 인공지능 지원 맞춤형 칩인 QCS605 를 내장한 임베디드 보드에서 카메라로 입력한 영상에 대해서 원 CNN 모델과 압축된 CNN 모델의 분류 성능과 동작속도 비교 분석한다. 본 논문의 실험에서는 CNN 모델로 MobileNetV2, VGG16 을 사용했으며, 주어진 모델에서 가지치기(pruning) 기법, 양자화, 행렬 분해 등의 인공신경망 압축 기술을 적용하였을 때 원래의 모델 대비 추론 시간 및 분류의 정확도 성능을 분석하고 인공신경망 압축 기술의 유용성을 확인하였다.

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

본 논문의 실험을 위해 보드 내의 Android OS 환경에서의 Tensorflowlite 프레임워크를 이용하여 영상 분류 실험을 하였다.
또한, 별도의 재학습(re-training)을 적용하지 않았다. 각 시험을 위해 중간 순위(Rank) 값을 조절하면서 압축율을 조정하였고, 해당 실험의 Test 는 약 5 배(Test 1/2)와 10 배(Test 3/4) 압축을 목표로 분해 기법을 적용하였다. ImageNet 데이터의 실험결과는 모든 시험에서 3%미만의 성능 감소를 보였으며, 추론 속도 측면에서는 원본 모델 대비 약 2 배 향상됨을 보여주었다.
본 논문에서는 VGG-16 과 MobileNetV2 의 모델에 가지치기 및 행렬 분해 기법을 적용하여 실제 분류 성능과 보드에서의 추론속도를 비교하였다. 행렬 분해 기법은 파라미터 수를 줄여줄 뿐만 아니라 실제 보드에서의 추론 속도 향상의 효과를 보여주었으며, 실제 분류성능도 1.
가지치기 기법은 기존 신경망 모델에서 가지고 있는 가중치 중에서 비교적 작은 값들에 대한 가중치들을 불필요하다고 간주하여 해당 가중치 값을 0 으로 만드는 기술이다 [1]. 본 논문에서는 각 층에서 목표로 하는 희소도(sparsity)에 맞는 임계 값을 구하고 그 해당 값보다 낮은 값을 갖는 가중치들을 모두 0 으로 한다.
대표적인 경량 딥러닝 알고리즘으로는 가중치와 노드의 연결을 끊는 가지치기 기법과 각각의 가중치의 비트 값을 줄이는 양자화 기법, 그리고 한 층에서 가지고 있는 가중치 행렬을 분해하여 가중치 파라미터 수를 줄이는 행렬 분해기법 등이 있다. 본 논문에서는 최근 딥러닝 지원 맞춤형 칩인 QCS605 를 내장한 임베디드 보드에서 카메라로 입력한 영상에 대한 원 CNN 모델과 경량 딥러닝 알고리즘을 적용한 압축모델의 이미지 분류에 대한 추론(inference) 속도 및 분류 성능을 비교하였다.
본 논문에서의 실험은 VGG-16 과 MobileNetv2 의 모델과 해당 모델에 경량 딥러닝 알고리즘을 적용한 모델에 대하여 ImageNet 테스트 데이터로 측정하는 분류 성능 (Top-5 정확도)과 실제 보드에서의 카메라로 입력 받는 영상에 대한 모델 추론 속도를 비교하였다.
표 3 은 VGG-16 에서의 경량화 알고리즘 중 하나인 행렬 분해기법을 적용한 실험결과를 나타낸 것이다. 본 논문에서의 행렬 분해 기법은 완전연결층에서는 2 개의 행렬로 분해하는 낮은 순위 근사 기법을 적용하였고, 컨볼루션 층에는 N 개의 행렬로 분해하는 CP 분해기법을 적용하였다. 또한, 별도의 재학습(re-training)을 적용하지 않았다.
본 연구에서는 학습된 인공신경망 모델을 QCS605 SoC를 이용한 임베디드 보드에서 포팅하고 성능 검증 실험을 진향하였다. 그림 1 은 해당 QCS 605 칩과 칩을 내장한 임베디드 보드 예시이다.
본 논문의 실험을 위해 보드 내의 Android OS 환경에서의 Tensorflowlite 프레임워크를 이용하여 영상 분류 실험을 하였다. 실험은 보드 내의 카메라에 입력되는 영상을 인공신경망 모델인 tflite 모델로 추론하여 결과창에 상위 3 개의 분류에 대한 확률을 표시하도록 하였다.

성능/효과

각 시험을 위해 중간 순위(Rank) 값을 조절하면서 압축율을 조정하였고, 해당 실험의 Test 는 약 5 배(Test 1/2)와 10 배(Test 3/4) 압축을 목표로 분해 기법을 적용하였다. ImageNet 데이터의 실험결과는 모든 시험에서 3%미만의 성능 감소를 보였으며, 추론 속도 측면에서는 원본 모델 대비 약 2 배 향상됨을 보여주었다.
가지치기 기법에서는 희소도가 높아질수록 그만큼 압축율이 높아지고, 그에 따른 성능 감소가 있다. 해당 실험에서는 모든 시험에서 Top-5 정확도 1~4%의 감소를 보여주었고, 실제 보드에서의 추론 속도는 거의 동일함을 보였다. 추론 속도가 거의 동일한 이유는 해당 인공신경망 모델 포맷의 한계로 가지치기 기법이 단순히 가중치를 0 으로만 만들었기 때문에 실질적인 연산량 감소의 효과를 기대할 수 없었다.
본 논문에서는 VGG-16 과 MobileNetV2 의 모델에 가지치기 및 행렬 분해 기법을 적용하여 실제 분류 성능과 보드에서의 추론속도를 비교하였다. 행렬 분해 기법은 파라미터 수를 줄여줄 뿐만 아니라 실제 보드에서의 추론 속도 향상의 효과를 보여주었으며, 실제 분류성능도 1.5%미만의 Top-5 정확도 감소를 보여주었다. 반면에 가지치기 기법에서는 행렬 분해 기법보다 더 큰 분류 성능 감소와 함께 보드에서의 추론 속도도 거의 동일하였다.

후속연구

추후에 가지치기 기법에 대해서도 실질적인 추론 속도 감소 및 실질적인 모델 크기를 줄일 수 있도록 개선할 예정이다. 또한 더 다양한 모델과 딥러닝 경량 알고리즘을 개선하여 연산환경이 제한된 모바일이나 IoT 기기에서도 인공신경망 모델을 이용한 응용분야에 도움이 될 것을 기대한다.
추후에 가지치기 기법에 대해서도 실질적인 추론 속도 감소 및 실질적인 모델 크기를 줄일 수 있도록 개선할 예정이다. 또한 더 다양한 모델과 딥러닝 경량 알고리즘을 개선하여 연산환경이 제한된 모바일이나 IoT 기기에서도 인공신경망 모델을 이용한 응용분야에 도움이 될 것을 기대한다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

임베디드 보드에서의 인공신경망 압축을 이용한 CNN 모델의 가속 및 성능 검증
Acceleration of CNN Model Using Neural Network Compression and its Performance Evaluation on Embedded Boards 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper

제안 방법

성능/효과

후속연구

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

임베디드 보드에서의 인공신경망 압축을 이용한 CNN 모델의 가속 및 성능 검증 Acceleration of CNN Model Using Neural Network Compression and its Performance Evaluation on Embedded Boards 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

AI 본문요약 엑셀 다운로드 AI-Helper

제안 방법

성능/효과

후속연구

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

임베디드 보드에서의 인공신경망 압축을 이용한 CNN 모델의 가속 및 성능 검증
Acceleration of CNN Model Using Neural Network Compression and its Performance Evaluation on Embedded Boards 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper