$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

임베디드 보드에서의 인공신경망 압축을 이용한 CNN 모델의 가속 및 성능 검증
Acceleration of CNN Model Using Neural Network Compression and its Performance Evaluation on Embedded Boards 원문보기

한국방송∙미디어공학회 2019년도 추계학술대회, 2019 Nov. 29, 2019년, pp.44 - 45  

문현철 (한국항공대학교) ,  이호영 (한국항공대학교) ,  김재곤 (한국항공대학교)

초록
AI-Helper 아이콘AI-Helper

최근 CNN인공신경망은 최근 이미지 분류, 객체 인식, 자연어 처리 등 다양한 분야에서 뛰어난 성능을 보이고 있다. 그러나, 대부분의 분야에서 보다 더 높은 성능을 얻기 위해 사용한 인공신경망 모델들은 파라미터 수 및 연산량 등이 방대하여, 모바일 및 IoT 디바이스 같은 연산량이나 메모리가 제한된 환경에서 추론하기에는 제한적이다. 따라서 연산량 및 모델 파라미터 수를 압축하기 위한 딥러닝 경량화 알고리즘이 연구되고 있다. 본 논문에서는 임베디트 보드에서의 압축된 CNN 모델의 성능을 검증한다. 인공지능 지원 맞춤형 칩인 QCS605 를 내장한 임베디드 보드에서 카메라로 입력한 영상에 대해서 원 CNN 모델과 압축된 CNN 모델의 분류 성능과 동작속도 비교 분석한다. 본 논문의 실험에서는 CNN 모델로 MobileNetV2, VGG16 을 사용했으며, 주어진 모델에서 가지치기(pruning) 기법, 양자화, 행렬 분해 등의 인공신경망 압축 기술을 적용하였을 때 원래의 모델 대비 추론 시간 및 분류의 정확도 성능을 분석하고 인공신경망 압축 기술의 유용성을 확인하였다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  •  본 논문의 실험을 위해 보드 내의 Android OS 환경에서의 Tensorflowlite 프레임워크를 이용하여 영상 분류 실험을 하였다.
  • 또한, 별도의 재학습(re-training)을 적용하지 않았다. 각 시험을 위해 중간 순위(Rank) 값을 조절하면서 압축율을 조정하였고, 해당 실험의 Test 는 약 5 배(Test 1/2)와 10 배(Test 3/4) 압축을 목표로 분해 기법을 적용하였다. ImageNet 데이터의 실험결과는 모든 시험에서 3%미만의 성능 감소를 보였으며, 추론 속도 측면에서는 원본 모델 대비 약 2 배 향상됨을 보여주었다.
  • 본 논문에서는 VGG-16 과 MobileNetV2 의 모델에 가지치기 및 행렬 분해 기법을 적용하여 실제 분류 성능과 보드에서의 추론속도를 비교하였다. 행렬 분해 기법은 파라미터 수를 줄여줄 뿐만 아니라 실제 보드에서의 추론 속도 향상의 효과를 보여주었으며, 실제 분류성능도 1.
  • 가지치기 기법은 기존 신경망 모델에서 가지고 있는 가중치 중에서 비교적 작은 값들에 대한 가중치들을 불필요하다고 간주하여 해당 가중치 값을 0 으로 만드는 기술이다 [1]. 본 논문에서는 각 층에서 목표로 하는 희소도(sparsity)에 맞는 임계 값을 구하고 그 해당 값보다 낮은 값을 갖는 가중치들을 모두 0 으로 한다
  • 대표적인 경량 딥러닝 알고리즘으로는 가중치와 노드의 연결을 끊는 가지치기 기법과 각각의 가중치의 비트 값을 줄이는 양자화 기법, 그리고 한 층에서 가지고 있는 가중치 행렬을 분해하여 가중치 파라미터 수를 줄이는 행렬 분해기법 등이 있다. 본 논문에서는 최근 딥러닝 지원 맞춤형 칩인 QCS605 를 내장한 임베디드 보드에서 카메라로 입력한 영상에 대한 원 CNN 모델과 경량 딥러닝 알고리즘을 적용한 압축모델의 이미지 분류에 대한 추론(inference) 속도 및 분류 성능을 비교하였다
  • 본 논문에서의 실험은 VGG-16 과 MobileNetv2 의 모델과 해당 모델에 경량 딥러닝 알고리즘을 적용한 모델에 대하여 ImageNet 테스트 데이터로 측정하는 분류 성능 (Top-5 정확도)과 실제 보드에서의 카메라로 입력 받는 영상에 대한 모델 추론 속도를 비교하였다
  • 표 3 은 VGG-16 에서의 경량화 알고리즘 중 하나인 행렬 분해기법을 적용한 실험결과를 나타낸 것이다. 본 논문에서의 행렬 분해 기법은 완전연결층에서는 2 개의 행렬로 분해하는 낮은 순위 근사 기법을 적용하였고, 컨볼루션 층에는 N 개의 행렬로 분해하는 CP 분해기법을 적용하였다. 또한, 별도의 재학습(re-training)을 적용하지 않았다.
  • 본 연구에서는 학습된 인공신경망 모델을 QCS605 SoC를 이용한 임베디드 보드에서 포팅하고 성능 검증 실험을 진향하였다. 그림 1 은 해당 QCS 605 칩과 칩을 내장한 임베디드 보드 예시이다.
  •  본 논문의 실험을 위해 보드 내의 Android OS 환경에서의 Tensorflowlite 프레임워크를 이용하여 영상 분류 실험을 하였다. 실험은 보드 내의 카메라에 입력되는 영상을 인공신경망 모델인 tflite 모델로 추론하여 결과창에 상위 3 개의 분류에 대한 확률을 표시하도록 하였다
본문요약 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로