[보고서]딥러닝기반 이미지넷 객체 인식 기법 연구

김준모

보고서 정보
주관연구기관	한국과학기술원 Korea Advanced Institute of Science and Technology
연구책임자	김준모
보고서유형	최종보고서
발행국가	대한민국
언어	한국어
발행년월	2017-06
과제시작연도	2016
주관부처	과학기술정보통신부 Ministry of Science and ICT
등록번호	TRKO201800004064
과제고유번호	1711035841
사업명	개인연구지원
DB 구축일자	2018-04-28
키워드	객체인식.이미지넷.딥러닝.딥 네트워크.뉴럴네트워크.컨볼루셔널 딥뉴럴 네트워크.데이터 증강.빅데이터.Object recognition.ImageNet.Deep learning.Deep network.Neural network.convolutional deep neural.data augmentation.big data.
DOI	https://doi.org/10.23000/TRKO201800004064

초록 ▼

연구의 목적 및 내용
본 연구에서는 국내 객체 인식 기술을 세계 최고수준으로 향상하기 위해 딥 네트워크를 다각도로 연구, 개발하는 것을 목표로 한다. 이를 위해 딥 네트워크의 다양한 모델링 및 최적화 기법을 연구한다. 더욱 효율적으로 딥 네트워크의 파라미터 튜닝을 가능하게하고, 입력 데이터를 증강하여 네트워크의 일반화 능력을 강화한다. 또한, 미세 특징을 효과적으로 학습하는 연구를 수행하고, 여러 딥 네트워크 각각의 강점을 부각하여 그것을 융합함으로써 기존의 단일 네트워크의 성능을 뛰어넘도록 한다. 마지막으로 딥네트워크가 가지

연구의 목적 및 내용
본 연구에서는 국내 객체 인식 기술을 세계 최고수준으로 향상하기 위해 딥 네트워크를 다각도로 연구, 개발하는 것을 목표로 한다. 이를 위해 딥 네트워크의 다양한 모델링 및 최적화 기법을 연구한다. 더욱 효율적으로 딥 네트워크의 파라미터 튜닝을 가능하게하고, 입력 데이터를 증강하여 네트워크의 일반화 능력을 강화한다. 또한, 미세 특징을 효과적으로 학습하는 연구를 수행하고, 여러 딥 네트워크 각각의 강점을 부각하여 그것을 융합함으로써 기존의 단일 네트워크의 성능을 뛰어넘도록 한다. 마지막으로 딥네트워크가 가지는 ill-conditioning 문제와 gradient vanishing 문제를 해결하기 위해 효율적인 activation function을 개발한다.

연구결과
본 과제를 통해, 이미지넷 대회에서 현 최고 성능의 딥 네트워크 구현을 위한 하드웨어 플랫폼 및 소프트웨어 환경을 구축하였다. 학습시간을 현저히 줄여 학습에 용이한 실험 환경을 구축하였고, 학습 데이터에만 잘 학습하는 모델이 아닌 일반화 능력이 향상된 모델을 만들어 이미지넷 대회에 제출하였다. 이를 통해 2016년도에는 1위와 근소한 차이의 성능을 내보이며 상위권에 들어가 좋은 성적을 거두었다.
본 과제에서는 이미지 인식을 문제를 풀기 위한 중요한 과제 중 하나인, 데이터 증강을 위한 연구를 진행하였다. 본 과제를 통해 연구된 데이터 증강을 위한 새로운 구조의 multi-task 네트워크를 통해 다양한 각도의 얼굴 이미지들을 원하는 각도의 얼굴 이미지로 생성해 낼 수 있었고, 이를 통해 생성된 이미지를 포즈와 조명에 강인한 특징으로 사용하여 얼굴인식 분야에서 세계 최고 수준을 기록하였다. 이는 원하는 이미지를 생성해내는 새로운 방식의 네트워크로써 CCTV나 다양한 환경의 얼굴인식, 3D모델 생성 등에 유용하게 쓰일 것으로 예상한다.
뿐만 아니라, 다양한 네트워크들의 융합을 통해 더욱 높은 성능을 내는 네트워크 합성기법을 개발하였는데, 기존에 쓰이던 기법인 단순히 네트워크에서 내보내는 확률을 평균 내는 방식보다 월등한 성능을 내보여 표정인식 데이터셋에서 세계기록을 내보였다. 뿐만아니라, 딥 네트워크의 regularization을 위해 새로운 overfitting 억제를 위한 adaptive한 filter learning을 연구 및 개발하였고, 기존의 고정적인 구조 대비 1% 이상의 성능 향상을 이뤄내어 논문을 게재하였다.
위의 결과들을 SCI급 저널 뿐만 아니라, 세계 Top-tier 학회 등에 다수 등록이 되면서 많은 연구자들이 본 프로젝트를 통해 배출된 연구결과를 공유할 수 있도록 하였다.

연구결과의 활용계획
본 연구개발과제에서 개발된 고성능의 딥 네트워크는 딥 러닝을 이용한 어플리케이션 상용화에 한 걸음 더 접근 할 수 있는 계기를 마련하였다. 고성능 다중 클래스 객체인식기술은 국내 외 산업 전반에서 많은 활용이 될 것으로 보이며, 그 예로는 제품의 자동 불량 검사기, 공항과 같은 검색대에서 사용되는 위험물 탐지기, 혹은 다수의 CCTV에서 동일한 사람을 찾아내어 궤적을 추정하는 기술에 사용될 수 있다. 또한 본과제에서 개발된 네트워크 최적화 기술은 사물인터넷 시대에 필수적인 기술이 될 것으로 보인다. 작은 스마트 기기에 딥 네트워크의 공간적 메모리를 최소화시켜 네트워크를 탑재할 수 있도록 하여, 기존에 서버에서만 실행 가능하던 ‘주변 영상을 이용해 현재 위치를 찾아 주는 프로그램’, 그리고 ‘얼굴인식을 통한 보안 프로그램’ 등을 스마트 기기에서도 실행 가능하게 할 수 있다.

(출처 : 한글요약문 4p)

Abstract ▼

Purpose&contents
In this research, it is aimed to study and develop deep networks in various angles to improve the object recognition technology to the world’s highest level. To do this, we proposed various modeling and optimization techniques of deep networks. We aim to enable more efficient tun

Purpose&contents
In this research, it is aimed to study and develop deep networks in various angles to improve the object recognition technology to the world’s highest level. To do this, we proposed various modeling and optimization techniques of deep networks. We aim to enable more efficient tuning of the parameters of the deep networks, and enhance generalization capability of the network by augmenting the input data. In addition, research is conducted to develop fine-grained features, and proposes a novel ensemble technique to overcome the performance of a single network. Finally, we develop an efficient activation function to solve the ill-conditioning problem and the gradient vanishing problem of the deep network.

Result
Through this project, we have established a hardware platform and software environment for the implementation of the current best-performing deep network in ImageNet competition. Training time has significantly reduced, establishing the environment appropriate for training the deep network, and we made a model with improved generalization ability, not a model that is well learned only on the learning data, and submitted it to the ImageNet Competition. As a result, although we achieved a slightly low performance compared to the first place in 2016, we were ranked in the top rankings.
In this project, we have conducted research for data enhancement, which is one of the important tasks to solve the problem of image recognition. Through the multi-task network of new structure for data enhancement studied through this task, face images of various angles can be generated as a face image of a desired angle, and using these generated images as a feature robust to various poses and illuminations, we were able to achieve state of the art performance in face recognition area. It is expected to be useful for CCTV, face recognition of various environments, and 3D model generation as a new network that generates desired images.
In addition, we have developed a network synthesis technique that achieves higher performance through fusion of various networks. It has superior performance than the conventional method of simply averaging the probability output from the network. In addition, we have researched and developed adaptive filter learning for new overfitting suppression for regularization of deep networks, and published the paper by achieving more than 1% performance improvement over existing fixed structure
The above results have been registered not only in SCI-level journals, but also in the world's top-tier academic societies, so that many researchers can share their research results through this project.

Expected Contribution
The high-performance deep networks developed in this research have taken a step closer to commercialization of applications using deep learning. High-performance multi-class object recognition technology is expected to be used in a wide range of industries. For example, it can be used as an automatic defect checker of a product, a dangerous substance detector used at a search station in an airport, and can be used as a technology to find the same person in many CCTVs and estimate their locus. In addition, network minimization, proposed by this project, is expected to become an essential technology in the Internet of Things (IoT). By minimizing the computational memory of the deep network, it is possible to mount the deep networks to the smart devices. Therefore, it is used to find the current position using the peripheral image, and as the security program through the face recognition in the low-memory devices, compared to what has been done on the high-memory server so far.

(출처 : SUMMARY 5p)

목차 Contents

표지 ... 1
목차 ... 2
연구계획 요약문 ... 3
연구결과 요약문 ... 4
한글요약문 ... 4
SUMMARY ... 5
연구내용 및 결과 ... 6
1. 연구개발과제의 개 ... 6
2. 국내외 기술개발 현황 ... 8
3. 연구수행 내용 및 결과 ... 9
4. 목표달성도 및 관련분야에의 기여도 ... 17
5. 연구결과의 활용계획 ... 24
6. 주관연구책임자 대표적 연구실적 ... 25
7. 참고문헌 ... 25
8. 연구성과 ... 27
별첨1 대표적 연구실적 ... 30
별첨2 세부 목표 관련 증빙 ... 42
끝페이지 ... 47

표/그림 (15)

표 딥러닝의 개념도 및 학습종류
표 한국형 딥 네트워크(K1NET)와 이미지넷 대회 및 산업전반에 걸친 영향
표 네트워크 변화에 따른 성능 변화 (1,2,3,4,5 네트워크)
표 네트워크 변화에 따른 성능 그래프의 변화 (1,2,3,5 네트워크)
표 데이터 증강을 통한 얼굴인식 성능 개선 네트워크
표 포즈변화에 따른 얼굴인식 성능 비교 기존 세계 기록 대비 6%, 4% 향상
표 3단계의 Incremental 실험 과정.
표 제안하는 두 네트워크의 합성 방법
표 Oulu-CASIA DB를 이용한 인식률
표 CK+ DB를 이용한 인식률
표 MMI DB를 이용한 인식률
표 saliency detection 딥 러닝 구조
표 saliency detection의 정성적, 정량적 실험결과
표 ResNet unit (a), (b), (c)과 PyramidNet unit(d) 구조 비교
표 ILSVRC2012 validataion set을 통한 성능평가

연구자의 다른 보고서 :

참고문헌 (25)

LOADING...

과제명(ProjectTitle) :	-
연구책임자(Manager) :	-
과제기간(DetailSeriesProject) :	-
총연구비 (DetailSeriesProject) :	-
키워드(keyword) :	-
과제수행기간(LeadAgency) :	-
연구목표(Goal) :	-
연구내용(Abstract) :	-
기대효과(Effect) :	-

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 제목(한글), 저자명(한글), 발행일자, 전자원문, 초록(한글), 초록(영문) 관리번호, 제목(한글), 제목(영문), 저자명(한글), 저자명(영문), 주관연구기관(한글), 주관연구기관(영문), 발행일자, 총페이지수, 주관부처명, 과제시작일, 보고서번호, 과제종료일, 주제분류, 키워드(한글), 전자원문, 키워드(영문), 입수제어번호, 초록(한글), 초록(영문), 목차
저장형식	Text(ASCII format) Excel format
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

딥러닝기반 이미지넷 객체 인식 기법 연구
ImageNet Object Recognition based on Deep Learning 원문보기

초록 ▼

Abstract ▼

목차 Contents

표/그림 (15)

표/그림 (15)

연구자의 다른 보고서 :

참고문헌 (25)

연구과제 타임라인

관련 콘텐츠

원문 보기

이 보고서와 함께 이용한 콘텐츠

연관된 기능

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

딥러닝기반 이미지넷 객체 인식 기법 연구 ImageNet Object Recognition based on Deep Learning 원문보기

초록 ▼

Abstract ▼

목차 Contents

표/그림 (15) 모든 표/그림 보기

표/그림 (15) 슬라이드로 보기

연구자의 다른 보고서 :

김준모 (2)

참고문헌 (25)

연구과제 타임라인

전체(0) 논문(0) 특허(0) 보고서(0)

전체(0) 논문(0) 특허(0) 보고서(0)

관련 콘텐츠

원문 보기

이 보고서와 함께 이용한 콘텐츠

연관된 기능

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

딥러닝기반 이미지넷 객체 인식 기법 연구
ImageNet Object Recognition based on Deep Learning 원문보기

표/그림 (15)

표/그림 (15)