보고서 정보
주관연구기관 |
한국과학기술원 Korea Advanced Institute of Science and Technology |
연구책임자 |
김준모
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2017-06 |
과제시작연도 |
2016 |
주관부처 |
과학기술정보통신부 Ministry of Science and ICT |
등록번호 |
TRKO201800004064 |
과제고유번호 |
1711035841 |
사업명 |
개인연구지원 |
DB 구축일자 |
2018-04-28
|
키워드 |
객체인식.이미지넷.딥러닝.딥 네트워크.뉴럴네트워크.컨볼루셔널 딥뉴럴 네트워크.데이터 증강.빅데이터.Object recognition.ImageNet.Deep learning.Deep network.Neural network.convolutional deep neural.data augmentation.big data.
|
DOI |
https://doi.org/10.23000/TRKO201800004064 |
초록
▼
연구의 목적 및 내용
본 연구에서는 국내 객체 인식 기술을 세계 최고수준으로 향상하기 위해 딥 네트워크를 다각도로 연구, 개발하는 것을 목표로 한다. 이를 위해 딥 네트워크의 다양한 모델링 및 최적화 기법을 연구한다. 더욱 효율적으로 딥 네트워크의 파라미터 튜닝을 가능하게하고, 입력 데이터를 증강하여 네트워크의 일반화 능력을 강화한다. 또한, 미세 특징을 효과적으로 학습하는 연구를 수행하고, 여러 딥 네트워크 각각의 강점을 부각하여 그것을 융합함으로써 기존의 단일 네트워크의 성능을 뛰어넘도록 한다. 마지막으로 딥네트워크가 가지
연구의 목적 및 내용
본 연구에서는 국내 객체 인식 기술을 세계 최고수준으로 향상하기 위해 딥 네트워크를 다각도로 연구, 개발하는 것을 목표로 한다. 이를 위해 딥 네트워크의 다양한 모델링 및 최적화 기법을 연구한다. 더욱 효율적으로 딥 네트워크의 파라미터 튜닝을 가능하게하고, 입력 데이터를 증강하여 네트워크의 일반화 능력을 강화한다. 또한, 미세 특징을 효과적으로 학습하는 연구를 수행하고, 여러 딥 네트워크 각각의 강점을 부각하여 그것을 융합함으로써 기존의 단일 네트워크의 성능을 뛰어넘도록 한다. 마지막으로 딥네트워크가 가지는 ill-conditioning 문제와 gradient vanishing 문제를 해결하기 위해 효율적인 activation function을 개발한다.
연구결과
본 과제를 통해, 이미지넷 대회에서 현 최고 성능의 딥 네트워크 구현을 위한 하드웨어 플랫폼 및 소프트웨어 환경을 구축하였다. 학습시간을 현저히 줄여 학습에 용이한 실험 환경을 구축하였고, 학습 데이터에만 잘 학습하는 모델이 아닌 일반화 능력이 향상된 모델을 만들어 이미지넷 대회에 제출하였다. 이를 통해 2016년도에는 1위와 근소한 차이의 성능을 내보이며 상위권에 들어가 좋은 성적을 거두었다.
본 과제에서는 이미지 인식을 문제를 풀기 위한 중요한 과제 중 하나인, 데이터 증강을 위한 연구를 진행하였다. 본 과제를 통해 연구된 데이터 증강을 위한 새로운 구조의 multi-task 네트워크를 통해 다양한 각도의 얼굴 이미지들을 원하는 각도의 얼굴 이미지로 생성해 낼 수 있었고, 이를 통해 생성된 이미지를 포즈와 조명에 강인한 특징으로 사용하여 얼굴인식 분야에서 세계 최고 수준을 기록하였다. 이는 원하는 이미지를 생성해내는 새로운 방식의 네트워크로써 CCTV나 다양한 환경의 얼굴인식, 3D모델 생성 등에 유용하게 쓰일 것으로 예상한다.
뿐만 아니라, 다양한 네트워크들의 융합을 통해 더욱 높은 성능을 내는 네트워크 합성기법을 개발하였는데, 기존에 쓰이던 기법인 단순히 네트워크에서 내보내는 확률을 평균 내는 방식보다 월등한 성능을 내보여 표정인식 데이터셋에서 세계기록을 내보였다. 뿐만아니라, 딥 네트워크의 regularization을 위해 새로운 overfitting 억제를 위한 adaptive한 filter learning을 연구 및 개발하였고, 기존의 고정적인 구조 대비 1% 이상의 성능 향상을 이뤄내어 논문을 게재하였다.
위의 결과들을 SCI급 저널 뿐만 아니라, 세계 Top-tier 학회 등에 다수 등록이 되면서 많은 연구자들이 본 프로젝트를 통해 배출된 연구결과를 공유할 수 있도록 하였다.
연구결과의 활용계획
본 연구개발과제에서 개발된 고성능의 딥 네트워크는 딥 러닝을 이용한 어플리케이션 상용화에 한 걸음 더 접근 할 수 있는 계기를 마련하였다. 고성능 다중 클래스 객체인식기술은 국내 외 산업 전반에서 많은 활용이 될 것으로 보이며, 그 예로는 제품의 자동 불량 검사기, 공항과 같은 검색대에서 사용되는 위험물 탐지기, 혹은 다수의 CCTV에서 동일한 사람을 찾아내어 궤적을 추정하는 기술에 사용될 수 있다. 또한 본과제에서 개발된 네트워크 최적화 기술은 사물인터넷 시대에 필수적인 기술이 될 것으로 보인다. 작은 스마트 기기에 딥 네트워크의 공간적 메모리를 최소화시켜 네트워크를 탑재할 수 있도록 하여, 기존에 서버에서만 실행 가능하던 ‘주변 영상을 이용해 현재 위치를 찾아 주는 프로그램’, 그리고 ‘얼굴인식을 통한 보안 프로그램’ 등을 스마트 기기에서도 실행 가능하게 할 수 있다.
(출처 : 한글요약문 4p)
Abstract
▼
Purpose&contents
In this research, it is aimed to study and develop deep networks in various angles to improve the object recognition technology to the world’s highest level. To do this, we proposed various modeling and optimization techniques of deep networks. We aim to enable more efficient tun
Purpose&contents
In this research, it is aimed to study and develop deep networks in various angles to improve the object recognition technology to the world’s highest level. To do this, we proposed various modeling and optimization techniques of deep networks. We aim to enable more efficient tuning of the parameters of the deep networks, and enhance generalization capability of the network by augmenting the input data. In addition, research is conducted to develop fine-grained features, and proposes a novel ensemble technique to overcome the performance of a single network. Finally, we develop an efficient activation function to solve the ill-conditioning problem and the gradient vanishing problem of the deep network.
Result
Through this project, we have established a hardware platform and software environment for the implementation of the current best-performing deep network in ImageNet competition. Training time has significantly reduced, establishing the environment appropriate for training the deep network, and we made a model with improved generalization ability, not a model that is well learned only on the learning data, and submitted it to the ImageNet Competition. As a result, although we achieved a slightly low performance compared to the first place in 2016, we were ranked in the top rankings.
In this project, we have conducted research for data enhancement, which is one of the important tasks to solve the problem of image recognition. Through the multi-task network of new structure for data enhancement studied through this task, face images of various angles can be generated as a face image of a desired angle, and using these generated images as a feature robust to various poses and illuminations, we were able to achieve state of the art performance in face recognition area. It is expected to be useful for CCTV, face recognition of various environments, and 3D model generation as a new network that generates desired images.
In addition, we have developed a network synthesis technique that achieves higher performance through fusion of various networks. It has superior performance than the conventional method of simply averaging the probability output from the network. In addition, we have researched and developed adaptive filter learning for new overfitting suppression for regularization of deep networks, and published the paper by achieving more than 1% performance improvement over existing fixed structure
The above results have been registered not only in SCI-level journals, but also in the world's top-tier academic societies, so that many researchers can share their research results through this project.
Expected Contribution
The high-performance deep networks developed in this research have taken a step closer to commercialization of applications using deep learning. High-performance multi-class object recognition technology is expected to be used in a wide range of industries. For example, it can be used as an automatic defect checker of a product, a dangerous substance detector used at a search station in an airport, and can be used as a technology to find the same person in many CCTVs and estimate their locus. In addition, network minimization, proposed by this project, is expected to become an essential technology in the Internet of Things (IoT). By minimizing the computational memory of the deep network, it is possible to mount the deep networks to the smart devices. Therefore, it is used to find the current position using the peripheral image, and as the security program through the face recognition in the low-memory devices, compared to what has been done on the high-memory server so far.
(출처 : SUMMARY 5p)
목차 Contents
- 표지 ... 1
- 목차 ... 2
- 연구계획 요약문 ... 3
- 연구결과 요약문 ... 4
- 한글요약문 ... 4
- SUMMARY ... 5
- 연구내용 및 결과 ... 6
- 1. 연구개발과제의 개 ... 6
- 2. 국내외 기술개발 현황 ... 8
- 3. 연구수행 내용 및 결과 ... 9
- 4. 목표달성도 및 관련분야에의 기여도 ... 17
- 5. 연구결과의 활용계획 ... 24
- 6. 주관연구책임자 대표적 연구실적 ... 25
- 7. 참고문헌 ... 25
- 8. 연구성과 ... 27
- 별첨1 대표적 연구실적 ... 30
- 별첨2 세부 목표 관련 증빙 ... 42
- 끝페이지 ... 47
※ AI-Helper는 부적절한 답변을 할 수 있습니다.