$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

YOLO 네트워크를 활용한 전이학습 기반 객체 탐지 알고리즘
Transfer Learning-based Object Detection Algorithm Using YOLO Network 원문보기

The journal of the institute of internet, broadcasting and communication : JIIBC, v.20 no.1, 2020년, pp.219 - 223  

이동구 (광운대학교 전자융합공학과) ,  선영규 (광운대학교 전자융합공학과) ,  김수현 (광운대학교 전자융합공학과) ,  심이삭 (광운대학교 전자융합공학과) ,  이계산 (경희대학교 전파공학과) ,  송명남 ((주)현대엠아이비인터내셔널) ,  김진영 (광운대학교 전자융합공학과)

초록
AI-Helper 아이콘AI-Helper

딥 러닝 기반 객체 탐지 및 영상처리 분야에서 모델의 인식률과 정확도를 보장하기 위해 다량의 데이터 확보는 필수적이다. 본 논문에서는 학습데이터가 적은 경우에도 인공지능 모델의 높은 성능을 도출하기 위해 전이학습 기반 객체탐지 알고리즘을 제안한다. 본 논문에서는 객체탐지를 위해 사전 학습된 Resnet-50 네트워크와 YOLO(You Only Look Once) 네트워크를 결합한 전이학습 네트워크를 구성하였다. 구성된 전이학습 네트워크는 Leeds Sports Pose 데이터셋의 일부를 활용하여 이미지에서 가장 넓은 영역을 차지하고 있는 사람을 탐지하는 네트워크로 학습을 진행하였다. 실험결과는 탐지율 84%, 탐지 정확도 97%를 기록하였다.

Abstract AI-Helper 아이콘AI-Helper

To guarantee AI model's prominent recognition rate and recognition precision, obtaining the large number of data is essential. In this paper, we propose transfer learning-based object detection algorithm for maintaining outstanding performance even when the volume of training data is small. Also, we...

주제어

표/그림 (3)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • 모든 데이터의 입력 크기는 224x224 픽셀로 재조정하였다. 모든 이미지 데이터에는 1명 이상의 사람이 나타나 있으며, 이미지에 나타난 사람의 수가 2명 이상일 경우 더 가까운 곳에 있거나, 더 많은 넓이를 포함하고 있는 사람을 탐지하도록 학습을 진행하였다.
  • 본 논문에서는 Resnet-50을 기본 네트워크로 설정하고 Resnet-50의 특징 추출 계층에 YOLO 네트워크를 연결하여 전이학습 네트워크를 구성하였다.
  • 인공지능 기반 영상인식 시스템에서 높은 정밀도를 갖는 객체탐지 네트워크를 학습시키기 위해 많은 양의 데이터가 필요하게 된다. 본 논문에서는 [3]에서 제안한 YOLO 네트워크를 활용하여 [3]의 연구에서 사용한 학습데이터의 약 20% 만을 이용하여 높은 정밀도를 나타내는 전이학습 기반 객체탐지 알고리즘을 제안한다.
  • [3]의 연구에서는 미리 학습시킨 심층 컨볼루션 신경망에 계층을 추가하여 YOLO (You Only Look Once) 네트워크를 설계하였다. 이를 통해 객체 탐지 문제에 있어 기존의 회귀 기반 탐지 알고리즘이 아닌 사각형 영역 라벨링을 통해 탐지된 물체의 클래스와 탐지 정밀도를 출력하는 시스템을 구현하였다. [3]의 YOLO 모델은 초당 45프레임의 실시간 이미지 처리도 가능하며, 고정밀객체탐지가 가능하다.
  • 그림을 보면 먼저 source domain에서 데이터를 통해 네트워크를 사전 학습시키게 된다. 이후 전이학습을 적용하기 위해 source domain 네트워크에 추가적으로 계층을 추가하여 transfer learning 네트워크를 구성한다. 이후 target domain 데이터를 활용해 전이학습 네트워크를 학습시켜 새로운 target domain에 대한 출력을 얻게 된다.
  • [4]의 논문에서는 미리 학습된 네트워크를 활용하는 전이학습 기법을 이용하여 Human Epithelial-2 이미지의 특징 및 패턴을 학습하여 분류하는 알고리즘을 제안하였다. 제안한 시스템은 입력 이미지 데이터의 특징을 추출하여 1,000개의 클래스로 분류하는 기능을 수행한다. 제안한 시스템을 통해 최고 정밀도 91.

대상 데이터

  • 이 데이터셋은 12,000 장의 이미지로 구성되어있다. 본 논문에서는 12,000 장의 데이터 중 2,000 장의 데이터를 사용한다. 학습데이터로 1,9000 장의 이미지를 이용하였고, 테스트 데이터로 100 장의 이미지를 사용하여 실험을 진행하였다.
  • 본 논문에서는 Leeds Sports Pose 데이터셋의 스포츠 동작을 취하고 있는 사람의 이미지 데이터를 이용하였다[8]. 이 데이터셋은 12,000 장의 이미지로 구성되어있다.
  • 본 논문에서는 YOLO 네트워크와 Resnet-50을 활용한 전이학습 네트워크를 사용하였다. 먼저 YOLO 네트워크는 24개의 컨볼루션 계층과 2개의 퍼셉트론 계층으로 이루어진 네트워크이며, ImageNet 데이터셋을 사전학습 시킨 네트워크이다[3].
  • 본 연구에서 설정한 실험의 파라미터는 mini-batch사이즈, 학습률, epoch 총 3가지다. 각 파라미터에 대해 간략히 서술하겠다.
  • . 이 데이터셋은 12,000 장의 이미지로 구성되어있다. 본 논문에서는 12,000 장의 데이터 중 2,000 장의 데이터를 사용한다.
  • 본 논문에서는 12,000 장의 데이터 중 2,000 장의 데이터를 사용한다. 학습데이터로 1,9000 장의 이미지를 이용하였고, 테스트 데이터로 100 장의 이미지를 사용하여 실험을 진행하였다.

이론/모형

  • 마지막으로 본 논문에서는 optimizer로써 기본적인 stochastic gradient descent method를 사용하였다[9]. 최적화 기법에 따른 학습률은 0.
  • [5]의 연구에서는 전이학습을 활용한 Gaussian 프로세스 회귀 기반 객체 추적 알고리즘을 제안하였다. 해당 연구에서는 기존의 객체 분류 알고리즘에서 분류 정밀도를 확률값으로 출력하는 형태가 아닌 Gaussian 프로세스 회귀기법을 활용하여 이 확률을 분석하여 성능개선을 이루었다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
전이학습은 어떤 기법인가? 전이학습은 미리 학습된 인공신경망을 활용하여 처음에 학습된 데이터와 유사한 데이터의 특징을 학습하여 사용하는 기법으로, 처음에 이용한 학습데이터 보다 더 적은 수의 데이터로 새로운 데이터의 특징을 학습한다[1,2]. 이러한 특징을 이용하여 다양한 분야에서 활용한 연구들이 뛰어난 성능을 보이고 있다[3]-[5].
미리 학습시킨 심층 컨볼루션 신경망에 계층을 추가한 YOLO 네트워크는 초당 몇 프레임의 실시간 이미지 처리가 가능하나? 이를 통해 객체 탐지 문제에 있어 기존의 회귀 기반 탐지 알고리즘이 아닌 사각형 영역 라벨링을 통해 탐지된 물체의 클래스와 탐지 정밀도를 출력하는 시스템을 구현하였다. [3]의 YOLO 모델은 초당 45프레임의 실시간 이미지 처리도 가능하며, 고정밀객체탐지가 가능하다.
YOLO 네트워크란? 본 논문에서는 YOLO 네트워크와 Resnet-50을 활용한 전이학습 네트워크를 사용하였다. 먼저 YOLO 네트워크는 24개의 컨볼루션 계층과 2개의 퍼셉트론 계층으로 이루어진 네트워크이며, ImageNet 데이터셋을 사전학습 시킨 네트워크이다[3]. YOLO 네트워크는 출력으로써 탐지한 객체에 대해 복수의 사각형 경계값을 추정하게 된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (11)

  1. I. Goodfellow, Deep Learning, MIT Press, 2016. 

  2. C. Tan, F. Sun, T. Kong, W. Zhang, C. Yang and C. Liu, "A survey on deep transfer learning," Proc. The 27th International Conference on Artificial Neural Networks, pp. 270-279, Rhodes, Greece, Oct. 2018. 

  3. J. Redmon, S. Divvala, R. Girshick and A. Farhadi, "You only look once: Unified, real-time object detection," Proc. IEEE International Conference Computer Vision and Pattern Recognition (CVPR), pp. 779-788, Las Vegas, NV, USA, June 2016. DOI: 10.1109/CVPR.2016.91 

  4. H. T. H. Phan, A. Kumar, J. Kim and D. Feng, "Transfer learning of a convolutional neural network for HEP-2 cell image classification," Proc. 2016 IEEE 13th International Symposium on Biomedical Imaging, pp. 1208-1211, Prague, Czech, Apr. 2012. DOI: 10.1109/ISBI.2016.7493483 

  5. J. Gao, H. Ling, W. Hu and J. Xing, "Transfer learning based visual tracking with Gaussian process regression," Proc. of ECCV 2014, pp. 188-203, Zurich, Switzerland, Sept. 2014. DOI: https://doi.org/10.1007/978-3-319-10578-9_13 

  6. J. Yosinski, J. Clune, Y. Bengio and H. Lipson, "How transferable are features in deep neural networks?," Proc. Advances in Neural Information Processing Systems, pp.3320-3328, Montreal, Canada, Dec. 2014. 

  7. K. He, X. Zhang, S. Ren and J. Sun, "Deep residual learning for image recognition," Proc. of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 770-778, Las Vegas, NV, June 2016. DOI: 10.1109/CVPR.2016.90 

  8. S. Johnson and M. Everingham, "Learning effective human pose estimation from inaccurate annotation," in Proc. of IEEE Conference on Computer Vision and Pattern Recognition (CVPR2011), pp. 1465-1472, Providence, RI, USA, June 2011. DOI: 10.1109/CVPR.2011.5995318 

  9. S. Ruder, "An overview of gradient descent optimization algorithms," arXiv:1609.04747, June 2017. 

  10. J. Davis and M. Goadrich, "The relationship between precision-recall and ROC curves," Proc. International Conference Machine Learning, pp. 233-240, Pennsylvania, USA, June 2006. 

  11. J. Y. Kim and P. G. Lee, "Image recognition based on adaptive deep learning," Journal of the Institute of Internet Braodcasting and Communication, vol.18, no.1, pp.113-117, Feb. 2018. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로