최근 컴퓨터 비전을 활용한 사물인식 기술이 센서 기반 사물인식 기술을 대체할 기술로 주목을 받고 있다. 센서 기반 사물인식 기술은 일반적으로 고가의 센서를 필요로 하기 때문에 기술이 상용화되기 어렵다는 문제가 있었다. 반면 컴퓨터 비전을 활용한 사물인식 기술은 고가의 센서 대신 비교적 저렴한 카메라를 사용할 수 있다. 동시에 CNN이 발전하면서 실시간 사물인식이 가능해진 이후 IoT,자율주행자동차 등 타 분야에 활발하게 도입되고 있다. 그러나 사물 인식 모델을 상황에 알맞게 선택하고 학습시키기 위해서는 딥러닝에 대한 전문적인 지식을 요구하기 때문에 비전문가가 사물 인식 모델을 사용하기에는 어려움이 따른다. 따라서 본 논문에서는 딥러닝 기반 사물인식 모델들의 구조와 성능을 분석하고, 사용자가 원하는 조건의 최적의 딥러닝 기반 사물 인식 모델을 스스로 선정할 수 있는 플랫폼을 제안한다. 또한 통계에 기반한 사물 인식 모델 선정이 필요한 이유를 실험을 통해 증명한다.
최근 컴퓨터 비전을 활용한 사물인식 기술이 센서 기반 사물인식 기술을 대체할 기술로 주목을 받고 있다. 센서 기반 사물인식 기술은 일반적으로 고가의 센서를 필요로 하기 때문에 기술이 상용화되기 어렵다는 문제가 있었다. 반면 컴퓨터 비전을 활용한 사물인식 기술은 고가의 센서 대신 비교적 저렴한 카메라를 사용할 수 있다. 동시에 CNN이 발전하면서 실시간 사물인식이 가능해진 이후 IoT, 자율주행자동차 등 타 분야에 활발하게 도입되고 있다. 그러나 사물 인식 모델을 상황에 알맞게 선택하고 학습시키기 위해서는 딥러닝에 대한 전문적인 지식을 요구하기 때문에 비전문가가 사물 인식 모델을 사용하기에는 어려움이 따른다. 따라서 본 논문에서는 딥러닝 기반 사물인식 모델들의 구조와 성능을 분석하고, 사용자가 원하는 조건의 최적의 딥러닝 기반 사물 인식 모델을 스스로 선정할 수 있는 플랫폼을 제안한다. 또한 통계에 기반한 사물 인식 모델 선정이 필요한 이유를 실험을 통해 증명한다.
Recently, object recognition technology using computer vision has attracted attention as a technology to replace sensor-based object recognition technology. It is often difficult to commercialize sensor-based object recognition technology because such approach requires an expensive sensor. On the ot...
Recently, object recognition technology using computer vision has attracted attention as a technology to replace sensor-based object recognition technology. It is often difficult to commercialize sensor-based object recognition technology because such approach requires an expensive sensor. On the other hand, object recognition technology using computer vision may replace sensors with inexpensive cameras. Moreover, Real-time recognition is viable due to the growth of CNN, which is actively introduced into other fields such as IoT and autonomous vehicles. Because object recognition model applications demand expert knowledge on deep learning to select and learn the model, such method, however, is challenging for non-experts to use it. Therefore, in this paper, we analyze the structure of deep - learning - based object recognition models, and propose a platform that can automatically select a deep - running object recognition model based on a user 's desired condition. We also present the reason we need to select statistics-based object recognition model through conducted experiments on different models.
Recently, object recognition technology using computer vision has attracted attention as a technology to replace sensor-based object recognition technology. It is often difficult to commercialize sensor-based object recognition technology because such approach requires an expensive sensor. On the other hand, object recognition technology using computer vision may replace sensors with inexpensive cameras. Moreover, Real-time recognition is viable due to the growth of CNN, which is actively introduced into other fields such as IoT and autonomous vehicles. Because object recognition model applications demand expert knowledge on deep learning to select and learn the model, such method, however, is challenging for non-experts to use it. Therefore, in this paper, we analyze the structure of deep - learning - based object recognition models, and propose a platform that can automatically select a deep - running object recognition model based on a user 's desired condition. We also present the reason we need to select statistics-based object recognition model through conducted experiments on different models.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 논문에서는 딥러닝 기반 사물인식 플랫폼 설계를 위해 최근 좋은 성능을 보이는 YOLO 모델들의 구조를 분석하고 자동 모델 선택을 지원하는 플랫폼을 제안한다.
본 절에서는 실험을 통해 사물인식 모델들의 성능을 비교하고 모델 자동 선정의 필요성을 확인한다. 상세 실험 환경은 표 5와 같고, 데이터셋으로는 COCO2014 데이터셋과 VOC2007++2012 데이터셋을 활용한다.
제안 방법
본 장에서는 학습 과정 및 결과가 타당함을 보이고자 학습결과가 공개되어 있는 YOLO모델과 COCO2014 데이터셋을 사용하였다. 본 구현에서는 추후 두 개 이상의 마스터노드를 동시에 실행하기 위하여 각 마스터노드를 세션으로 구분한다. 마스터노드를 실행하면 DB에서 세션 넘버를 할당받은 후 DB에 세션의 IP정보를 등록한다.
본 논문에서 제안하는 플랫폼은 딥러닝 기반 사물인식 모델들을 미리 포함하고 있으며, 사용자가 데이터셋 학습을 요청할 경우 각 모델들의 하이퍼 파라미터별, 데이터셋별 실험결과를 기반으로 최적의 모델을 스스로 판단 및 선택하여 학습을 진행한다.
본 논문은 사물인식 모델들에 대한 분석 및 실험을 통해 사용자가 원하는 성능의 기준에 따라 적절한 모델을 사용해야 함을 밝혔고, 이를 바탕으로 딥러닝 기반 사물인식 모델을 훈련 및 수행하는 과정 일부를 자동화한 플랫폼을 제안하였다. 사물인식 모델들을 실행하기 위해서는 직접 최적의 모델을 선택하고 하이퍼 파라미터를 설정해야 하지만, 본 논문에서 제안하는 플랫폼은 통계를 바탕으로 각 상황에 적합한 최적의 모델과 하이퍼 파라미터를 플랫폼에서 자동으로 선정한다.
본 논문은 사물인식 모델들에 대한 분석 및 실험을 통해 사용자가 원하는 성능의 기준에 따라 적절한 모델을 사용해야 함을 밝혔고, 이를 바탕으로 딥러닝 기반 사물인식 모델을 훈련 및 수행하는 과정 일부를 자동화한 플랫폼을 제안하였다. 사물인식 모델들을 실행하기 위해서는 직접 최적의 모델을 선택하고 하이퍼 파라미터를 설정해야 하지만, 본 논문에서 제안하는 플랫폼은 통계를 바탕으로 각 상황에 적합한 최적의 모델과 하이퍼 파라미터를 플랫폼에서 자동으로 선정한다.
제안하는 플랫폼의 구현은 YOLO 모델에 대한 학습을 지원할 수 있도록 진행되었다. 본 장에서는 본 플랫폼에서 데이터를 학습하는 과정을 통해 구현 결과를 확인한다.
대상 데이터
본 논문에서 제안하는 모델 자율 선정 플랫폼은 마스터노드와 슬레이브노드로 구성된다. 마스터노드는 데이터관리기, 노드관리기, 통신관리기로 이루어지며 모델을 선정하고 슬레이브노드들에게 동작을 지시할 수 있다.
본 논문에서 제안하는 플랫폼은 크게 마스터노드, 슬레이브노드 그리고 DB로 구성된다. DB는 플랫폼의 공유저장소로 활용된다.
본 장에서는 학습 과정 및 결과가 타당함을 보이고자 학습결과가 공개되어 있는 YOLO모델과 COCO2014 데이터셋을 사용하였다. 본 구현에서는 추후 두 개 이상의 마스터노드를 동시에 실행하기 위하여 각 마스터노드를 세션으로 구분한다.
본 절에서는 실험을 통해 사물인식 모델들의 성능을 비교하고 모델 자동 선정의 필요성을 확인한다. 상세 실험 환경은 표 5와 같고, 데이터셋으로는 COCO2014 데이터셋과 VOC2007++2012 데이터셋을 활용한다.
모델을 학습시키기 위해서는 데이터셋의 준비가 필요하다. 실제로 학습을 진행하기 위해서는 방대한 양의 데이터와 데이터 라벨링 작업이 필요하므로 본 절에서는 이러한 데이터가 미리 준비된 VOC 데이터셋을 사용한다. 모델 학습을 위해 준비해야 할 파일의 목록은 [표 7]과 같다.
데이터처리
일반적으로는 물체가 실제로 존재하는 바운딩박스(Ground Truth)와 모델에서 예측한 바운딩박스간 IoU(0~1 사이의 값)을 측정하여 일정 값 이상인 경우 정확하게 측정한 것으로 판단한다. 본 실험에서는 IoU값 0.5를 기준으로 YOLO 모델들의 성능을 비교한다. 또한 YOLO 모델에서 지원하는 trade-off의 성능을 확인하기 위해 해상도는 32의 홀수 배수로 설정하였다.
이론/모형
본 절에서는 Regression-based Approaches에 해당하는 YOLO 모델[7]을 분석한다. YOLO는 Object Proposal-based Approaches 모델인 Faster R-CNN[7]의 동작속도 개선을 위해 Region Proposal Network와 Classifier를 하나의 네트워크로 구성한 모델로, 현재 실시간 사물인식 모델 중 가장 대표적인 모델이다.
성능/효과
YOLOv2는 정확도 향상을 위해 FC를 제거한 것 이외에도 두 개의 출력값에 대해 사물의 위치 추론 및 분류를 진행하거나 Batch Norm을 적용하는 등 다양한 개선을 하였으며, 독자적으로 개발한 19개의 레이어로 구성된 DarkNet-19을 백본 네트워크로 활용한다. 그 결과 YOLOv1보다 정확도와 동작속도 모두 더 좋은 결과를 보이게 된다. 가장 최근의 YOLO 버전인 YOLOv3[5]의 경우, 53개의 레이어를 사용하고 3개의 출력값에 대한 추론 및 분류로 YOLOv2와 비교하여 동작속도는 느리지만 더욱 정확한 결과를 보인다.
또한, YOLO 모델을 소형화한 Tiny YOLO의 경우 Tiny YOLOv3보다 Tiny YOLOv2가 모든 결과에서 높은 정확도를 보이는 것을 확인할 수 있다. 따라서 이전의 사물 인식 모델의 개선점이 이후의 다른 사물인식 모델에 적용되지 않을 수 있다는 것을 알 수 있다.
YOLO모델은 해상도와 동작속도간 trade-off를 지원하지만 뚜렷한 한계점을 가지고 있다. 본 실험 환경에서 동작속도를 30FPS 이상 기대할 때에는 YOLOv2(608)모델이 48.10%, YOLOv3(416)모델이 54.32%의 정확도를 보이므로 YOLOv3의 정확도가 더 높지만, 동작속도가 70FPS 이상일 때에는 YOLOv2(416)모델이 44.45%, YOLOv3(160)모델이 39.57%로 YOLOv2가 더 높은 정확도를 보인다. 이런 현상은 YOLOv2와 Tiny YOLO모델에도 그대로 나타나며, 145FPS 이상의 동작속도를 얻기 위해서는 trade-off를 적용하여 YOLOv2모델을 동작시키는 것보다 Tiny YOLOv2를 동작시키는 것이 더 좋은 결과를 보여준다.
후속연구
그러나 모델을 학습시키기 위해서는 딥러닝에 대한 전문지식이 요구되기 때문에, 아직 본 플랫폼이 완벽하게 자동화된 학습을 지원한다고 보기 어렵다. 더욱 자동화된 플랫폼을 개발하기 위해서는 모델 학습에 필요한 파라미터를 설정하기 위한 연구를 진행해야 할 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
데이터 관리기란?
데이터 관리기는 학습 모델과 모델 학습을 위한 데이터, 그리고 학습 종료 후의 가중치를 관리하기 위한 모듈이다. 본 플랫폼에서는 같은 모델이지만 하이퍼 파라미터가 다른 경우 서로 다른 모델로 취급한다.
본 논문에서 제안하는 모델 자율 선정 플랫폼에서 슬레이브노드는 어떤 노드인가?
마스터노드는 데이터관리기, 노드관리기, 통신관리기로 이루어지며 모델을 선정하고 슬레이브노드들에게 동작을 지시할 수 있다. 슬레이브노드는 작업관리기, 통신관리기로 이루어지며 실제로 사물인식 모델을 실행시키는 노드이다.
작업관리기의 역할은 무엇인가?
작업관리기는 슬레이브노드에서 실제로 모델 학습이 수행되는 모듈로, 마스터노드로부터 실행 명령어를 전달받아 실행한 후 마스터노드가 요청하는 경우 표준출력으로 실행 결과를 전달한다. 전달된 값은 진행상황에 대한 정보로써 마스터노드가 확인할 수 있다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.