객체 탐지는 무인 항공기 응용분야에 필요한 기반정보를 제공하는 중요 기술 중 하나다. 최근 일반화 성능이 좋은 합성곱 신경망을 이용한 객체 탐 지 모델들이 제안되었고, 이러한 모델들을 이용한 다양한 무인 항공기 영상 내 객체 탐지 방법들이 연구되었다. 하지만 기존의 방법들은 실시간 동작이 불가능하거나 낮은 고도에서만 동작하는 단점이 존재한다. 본 논문에서는 높은 고도에서도 실시간으로 객체를 탐지하는 방법을 제 안한다. 작은 객체를 잘 찾도록 ...
객체 탐지는 무인 항공기 응용분야에 필요한 기반정보를 제공하는 중요 기술 중 하나다. 최근 일반화 성능이 좋은 합성곱 신경망을 이용한 객체 탐 지 모델들이 제안되었고, 이러한 모델들을 이용한 다양한 무인 항공기 영상 내 객체 탐지 방법들이 연구되었다. 하지만 기존의 방법들은 실시간 동작이 불가능하거나 낮은 고도에서만 동작하는 단점이 존재한다. 본 논문에서는 높은 고도에서도 실시간으로 객체를 탐지하는 방법을 제 안한다. 작은 객체를 잘 찾도록 특징 맵의 표현력을 강화하는 Deeper Receptive FieldBlock(DRFB) module을 설계하고, 이를 MobileNet v1 backbone SSD 300에 장착한 합성곱 신경망 기반의 객체 탐지 모델인 DRFBNet 300을 제안한다. 또한 모델의 학습을 위해 bird-view 무인 항공 기 영상에서 객체가 갖는 구도와 각도 왜곡 특성을 포함하는 UAV-cars 데 이터 셋을 제안한다. 마지막으로, 제안하는 객체 탐지 모델의 정확도 향상 을 위해 화면을 좌, 우로 나눠 처리하는 화면 분할 처리(Split Image Processing, SIP) 방법을 제안한다. 제안하는 DRFBNet 300은 MS COCO metric에서 45 FPS의 속도로 21 mAP 점수를 획득했다. 이는 다른 가벼운 1-stage 객체 탐지 방법들 중 가 장 높은 점수다. 또한 UAV-cars 데이터 셋을 이용한 실험에서 DRFBNet 300은 20-50 m 고도 범위에서 가장 높은 AP 점수를 획득했다. SIP 방법이 적용된 모델의 경우, 정확도의 증가 폭은 높은 고도일수록 점점 더 커졌으 며, 50 m 고도에서는 두 배 이상 정확도가 증가되었다. UAV-cars 데이터 셋으로 학습된 DRFBNet 300에 SIP 방법이 적용된 모델은 33 FPS로 동작 하며 실시간 무인 항공기 영상 내 객체 탐지가 가능했다.
객체 탐지는 무인 항공기 응용분야에 필요한 기반정보를 제공하는 중요 기술 중 하나다. 최근 일반화 성능이 좋은 합성곱 신경망을 이용한 객체 탐 지 모델들이 제안되었고, 이러한 모델들을 이용한 다양한 무인 항공기 영상 내 객체 탐지 방법들이 연구되었다. 하지만 기존의 방법들은 실시간 동작이 불가능하거나 낮은 고도에서만 동작하는 단점이 존재한다. 본 논문에서는 높은 고도에서도 실시간으로 객체를 탐지하는 방법을 제 안한다. 작은 객체를 잘 찾도록 특징 맵의 표현력을 강화하는 Deeper Receptive Field Block(DRFB) module을 설계하고, 이를 MobileNet v1 backbone SSD 300에 장착한 합성곱 신경망 기반의 객체 탐지 모델인 DRFBNet 300을 제안한다. 또한 모델의 학습을 위해 bird-view 무인 항공 기 영상에서 객체가 갖는 구도와 각도 왜곡 특성을 포함하는 UAV-cars 데 이터 셋을 제안한다. 마지막으로, 제안하는 객체 탐지 모델의 정확도 향상 을 위해 화면을 좌, 우로 나눠 처리하는 화면 분할 처리(Split Image Processing, SIP) 방법을 제안한다. 제안하는 DRFBNet 300은 MS COCO metric에서 45 FPS의 속도로 21 mAP 점수를 획득했다. 이는 다른 가벼운 1-stage 객체 탐지 방법들 중 가 장 높은 점수다. 또한 UAV-cars 데이터 셋을 이용한 실험에서 DRFBNet 300은 20-50 m 고도 범위에서 가장 높은 AP 점수를 획득했다. SIP 방법이 적용된 모델의 경우, 정확도의 증가 폭은 높은 고도일수록 점점 더 커졌으 며, 50 m 고도에서는 두 배 이상 정확도가 증가되었다. UAV-cars 데이터 셋으로 학습된 DRFBNet 300에 SIP 방법이 적용된 모델은 33 FPS로 동작 하며 실시간 무인 항공기 영상 내 객체 탐지가 가능했다.
Object detection is one of the key technology for providing the background information needed for Unmanned Aerial Vehicle(UAV) applications. Recently, a variety of object detection methods have been proposed that use Convolutional Neural Network(CNN) which has high generalization per...
Object detection is one of the key technology for providing the background information needed for Unmanned Aerial Vehicle(UAV) applications. Recently, a variety of object detection methods have been proposed that use Convolutional Neural Network(CNN) which has high generalization performance. And the methods for detecting objects in UAV imagery using these CNN models. However, the existing methods have a real-time problem or detect objects in low altitudes. In this paper, we propose methods to detect objects in real-time even at high altitudes. We design our method, DRFBNet 300, with a Deeper Receptive Field Block(DRFB) module that enhances the expressiveness of feature maps to detect small objects in the UAV image. We also propose the UAV-cars dataset that includes the angular and composition distortion of vehicles in UAV image to train and test proposed DRFBNet 300. Lastly, we propose Split Image Processing(SIP) method to improve the accuracy of the detector. Proposed DRFBNet 300 achieves 21 mAP score with 45 FPS in the MS COCO metric. This is the highest score among the other 1-stage methods running in real-time. In addition, DRFBNet 300 trained on our UAV-cars dataset obtains the highest AP score in 20-50 m altitudes. The accuracy improvement by applying the SIP method became larger when the altitude increases and more than two times improved at 50m altitude. The SIP method applied DRFBNet 300 trained on the UAV-cars dataset operates at 33 FPS, enabling real-time object detection.
Object detection is one of the key technology for providing the background information needed for Unmanned Aerial Vehicle(UAV) applications. Recently, a variety of object detection methods have been proposed that use Convolutional Neural Network(CNN) which has high generalization performance. And the methods for detecting objects in UAV imagery using these CNN models. However, the existing methods have a real-time problem or detect objects in low altitudes. In this paper, we propose methods to detect objects in real-time even at high altitudes. We design our method, DRFBNet 300, with a Deeper Receptive Field Block(DRFB) module that enhances the expressiveness of feature maps to detect small objects in the UAV image. We also propose the UAV-cars dataset that includes the angular and composition distortion of vehicles in UAV image to train and test proposed DRFBNet 300. Lastly, we propose Split Image Processing(SIP) method to improve the accuracy of the detector. Proposed DRFBNet 300 achieves 21 mAP score with 45 FPS in the MS COCO metric. This is the highest score among the other 1-stage methods running in real-time. In addition, DRFBNet 300 trained on our UAV-cars dataset obtains the highest AP score in 20-50 m altitudes. The accuracy improvement by applying the SIP method became larger when the altitude increases and more than two times improved at 50m altitude. The SIP method applied DRFBNet 300 trained on the UAV-cars dataset operates at 33 FPS, enabling real-time object detection.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.