본 논문에서는 YOLO 시리즈를 소개하고 공중에서 작은 표적을 탐지하기 위해 YOLOv5 네트워크를 최적화한다. 수정 방법은 첫 번째 Efficient Channel모듈을 적용하여 백본을 변경하고 다양한 Channel ...
본 논문에서는 YOLO 시리즈를 소개하고 공중에서 작은 표적을 탐지하기 위해 YOLOv5 네트워크를 최적화한다. 수정 방법은 첫 번째 Efficient Channel모듈을 적용하여 백본을 변경하고 다양한 Channel Attention Pyramids를 제안한다. Channel Attention Pyramid는 Efficient Channel Attention Pyramid 네트워크, Atrous Efficient Channel Attention 피라미드 네트워크 및 Maxpooling Efficieht Channel Attention 피라미드 네트워크를 제안하고 테스트한다. Channel Attention Pyramid는 Efficient Channel Attention Pyramid Network, Atrous Efficient Channel Attention Pyramid Network 및 Maxpooling Efficient Channel Attention Pyramid를 제안하고 테스트한다. 둘째, 작은 물체의 감지를 최적화하기 위해 큰 물체를 감지하는 모듈을 제거하고 작은 물체를 찾는 감지 계층을 추가하여 작은 물체를 감지하는 데 사용되는 컴퓨팅 파워를 줄이고 검출율을 향상시킨다. 마지막으로 기존의 Nearest Neighbor upsampling 대신 Transposed Convolution을 이용한 Upsampling 방식을 사용한다. 제안한 방법의 결과,VEDAI 데이터셋에서 mAP가 6.9% 향상을 보인다. xView 데이터 셋에서 소형차 클래스는 5.4%의 향상을 보인다. DOTA 데이터 셋에서 소형 차량 및 소형 선박 클래스에 대해 2.7% 향상을 보인다. Arirang 데이터 셋은 소형차의 경우 약 2.4%의 성능 향상을 보인다. 제안하는 기법은 EO 기반의 항공영상에서의 물체 검출 기법이다. EO는 밤, 안개, 구름 속에서 물체를 감지하는 데 어려움이 있습니다. 그러나 적외선 센서, 합성 개구 레이다 센서, LiDAR 센서, 초분광 센서 등 다양한 이종 센서를 함께 사용하면 앞서 언급한 환경에서 강력한 성능을 보일 뿐만 아니라 성능 면에서도 더 나은 성능을 보여줄 것으로 기대된다. ArUco Marker 기반 Area Restriction 모든 이미지 정보에 대해 딥러닝을 수행하여 작업대 영역 외의 장소를 지정하는 문제를 해결하기 위해 Bin Picking은 ArUco 마커를 사용하여 배경을 제거하여 관심 영역만 보이도록 한다. 이를 통해 원하는 영역만 작업대로 설정할 수 있었고, 작업대 영역 밖의 부분을 포인트로 판단하는 것을 방지할 수 있었다. 또한 마커가 4개만 있으면 작업대 등 다양한 곳에 적용할 수 있다. 객체 감지 기반 빈 피킹의 경우 실시간 동작을 위해 1단계 객체 감지기 YOLOv5를 사용하고 감지된 영역에 대해 제안된 영역 제한 기법을 사용한다. 그런 다음 GR-ConvNet을 사용하여 객체의 잡는 지점을 예측한다. 제시된 방법은 실시간 환경을 고려하여 검출기를 기반으로 원하는 물체 검출 및 인식 포인트를 예측한다. 인스턴스 분할 기반 딥 러닝의 경우 실시간 인스턴스 분할 기법인 YOLACT를 사용한다. 이를 바탕으로 가장 왼쪽에 있는 객체를 선택하고 검출 후 결과인 마스크를 기준으로 cv2.minAreaRect를 이용하여 객체의 각도를 도출한다. 바운딩 박스의 중간점(x, y)과 주어진 각도를 로봇팔 좌표계로 변환하여 빈 피킹을 수행할 수 있다.
본 논문에서는 YOLO 시리즈를 소개하고 공중에서 작은 표적을 탐지하기 위해 YOLOv5 네트워크를 최적화한다. 수정 방법은 첫 번째 Efficient Channel 모듈을 적용하여 백본을 변경하고 다양한 Channel Attention Pyramids를 제안한다. Channel Attention Pyramid는 Efficient Channel Attention Pyramid 네트워크, Atrous Efficient Channel Attention 피라미드 네트워크 및 Maxpooling Efficieht Channel Attention 피라미드 네트워크를 제안하고 테스트한다. Channel Attention Pyramid는 Efficient Channel Attention Pyramid Network, Atrous Efficient Channel Attention Pyramid Network 및 Maxpooling Efficient Channel Attention Pyramid를 제안하고 테스트한다. 둘째, 작은 물체의 감지를 최적화하기 위해 큰 물체를 감지하는 모듈을 제거하고 작은 물체를 찾는 감지 계층을 추가하여 작은 물체를 감지하는 데 사용되는 컴퓨팅 파워를 줄이고 검출율을 향상시킨다. 마지막으로 기존의 Nearest Neighbor upsampling 대신 Transposed Convolution을 이용한 Upsampling 방식을 사용한다. 제안한 방법의 결과,VEDAI 데이터셋에서 mAP가 6.9% 향상을 보인다. xView 데이터 셋에서 소형차 클래스는 5.4%의 향상을 보인다. DOTA 데이터 셋에서 소형 차량 및 소형 선박 클래스에 대해 2.7% 향상을 보인다. Arirang 데이터 셋은 소형차의 경우 약 2.4%의 성능 향상을 보인다. 제안하는 기법은 EO 기반의 항공영상에서의 물체 검출 기법이다. EO는 밤, 안개, 구름 속에서 물체를 감지하는 데 어려움이 있습니다. 그러나 적외선 센서, 합성 개구 레이다 센서, LiDAR 센서, 초분광 센서 등 다양한 이종 센서를 함께 사용하면 앞서 언급한 환경에서 강력한 성능을 보일 뿐만 아니라 성능 면에서도 더 나은 성능을 보여줄 것으로 기대된다. ArUco Marker 기반 Area Restriction 모든 이미지 정보에 대해 딥러닝을 수행하여 작업대 영역 외의 장소를 지정하는 문제를 해결하기 위해 Bin Picking은 ArUco 마커를 사용하여 배경을 제거하여 관심 영역만 보이도록 한다. 이를 통해 원하는 영역만 작업대로 설정할 수 있었고, 작업대 영역 밖의 부분을 포인트로 판단하는 것을 방지할 수 있었다. 또한 마커가 4개만 있으면 작업대 등 다양한 곳에 적용할 수 있다. 객체 감지 기반 빈 피킹의 경우 실시간 동작을 위해 1단계 객체 감지기 YOLOv5를 사용하고 감지된 영역에 대해 제안된 영역 제한 기법을 사용한다. 그런 다음 GR-ConvNet을 사용하여 객체의 잡는 지점을 예측한다. 제시된 방법은 실시간 환경을 고려하여 검출기를 기반으로 원하는 물체 검출 및 인식 포인트를 예측한다. 인스턴스 분할 기반 딥 러닝의 경우 실시간 인스턴스 분할 기법인 YOLACT를 사용한다. 이를 바탕으로 가장 왼쪽에 있는 객체를 선택하고 검출 후 결과인 마스크를 기준으로 cv2.minAreaRect를 이용하여 객체의 각도를 도출한다. 바운딩 박스의 중간점(x, y)과 주어진 각도를 로봇팔 좌표계로 변환하여 빈 피킹을 수행할 수 있다.
In this paper, we introduce the YOLO series and optimize the YOLOv5 network for detecting small targets in the air. The modification method is to apply the first Efficient Channel module to change the backbone and propose various Channel Attention Pyramids. Channel Attention Pyramid proposes and tes...
In this paper, we introduce the YOLO series and optimize the YOLOv5 network for detecting small targets in the air. The modification method is to apply the first Efficient Channel module to change the backbone and propose various Channel Attention Pyramids. Channel Attention Pyramid proposes and tests Efficient Channel Attention Pyramid Network, Atrous Efficient Channel Attention Pyramid Network, and Maxpooling Efficieht Channel Attention Pyramid Network. Channel Attention Pyramid proposes and tests Efficient Channel Attention Pyramid Network, Atrous Efficient Channel Attention Pyramid Network, and Maxpooling Efficient Channel Attention Pyramid. Second, to optimize the detection of small objects, we remove the module that detects large objects and add a detection layer that finds small objects, reducing the computing power used to detect small objects and improving the detection rate. Finally, instead of the existing Nearest Neighbor upsampling, an Upsampling method using Transposed Convolution is used. As a result of the proposed method, mAP was 6.9% in the VEDAI dataset, 6.7% in the case of small cars in the xView dataset, 2.7% in the small class class in the DOTA dataset, and about 2.4% in the small car in the Arirang dataset. Indicates an improvement in performance. The proposed technique is an EO-based object detection technique in aerial images. EO has difficulty detecting objects at night, in fog, and in clouds. However, when various heterogeneous sensors such as infrared sensor, synthetic aperture radar sensor, LiDAR sensor and hyperspectral sensor are used together, it is expected to show not only strong performance in the aforementioned environment but also better performance in terms of performance. ArUco Marker-Based Area Restriction In order to solve the problem of designating a place out of the workbench area by deep learning on all image information, bin picking uses ArUco markers to remove the background so that only the area of interest can be seen. Through this, it was possible to set only the desired area as the workbench, and it was possible to prevent judging the part outside the workbench area as a point. Also, if there are only 4 markers, it can be applied on a workbench, etc. In the case of object detection-based bin picking, one-stage object detector YOLOv5 is used for real-time operation and the proposed area limiting technique is used for the detected area. Then, GR-ConvNet is used to predict the grabbing point of the object. The presented method considers the real-time environment and predicts the desired object detection and recognition point based on the detector. In case of instance segmentation-based deep learning, YOLACT, a real-time instance segmentation technique, is used. Based on this, the leftmost object is selected, and the angle of the object is derived using cv2.minAreaRect based on the mask that is the result after detection. By converting the midpoint (x, y) of the bounding box and the given angle into the robot arm coordinate system, it is possible to perform bin picking.
In this paper, we introduce the YOLO series and optimize the YOLOv5 network for detecting small targets in the air. The modification method is to apply the first Efficient Channel module to change the backbone and propose various Channel Attention Pyramids. Channel Attention Pyramid proposes and tests Efficient Channel Attention Pyramid Network, Atrous Efficient Channel Attention Pyramid Network, and Maxpooling Efficieht Channel Attention Pyramid Network. Channel Attention Pyramid proposes and tests Efficient Channel Attention Pyramid Network, Atrous Efficient Channel Attention Pyramid Network, and Maxpooling Efficient Channel Attention Pyramid. Second, to optimize the detection of small objects, we remove the module that detects large objects and add a detection layer that finds small objects, reducing the computing power used to detect small objects and improving the detection rate. Finally, instead of the existing Nearest Neighbor upsampling, an Upsampling method using Transposed Convolution is used. As a result of the proposed method, mAP was 6.9% in the VEDAI dataset, 6.7% in the case of small cars in the xView dataset, 2.7% in the small class class in the DOTA dataset, and about 2.4% in the small car in the Arirang dataset. Indicates an improvement in performance. The proposed technique is an EO-based object detection technique in aerial images. EO has difficulty detecting objects at night, in fog, and in clouds. However, when various heterogeneous sensors such as infrared sensor, synthetic aperture radar sensor, LiDAR sensor and hyperspectral sensor are used together, it is expected to show not only strong performance in the aforementioned environment but also better performance in terms of performance. ArUco Marker-Based Area Restriction In order to solve the problem of designating a place out of the workbench area by deep learning on all image information, bin picking uses ArUco markers to remove the background so that only the area of interest can be seen. Through this, it was possible to set only the desired area as the workbench, and it was possible to prevent judging the part outside the workbench area as a point. Also, if there are only 4 markers, it can be applied on a workbench, etc. In the case of object detection-based bin picking, one-stage object detector YOLOv5 is used for real-time operation and the proposed area limiting technique is used for the detected area. Then, GR-ConvNet is used to predict the grabbing point of the object. The presented method considers the real-time environment and predicts the desired object detection and recognition point based on the detector. In case of instance segmentation-based deep learning, YOLACT, a real-time instance segmentation technique, is used. Based on this, the leftmost object is selected, and the angle of the object is derived using cv2.minAreaRect based on the mask that is the result after detection. By converting the midpoint (x, y) of the bounding box and the given angle into the robot arm coordinate system, it is possible to perform bin picking.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.