[논문]딥러닝을 위한 영역기반 합성곱 신경망에 의한 항공영상에서 건물탐지 평가

이대건; 조은지; 이동천

doi:10.7848/ksgpc.2018.36.6.469

초록
AI-Helper

딥러닝은 인간의 학습 및 인지능력을 닮은 인공지능을 실현하기 위해 여러 분야에서 활용하고 있으며, 높은 사양의 컴퓨팅 파워가 요구되고 연산 시간이 많이 소요되는 복잡한 구조의 인공신경망에 의한 딥러닝은 컴퓨터 사양이 향상됨에 따라 성능이 개선된 다양한 딥러닝 모델이 개발되고 있다. 본 논문의 주요 목적은 영상의 딥러닝을 위한 합성곱 신경망 중에서 최근에 FAIR (Facebook AI Research)에서 개발한 Mask R-CNN을 이용하여 항공영상에서 건물을 탐지하고 성능을 평가하는 것이다. Mask R-CNN은 영역기반의 합성곱 신경망으로서 픽셀 정확도까지 객체를 의미적으로 분할하기 위한 딥러닝 모델로서 성능이 가장 우수한 것으로 평가받고 있다. 딥러닝 모델의 성능은 신경망 구조뿐 아니라 학습 능력에 의해 결정된다. 이를 위해 본 논문에서는 모델의 학습에 이용한 영상에 다양한 변화를 주어 학습 능력을 분석하였으며, 딥러닝의 궁극적 목표인 범용화의 가능성을 평가하였다. 향후 연구방안으로는 영상에만 의존하지 않고 다양한 공간정보 데이터를 복합적으로 딥러닝 모델의 학습에 이용하여 딥러닝의 신뢰성과 범용화가 향상될 것으로 판단된다.

Abstract ▼ AI-Helper

DL (Deep Learning) is getting popular in various fields to implement artificial intelligence that resembles human learning and cognition. DL based on complicate structure of the ANN (Artificial Neural Network) requires computing power and computation cost. Variety of DL models with improved performa...

DL (Deep Learning) is getting popular in various fields to implement artificial intelligence that resembles human learning and cognition. DL based on complicate structure of the ANN (Artificial Neural Network) requires computing power and computation cost. Variety of DL models with improved performance have been developed with powerful computer specification. The main purpose of this paper is to detect buildings from aerial images and evaluate performance of Mask R-CNN (Region-based Convolutional Neural Network) developed by FAIR (Facebook AI Research) team recently. Mask R-CNN is a R-CNN that is evaluated to be one of the best ANN models in terms of performance for semantic segmentation with pixel-level accuracy. The performance of the DL models is determined by training ability as well as architecture of the ANN. In this paper, we characteristics of the Mask R-CNN with various types of the images and evaluate possibility of the generalization which is the ultimate goal of the DL. As for future study, it is expected that reliability and generalization of DL will be improved by using a variety of spatial information data for training of the DL models.

주제어

표/그림 (16)

그림 Fig. 1. Learning process in general ANN
그림 Fig. 2. Architecture of generic CNN model
그림 Fig. 3. Zero padding
그림 Fig. 4. ReLU function
그림 Fig. 5. Resizing feature map by max pooling
그림 Fig. 6. Anchor boxes for object detection
그림 Fig. 7. Demonstration of nine possible anchor boxes
그림 Fig. 8. Mask R-CNN model architecture
그림 Fig. 9. Progress of CNN: From object detection to instance segmentation
그림 Fig. 10. Examples of RGB image and corresponding annotation data
그림 Fig. 11. A sample of training image
그림 Fig. 12. Rotated image without padding
그림 Fig. 13. Mirror padding for image rotation
그림 Fig. 14. Building detection with geometrically transformed images
그림 Fig. 15. Building detection with radiometrically degraded images
그림 Fig. 16. Building detection from unseen images

질의응답

핵심어	질문	논문에서 추출한 답변
	CNN에서 zero padding을 수행하는 이유는 무엇인가?	CNN의 필터계수(filter coefficient)는 일반 ANN의 가중치에 해당되며, 일반적으로 초기값은 무작위로 부여하고 학습과정에서 반복적으로 업데이트 된다. Convolution을 수행하면 Fig. 3처럼 입력영상의 테두리 부분에서 필터 크기의 반에 해당하는 픽셀들이 소실되어 특성맵의 크기가 작아지므로 입력영상과 같은 크기를 유지하기 위해 소실된 픽셀들을 “0”으로 채우는 zero padding을 수행한다.
	Mask R-CNN이란 무엇인가?	Mask R-CNN은 영상의 의미적 분할, 분류, 객체탐지 및 인식을 위해 개발된 DL 모델이다(Krizhevsky, 2012). 일반적인 ANN은 완전결합 층(FCL: Fully Connected Layer)으로 구성되어 1차원 형태의 데이터만 입력이 가능하다(Fig.
	CNN이 제안된 이유는 ANN을 이용한 영상처리의 어떠한 문제 때문인가?	1 참조). 반면에 영상은 픽셀의 위치정보와 픽셀에 저장된 밝기값으로 이루어진 3차원 배열이므로 영상을 FCL에 입력하려면 1차원으로 변환시켜야 한다. 이 경우 공간정보가 유실되어 영상으로부터 위치를 보존하면서 특징을 추출할 수 없으므로 학습이 비효율적이다. 이런 문제를 해결하기 위해 영상의 공간적 특성을 유지한 상태로 학습이 가능한 CNN이 제안되었다(Simard et al.

이 논문을 인용한 문헌

저자의 다른 논문 :

LOADING...

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

[국내논문] 딥러닝을 위한 영역기반 합성곱 신경망에 의한 항공영상에서 건물탐지 평가
Evaluation of Building Detection from Aerial Images Using Region-based Convolutional Neural Network for Deep Learning 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

표/그림 (16)

표/그림 (16)

질의응답

이 논문을 인용한 문헌

저자의 다른 논문 :

연구과제 타임라인

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

[국내논문] 딥러닝을 위한 영역기반 합성곱 신경망에 의한 항공영상에서 건물탐지 평가 Evaluation of Building Detection from Aerial Images Using Region-based Convolutional Neural Network for Deep Learning 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

표/그림 (16) 모든 표/그림 보기

표/그림 (16) 슬라이드로 보기

질의응답

이 논문을 인용한 문헌

저자의 다른 논문 :

이대건 (5) 이동천 (43)

연구과제 타임라인

전체(0) 논문(0) 특허(0) 보고서(0)

전체(0) 논문(0) 특허(0) 보고서(0)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

[국내논문] 딥러닝을 위한 영역기반 합성곱 신경망에 의한 항공영상에서 건물탐지 평가
Evaluation of Building Detection from Aerial Images Using Region-based Convolutional Neural Network for Deep Learning 원문보기

초록
AI-Helper

표/그림 (16)

표/그림 (16)