최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국측량학회지 = Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, v.36 no.6, 2018년, pp.469 - 481
이대건 (Dept. of Environment, Energy & Geoinformatics, Sejong University) , 조은지 (Dept. of Environment, Energy & Geoinformatics, Sejong University) , 이동천 (Dept. of Environment, Energy & Geoinformatics, Sejong University)
DL (Deep Learning) is getting popular in various fields to implement artificial intelligence that resembles human learning and cognition. DL based on complicate structure of the ANN (Artificial Neural Network) requires computing power and computation cost. Variety of DL models with improved performa...
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
CNN에서 zero padding을 수행하는 이유는 무엇인가? | CNN의 필터계수(filter coefficient)는 일반 ANN의 가중치에 해당되며, 일반적으로 초기값은 무작위로 부여하고 학습과정에서 반복적으로 업데이트 된다. Convolution을 수행하면 Fig. 3처럼 입력영상의 테두리 부분에서 필터 크기의 반에 해당하는 픽셀들이 소실되어 특성맵의 크기가 작아지므로 입력영상과 같은 크기를 유지하기 위해 소실된 픽셀들을 “0”으로 채우는 zero padding을 수행한다. | |
Mask R-CNN이란 무엇인가? | Mask R-CNN은 영상의 의미적 분할, 분류, 객체탐지 및 인식을 위해 개발된 DL 모델이다(Krizhevsky, 2012). 일반적인 ANN은 완전결합 층(FCL: Fully Connected Layer)으로 구성되어 1차원 형태의 데이터만 입력이 가능하다(Fig. | |
CNN이 제안된 이유는 ANN을 이용한 영상처리의 어떠한 문제 때문인가? | 1 참조). 반면에 영상은 픽셀의 위치정보와 픽셀에 저장된 밝기값으로 이루어진 3차원 배열이므로 영상을 FCL에 입력하려면 1차원으로 변환시켜야 한다. 이 경우 공간정보가 유실되어 영상으로부터 위치를 보존하면서 특징을 추출할 수 없으므로 학습이 비효율적이다. 이런 문제를 해결하기 위해 영상의 공간적 특성을 유지한 상태로 학습이 가능한 CNN이 제안되었다(Simard et al. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.