최근 딥러닝(DL)은 여러 분야에서 급속도로 활용되고 있으며, 특히 영상으로부터 객체를 인식하여 분류하고 인식하기 위한 컴퓨터비전 분야에서 활발하게 연구가 진행되고 있다. 영상분야에서는 주로 합성곱 신경망(CNN)을 이용한 딥러닝 모델의 성능 향상에 주력하고 있다. 대부분의 합성곱 신경망은 영상을 학습시켜 영상분류 및 객체인식에 활용하고 있지만, 본 논문에서는 독일 사진측량, 원격탐사 및 공간정보학회(DGPF)가 구축하고 국제 사진측량 및 원격탐사학회(ISPRS)가 제공하는 데이터 셋 중에서 수치표면모델(DSM)과 이 데이터로부터 생성한 경사 및 주향 정보를 효율성과 성능이 우수하다고 평가받는 합성곱 신경망기반의 SegNet 모델에 적용하여 객체를 분류하고 분석하였다. 딥러닝은 고사양의 컴퓨터 시스템과 다량의 학습 데이터와 라벨 데이터가 필요하고, 다수의 시행착오에 의한 풍부한 경험이 요구된다. 또한 본 논문에서는 한정된 수량의 데이터로부터 효율적인 학습을 위한 데이터 생성 방법을 제시하고 수치표면모델을 분류하였다. 분석 결과 수치표면모델 데이터와 이로부터 도출한 부가적인 데이터를 딥러닝 모델에 적용해도 객체를 타당한 정확도로 분류할 수 있음을 확인하였다.
최근 딥러닝(DL)은 여러 분야에서 급속도로 활용되고 있으며, 특히 영상으로부터 객체를 인식하여 분류하고 인식하기 위한 컴퓨터비전 분야에서 활발하게 연구가 진행되고 있다. 영상분야에서는 주로 합성곱 신경망(CNN)을 이용한 딥러닝 모델의 성능 향상에 주력하고 있다. 대부분의 합성곱 신경망은 영상을 학습시켜 영상분류 및 객체인식에 활용하고 있지만, 본 논문에서는 독일 사진측량, 원격탐사 및 공간정보학회(DGPF)가 구축하고 국제 사진측량 및 원격탐사학회(ISPRS)가 제공하는 데이터 셋 중에서 수치표면모델(DSM)과 이 데이터로부터 생성한 경사 및 주향 정보를 효율성과 성능이 우수하다고 평가받는 합성곱 신경망기반의 SegNet 모델에 적용하여 객체를 분류하고 분석하였다. 딥러닝은 고사양의 컴퓨터 시스템과 다량의 학습 데이터와 라벨 데이터가 필요하고, 다수의 시행착오에 의한 풍부한 경험이 요구된다. 또한 본 논문에서는 한정된 수량의 데이터로부터 효율적인 학습을 위한 데이터 생성 방법을 제시하고 수치표면모델을 분류하였다. 분석 결과 수치표면모델 데이터와 이로부터 도출한 부가적인 데이터를 딥러닝 모델에 적용해도 객체를 타당한 정확도로 분류할 수 있음을 확인하였다.
Recently, DL (Deep Learning) has been rapidly applied in various fields. In particular, classification and object recognition from images are major tasks in computer vision. Most of the DL utilizing imagery is primarily based on the CNN (Convolutional Neural Network) and improving performance of the...
Recently, DL (Deep Learning) has been rapidly applied in various fields. In particular, classification and object recognition from images are major tasks in computer vision. Most of the DL utilizing imagery is primarily based on the CNN (Convolutional Neural Network) and improving performance of the DL model is main issue. While most CNNs are involve with images for training data, this paper aims to classify and recognize objects using DSM (Digital Surface Model), and slope and aspect information derived from the DSM instead of images. The DSM data sets used in the experiment were established by DGPF (German Society for Photogrammetry, Remote Sensing and Geoinformatics) and provided by ISPRS (International Society for Photogrammetry and Remote Sensing). The CNN-based SegNet model, that is evaluated as having excellent efficiency and performance, was used to train the data sets. In addition, this paper proposed a scheme for training data generation efficiently from the limited number of data. The results demonstrated DSM and derived data could be feasible for semantic classification with desirable accuracy using DL.
Recently, DL (Deep Learning) has been rapidly applied in various fields. In particular, classification and object recognition from images are major tasks in computer vision. Most of the DL utilizing imagery is primarily based on the CNN (Convolutional Neural Network) and improving performance of the DL model is main issue. While most CNNs are involve with images for training data, this paper aims to classify and recognize objects using DSM (Digital Surface Model), and slope and aspect information derived from the DSM instead of images. The DSM data sets used in the experiment were established by DGPF (German Society for Photogrammetry, Remote Sensing and Geoinformatics) and provided by ISPRS (International Society for Photogrammetry and Remote Sensing). The CNN-based SegNet model, that is evaluated as having excellent efficiency and performance, was used to train the data sets. In addition, this paper proposed a scheme for training data generation efficiently from the limited number of data. The results demonstrated DSM and derived data could be feasible for semantic classification with desirable accuracy using DL.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구의 목적은 영상 이외에 정량적이고 기하학적 특성을 가지고 있는 데이터인 수치표면모델을 학습 데이터로 사용 가능성을 분석하는 것이고, 이를 위해 학습에 사용된 데이터와 유사성은 있지만, 다른 지역의 데이터인 새로운 데이터에 대한 결과의 정확도 분석하는 것은 중요하다. Fig.
SalGAN 등)을 이용하여 지역적 특성을 고려한 특화된 학습 방법을 개발하여 건물과 같은 중요한 객체의 3차원 모델링을 수행하는 것은 공간정보 분 야에서 중요한 과제이다. 한 가지 종류의 데이터뿐 아니라 여러 데이터들과 이 데이터로부터 도출할 수 있는 특성정보를 복합적으로학습에이용할수있는딥러닝모델연구를수행하여딥러닝의 궁극적인 목적인 범용성을 실현하는 것이다.
합성곱 신경망은 주로 영상을 학습시키지만, 본 논문은 영상대신 공간정보의 중요한 수치표면모델을 학습 데이터로 이용하여 객체를 분류하는 것이 목적이다. 3차원 좌표로 이루어진 수치표면모델 뿐 아니라 경사와 최대경사방향인 주향을 부가적인 데이터로 학습을 수행하여 SegNet의 성능을 분석하였다.
제안 방법
합성곱 신경망은 주로 영상을 학습시키지만, 본 논문은 영상대신 공간정보의 중요한 수치표면모델을 학습 데이터로 이용하여 객체를 분류하는 것이 목적이다. 3차원 좌표로 이루어진 수치표면모델 뿐 아니라 경사와 최대경사방향인 주향을 부가적인 데이터로 학습을 수행하여 SegNet의 성능을 분석하였다. 또한 한정된 수량의 학습 데이터를 효과적으로 증가시키는 방법도 제안하였다.
50m에 해당)이다. 또한 Vaihingen 데이터로 학습된 사전 학습모델(pre-trained mode)에 시험 데이터로 Potsdam 데이터 셋 중에서 한 지역을 새로운데이터(new unseen data)로 사용하여 결과를 분석하였다. 새로운 데이터는 사전 학습모델의 범용화 또는 일반화 가능성을 판단하기 위해 사용하는 넓은 의미의 시험 데이터이며, 학습에 사용된 데이터와 다소 다른 특성과 다양성을 가지고 있는 데이터를 사용하였다.
3차원 좌표로 이루어진 수치표면모델 뿐 아니라 경사와 최대경사방향인 주향을 부가적인 데이터로 학습을 수행하여 SegNet의 성능을 분석하였다. 또한 한정된 수량의 학습 데이터를 효과적으로 증가시키는 방법도 제안하였다.
10과 같이 학습이 진행될수록 정확도가 저하되고 손실이 발생하거나 변화가 거의 없다면 조기에 학습을 종료(early stop)하는 것이 효과적이다. 본 논문에서 적용한 하이퍼 파라미터들은 Table 3과 같으며, 확률적 경사하강법(SGDM)을 사용하였고, 초기 학습률은 0.001, 과적합 방지를 위해 L2 정규화(least square error)값은0.0005, 학습 조기종료는 20회로 설정하고 정확도와 손실 검증은 4epoch마다 수행하였다.
영상은 지형지물에서 반사되는 밝기값으로 형성된 물리적 특성의 데이터이지만, 수치표면모델은 객체의 3차원 형상 정보가 포함된 기하학적 공간 데이터이므로 객체 분류뿐 아니라 딥러닝에 의한 3차원 모델링에 중요한 역할을 할 수 있다. 본 연구에서는 수치표면모델, 경사 및 주향 정보로 딥러닝 모델을 학습시켜 객체 분류를 수행하여 다음의 결론을 얻었다.
감독학습에 필요한 ground truth인 label 데이터는 정확하고 객관적이어야 하지만, label 데이터 확보가 어려운 경우가 많다(Lee and Lee,2019a). 본논문에서는한정된수량의학습및 label 데이터를분할하여 데이터 수를 증가시키고 세밀한 수준까지 분류가 가능하도록 Fig. 5처럼학습데이터및대응하는 label 데이터를종횡 방향으로 50%씩 중복하여 분할하였다.
수치표면모델, 경사, 주향 그리고 이 데이터들을 융합(D+S+A로 표기)한 총 4개 데이터 셋으로 학습한 모델에Vaihingen의 시험 데이터(O, I, K 지역)와 Potsdam의 새로운데이터(4_11 지역)를 적용한 결과를 제시하였다(Fig. 11). 각 지역의 특징을 파악하기 위해 정사영상과 label 데이터도 보여주었다.
딥러닝은 학습 데이터에 의존도가 높으므로 학습, 검증, 시험 데이터 순으로 정확도가 결정되는 것은 당연한 결과이다. 시험 데이터 셋은 모든 객체를 분류한 전체 정확도와 건물에 대한 정확도를 구분하였다. 시험데이터 셋은 학습 데이터와 같은 지역의 데이터로서 유사성이 많지만, 시험 데이터는 학습에 기여하지 않았으므로 전체 분류 정확도 평균은 67.
09m의 엄밀정사영상(true orthoimage) 모자이크를 33개 지역으로 분할하여 제공하고 있다. 영상정합에 의해 생성된 고밀도수치표면모델의 GSD는 정사영상 해상도와 같은 0.09m이고,16개 지역에 대해 UTM (Universal Transverse Mercator) 좌표계의 geocoded TIFF 포맷으로 제공한다. 또한 촬영고도 500m에서 Leica ALS50로 획득한 라이다 데이터의 점밀도는 4pts/㎡(GSD=0.
대상 데이터
, 2016; Bronshtein, 2017). 20%에 해당하는 시험용 데이터는 임의로 선정한 O, I 및 K 지역의 3개 데이터이다.
2018R1D1A1B07048732). The Vaihingen data set was provided by the German Society for Photogrammetry, Remote Sensing and Geoinformation (DGPF) [Cramer, 2010]: http://www.ifp.uni-stuttgart.de/dgpf/DKEP-Allg.html.
3(a)에서 보여주는 것처럼 16개 지역에 대해 구축되어 있다. 각각의 데이터를 Fig 5(a)처럼 150x250 크기로 중복 분할하여 총 7,990개의 데이터를 생성하였다(Table 2). 딥러닝 모델의 학습과 성능 검증을 위해 전체 데이터 중에서 60%를 학습용(training), 20%를 검증용(validation), 20%를 시험용(test)으로 구별하여 사용하는 것을 권장하고 있다(Sharada et al.
논문에서 사용한 딥러닝 모델은 SegNet이며 옥스퍼드 대학의 Visual Geometry Group이 개발한 VGGNet을 모태로 하고 있다. VGGNet 모델은 2014년 ILSVRC (ImageNetLarge Scale Visual Recognition Challenge)에서 분류 오류율(classification error rate) 7.
학습 데이터와 label 데이터는 특성이 다르므로 학습 효과가 저하되어 분류 정확도가 높지 않을 수 있다고 사료된다. 데이터베이스에는 3차원 label 데이터가 구축되어 있지 않아서 2차원 분류영상을 label 데이터로 사용하였다.
3(b)는 Potsdam 데이터 셋이며, 사전 학습모델의 성능을 확인하기 위한 새로운 데이터로 사용하였다. 본 논문에서는 앞에서 설명한 바와 같이, 영상 대신에 수치표면모델 데이터와 경사 및 주향 정보를 학습 데이터로 사용하였다. 수치표면모델은 3차원 좌표 데이터이고, 경사와 주향은 각도를 나타내는 숫자로 이루어진 데이터이다.
본 연구에서 사용한 SegNet 모델 학습과 검증 과정은 Fig. 7에서 보여주고 있으며, 학습에 사용한 데이터의 종류에 따라 4가지 경우에 대해 실험을 수행하였다: (1) 수치표면모델 데이터(Fig. 4(a)), (2) 경사 데이터(Fig.
학습 데이터의 특성과 활용 목적에 따라 label 데이터는 적합한 형태이어야 한다. 본 연구에서는 3차원 데이터인 수치표면모델을 학습에 사용하였지만,label 데이터는 2차원 지표피복 분류 영상이었다. 학습 데이터와 label 데이터는 특성이 다르므로 학습 효과가 저하되어 분류 정확도가 높지 않을 수 있다고 사료된다.
또한 Vaihingen 데이터로 학습된 사전 학습모델(pre-trained mode)에 시험 데이터로 Potsdam 데이터 셋 중에서 한 지역을 새로운데이터(new unseen data)로 사용하여 결과를 분석하였다. 새로운 데이터는 사전 학습모델의 범용화 또는 일반화 가능성을 판단하기 위해 사용하는 넓은 의미의 시험 데이터이며, 학습에 사용된 데이터와 다소 다른 특성과 다양성을 가지고 있는 데이터를 사용하였다.
실험에 사용한 데이터는 ISPRS의 “도심지역 분류와 3D 건물재현을 위한 시범 프로젝트”(Rottensteiner et al., 2013)의 일환으로 독일 Vaihingen과 Potsdam 지역에 대해 구축한 공간정보 데이터 셋이며, 독일 사진측량, 원격탐사 및 공간정보학회(German Society for Photogrammetry, Remote Sensing & Geoinformatics)가 제공하고 있다(Cramer, 2010).
, 2013)의 일환으로 독일 Vaihingen과 Potsdam 지역에 대해 구축한 공간정보 데이터 셋이며, 독일 사진측량, 원격탐사 및 공간정보학회(German Society for Photogrammetry, Remote Sensing & Geoinformatics)가 제공하고 있다(Cramer, 2010). 실험지역은 다양한 모양의 건물, 수목, 수풀, 잔디, 도로, 자동차 등이 혼재되어 있으며, 분류 영상인 label 데이터를 제공하고 있다. Fig.
학습(training)과 검증(validation) 및 시험(test)에 사용한Vaihingen 데이터 셋은 적외선 정사영상(IR-R-G 밴드), 수치표면모델, 항공 라이다 및 label 데이터로 구성되어 있다. 촬영고도 900m에서 Intergraph DMC (Digital Mapping Camera)로촬영한 적외선 영상으로부터 GSD (Ground Sample Distance) 0.
학습에 관여한 Vaihingen 지역의 데이터만 사용하여 딥러닝 모델을 평가하는 것은 제한적이므로 학습이 완료된 딥러닝 모델의 객관적 평가를 위해 학습, 검증 및 시험에 관여하지 않은 Potsdam 지역에서 새로운 데이터를 선택하였다. 딥러닝의 최종목표는 사전에 학습된 모델에 새로운 데이터를 입력하여도 타당한 결과를 얻을 수 있어야 한다.
학습에 사용한 Vaihingen 지역의 수치표면모델 데이터 평균 크기는 1900x2500이며, Fig. 3(a)에서 보여주는 것처럼 16개 지역에 대해 구축되어 있다. 각각의 데이터를 Fig 5(a)처럼 150x250 크기로 중복 분할하여 총 7,990개의 데이터를 생성하였다(Table 2).
이론/모형
그러나 초기 합성곱 신경망 모델인LeNet은 합성곱 층의 수가 적으며 average pooling을 사용하고,나머지모델은 max-pooling을적용하고있다. 현재대부분의합성곱 신경망 모델은 max-pooling을 사용한다. 합성곱 층 개수,kernel 크기, pooling 방법 및 활성화 함수 종류에 차이가 있을 뿐 모델 구성과 학습 방법은 유사하다.
성능/효과
(2) 분류 정확도는 학습 데이터, 검증 데이터, 시험 데이터에 대해서 각각 93%, 88%, 68%였으며, 새로운 데이터를 학습된 딥러닝 모델에 적용한 정확도는 42%이었다. 새로운데이터에 대한 정확도 분석은 딥러닝 모델의 객관성과 범용성을 평가하기 위한 중요한 과정이다.
본 연구의 목적은 영상 이외에 정량적이고 기하학적 특성을 가지고 있는 데이터인 수치표면모델을 학습 데이터로 사용 가능성을 분석하는 것이고, 이를 위해 학습에 사용된 데이터와 유사성은 있지만, 다른 지역의 데이터인 새로운 데이터에 대한 결과의 정확도 분석하는 것은 중요하다. Fig. 11과 Table 4에서 보여주는 것처럼 새로운 데이터의 분류 정확도는 시험 데이터처럼 전체 객체 분류 정확도 평균은 41.54%로 낮지만, 건물에 대한 평균 정확도 73.09%는 의미 있는 결과라고 판단된다.
학습에 사용된 데이터와 종류 및 지역적 특성이 다른 새로운 데이터에 대해서는 성능이 우수한 딥러닝 모델이라도 좋은 결과를 도출할 수 없다. 본 연구에서 새로운 데이터로 선택한 Potsdam 지역은 Vaihingen 지역의 건물 모양이나 분포 형태와 지역적 특징이 다르지만 유사성과 공통점도 있으므로 타당한 결과를 얻을 것으로 판단된다. Fig.
새로운데이터에 대한 정확도 분석은 딥러닝 모델의 객관성과 범용성을 평가하기 위한 중요한 과정이다. 새로운 데이터에 대한전체적인분류정확도는낮지만건물객체에대한정확도는 73%로 상대적으로 높으므로 건물탐지 및 인식 그리고 3차원 건물 모델링에 효과적이라고 판단된다
시험 데이터 셋은 모든 객체를 분류한 전체 정확도와 건물에 대한 정확도를 구분하였다. 시험데이터 셋은 학습 데이터와 같은 지역의 데이터로서 유사성이 많지만, 시험 데이터는 학습에 기여하지 않았으므로 전체 분류 정확도 평균은 67.53%로 학습 및 검증 정확도에 비해 낮지만, 건물 분류 정확도 평균은 80.95%로 상대적으로 높다. 건물에 대한 정확도가 높은 이유는 수치표면모델 특성에 있다.
실험 결과 한 종류의 데이터에 의한 학습으로 발생할 수 있는과적합문제를다양한데이터융합에의해보완하고학습효율을 향상시킬 수 있다는 가정은 완전히 충족하지 못하였지만,원시 데이터 자체뿐 아니라 원시 데이터로부터 의미 있는 정보를 도출하여 학습에 사용하여 의미 있는 결과를 얻을 수 있었다. 다양하고 복잡한 지역에 대해 많은 학습을 수행하면 향상된 결과를 얻을 수 있다고 판단된다.
학습 데이터 셋의 정확도는 91.97%, 94.42%, 96.87%,89.35%이며, 검증 데이터 셋의 정확도는 85.25%, 88.41%,89.07%, 88.43%이다(Table 4). 딥러닝은 학습 데이터에 의존도가 높으므로 학습, 검증, 시험 데이터 순으로 정확도가 결정되는 것은 당연한 결과이다.
학습과 검증 데이터에 대한 정확도는 수치표면모델을 사용한 경우보다 경사와 주향을 사용한 경우가 모두 높았지만, 특히 모든 데이터를 융합한 경우는 88.43%로 학습 데이터에 비해 검증 데이터에서 수치표면모델의 정확도 85.25%보다 다소 높은 정확도를 얻을 수 있었다. 그러나 나머지 데이터에서는 수치표면모델을 사용한 정확도가 높은 결과를 얻었다.
후속연구
향후 연구로서 라이다와 같은 3차원 점군집 데이터에 적용할 수 있는 딥러닝 모델(예: PointNet. SalGAN 등)을 이용하여 지역적 특성을 고려한 특화된 학습 방법을 개발하여 건물과 같은 중요한 객체의 3차원 모델링을 수행하는 것은 공간정보 분 야에서 중요한 과제이다. 한 가지 종류의 데이터뿐 아니라 여러 데이터들과 이 데이터로부터 도출할 수 있는 특성정보를 복합적으로학습에이용할수있는딥러닝모델연구를수행하여딥러닝의 궁극적인 목적인 범용성을 실현하는 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
인공신경망이란 무엇인가?
인공지능(artificial intelligence)을 실현하기 위한 인공신경망(ANN; Artificial Neural Network)은 인간의 신경세포인 뉴런의구조와 기능을 모방하여 수학적으로 모델링한 것으로서 딥러닝의 기반이 되고 있다. 인공신경망 연구는 1940년대에 인간 신경계의 기본 단위인 뉴런의 기능과 메커니즘을 수학적으로 규명하려는 시도로부터 시작되었다(McCulloch and Pitts, 1943).
1980년대 후반 인공신경망이 부활하기 시작한 이유는 무엇인가?
1980년대 후반에 다층 구조의 인공신경망과 학습의 핵심이 되는 오류 역전파(error backpropagation) 이론이 제안되면서 인공신경망은 부활하기 시작하였다(Rumelhart et al., 1986).
합성곱 신경망은 최종적으로 분류 결과를 출력하기 위해 무엇으로 구성되어 있는가?
합성곱 신경망의 주요 계층(layer)은 일반적인 인공신경망의 은닉층에 해당하는 합성곱 연산을 수행하는 합성곱 층(convolution layer), 합성곱 결과인 특징맵의 특성을 부각시키고 강조하기 위해 특징맵의 크기를 줄이는 pooling 층, 정규화하여 다음 층으로 전달하기 위한 활성화 함수(activation function)이다(Goki, 2016). 최종적으로 분류 결과를 출력하기 위한 완전연결 층(fully connected layer)과 softmax 층으로 구성되어 있다.
참고문헌 (26)
Audebert, N., Le Saux, B., and Lefevre, S. (2018), Beyond RGB: Very high resolution urban remote sensing with multimodal deep networks, ISPRS Journal of Photogrammetry and Remote Sensing, Vol. 140, pp. 20-32.
Badrinarayanan, V., Kendall, A., and Cipolla, R. (2016), SegNet: A deep convolutional encoder-decoder architecture for image segmentation. IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol. 39, No. 12, pp. 2481-2495.
Bronshtein, A. (2017), Train/test split and cross validation in Python, https://towardsdatascience.com/train-test-split-andcross-validation-in-python-80b61beca4b6 (last date accessed: 17 November 2019).
Cramer, M. (2010), The DGPF test on digital aerial camera evaluation - Overview and test design. Photogrammetrie, Fernerkundung, Geoinformation, Vol. 2, pp. 73-82.
de Brebisson, A. and Montana, G. (2015), Deep neural networks for anatomical brain segmentation, arXiv:1502.02445v2 [cs.CV], 25 Jun 2015.
Garcia-Garcia, A., Orts-Escolano, S., Oprea, S., Villena-Martinez, V., and Garcia-Rodriguez, J. (2017), A review on deep learning techniques applied to semantic segmentation, arXiv:1704.06857v1 [cs.CV], 22 Apr 2017.
Goki, S. (2016), Deep Learning from Scratch, O'Reilly, Japan, 312p.
Gulli, A. and Pal, S. (2017), Deep Learning with Keras, Packt Publishing Ltd., Birmingham, UK, 490p.
Gupta, D. (2017), Fundamentals of deep learning - Activation functions and when to use them?, https://www.analyticsvidhya.com/blog/ 2017/10/fundamentals-deep-learning-activationfunctions-when-to-use-them/ (last date accessed: 15 August 2019).
Kim, J., Lee, D.C., Yom, J.H., and Pack, J.K., (2004), Telecommunication modeling by integration of geophysical and geospatial information, IGARSS IEEE International Geoscience and Remote Sensing Symposium, 27 December 2004, Anchorage, USA, pp. 4105-4108.
Kumar, S. (2017), Summary of SegNet: A deep convolutional encoder-decoder architecture for image segmentation, https://saytosid.github.io/segnet/ (last date accessed: 15 August 2018).
LeCun, Y., Boser, B., Denker, J., Henderson, D., Howard, R. Hubbard, W., and Jackel, L. (1989), Backpropagation applied to handwritten zip code recognition. Neural Computation, No. 1, Vol. 4, pp. 541-551.
Lee, D. and Lee, D.C. (2019a), Training deep learning model with spatial information data for semantic segmentation: case of SegNet, Proceedings of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, 11-12 April 2019, Gwangju, Korea, pp. 78-83. (in Korean)
Lee, D. and Lee, D.C. (2019b), Role of NGII digital map ver. 2.0 as label data for deep learning, Proceedings of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, 11-12 April 2019, Gwangju, Korea, pp. 160-163. (in Korean)
Long, J., Shelhamer, E., and Darrell, T. (2015), Fully convolutional networks for semantic segmentation, Proceedings of IEEE Conference on Computer Vision and Patton Recognition, 7-12 June 2015, Boston, MA, pp. 3431-3440.
Maltezos, E., Doulamis, A, Doulamis, N., and Ioannidis, C. (2019), Building extraction from LiDAR data applying deep convolutional neural networks, IEEE Geoscience and Remote Sensing Letters, Vol. 16, No. 1, pp. 155-159.
Maturana, D. and Scherer, S. (2015), 3D convolutional neural networks for landing zone detection from LiDAR, IEEE International Conference on Robotics and Automation (ICRA), Seattle, Washington, 26-30 May 2015, pp. 3471-3478.
McCulloch, W. and Pitts, W. (1943), A Logical Calculus of the Ideas Immanent in Nervous Activity, Bulletin of Mathematical Biophysics, Vol. 7, pp. 115-133.
Pang, Y., Sun, M., Jiang, X., and Li, X. (2018), Convolution in convolution for network in network, IEEE Transactions on Neural Networks and Learning Systems, Vol. 29, No. 5, pp. 1587-1597.
Rosenblatt, F. (1958), The perceptron: A probabilistic model for information storage and organization in the brain, Psychological Review, Vol. 65, No. 6, pp. 386-408.
Rottensteiner, F., Sohn, G., Gerke, M., and Wegner, J. (2013), ISPRS test project on urban classification and 3D building reconstruction, http://www2.isprs.org/tl_files/isprs/wg34/docs/ComplexScenes_revision_v4.pdf (last date accessed: 6 April 2018).
Rumelhart, D., Hinton, G., and Williams, R. (1986), Learning internal representations by back-propagating errors. Nature, Vol. 323, No. 9, pp. 533-536.
Russakovsky, O., Deng, J., Su, H., Krause, J., Satheesh, S., Ma, S., Huang Z., Karpathy, A., Khosla, A., Bernstein, M., and Berg, A. (2015), ImageNet large scale visual recognition challenge. International Journal of Computer Vision, Vol. 115, No. 3, pp. 211-252.
Sharada, P., Mohanty, S., Hughes, D., and Salathe, M. (2016), Using deep learning for image-based plant disease detection, Frontiers in Plant Science, doi: 10.3389/fpls.2016.01419, pp. 1-10.
Sherrah, J. (2016), Fully convolutional networks for dense semantic labelling of high-resolution aerial imagery, arXiv:1606.02585v1[cs.CV], 8 Jun 2016.
Simard, P., Steinkraus, D., and Platt, J. (2003), Best practices for convolutional neural networks applied to visual document analysis. Proceedings of the 7th International Conference on Document Analysis and Recognition, 3-6 August 2003, Edinburgh, Scotland, pp. 958-962.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.