[국내논문] 개선된 DeepResUNet과 컨볼루션 블록 어텐션 모듈의 결합을 이용한 의미론적 건물 분할
Semantic Building Segmentation Using the Combination of Improved DeepResUNet and Convolutional Block Attention Module 원문보기

대한원격탐사학회지 = Korean journal of remote sensing, v.38 no.6 pt.1, 2022년, pp.1091 - 1100  

예철수 (극동대학교 AI컴퓨터공학과) ,  안영만 (극동대학교 AI컴퓨터공학과) ,  백태웅 (극동대학교 AI컴퓨터공학과) ,  김경태 (극동대학교 AI컴퓨터공학과)

딥러닝 기술의 진보와 함께 다양한 국내외 고해상도 원격탐사 영상의 활용이 가능함에 따라 딥러닝 기술과 원격탐사 빅데이터를 활용하여 도심 지역 건물 검출과 변화탐지에 활용하고자 하는 관심이 크게 증가하고 있다. 본 논문에서는 고해상도 원격탐사 영상의 의미론적 건물 분할을 위해서 건물 분할에 우수한 성능을 보이는 DeepResUNet 모델을 기본 구조로 하고 잔차 학습 단위를 개선하고 Convolutional Block Attention Module(CBAM)을 결합한 새로운 건물 분할 모델인 CBAM-DRUNet을 제안한다. 제안한 건물 분할 모델은 WHU 데이터셋과 INRIA 데이터셋을 이용한 성능 평가에서 UNet을 비롯하여 ResUNet, DeepResUNet 대비 F1 score, 정확도, 재현율 측면에서 모두 우수한 성능을 보였다.

As deep learning technology advances and various high-resolution remote sensing images are available, interest in using deep learning technology and remote sensing big data to detect buildings and change in urban areas is increasing significantly. In this paper, for semantic building segmentation of...


문제 정의

  • 본 논문에서는 건물 분할 딥러닝 모델 가운데 우수한 성능을 보이는 UNet 기반의 대표적인 모델들을 살펴보고 가장 우수한 성능을 보이는 모델 중 하나인 DeepResUNet의 성능을 개선시키는 방법을 제안하였다. 이를 위해서 DeepResUNet의 기존 ResBlock의 내부 구조에서 활성화 함수의 갯수를 줄이고 보다 많은 특징 정보 생성에 유리하도록 컨볼류션 레이어에 사용되는 채널의 수를 증가시키는 방법을 제안하였다.
참고문헌 (14)

  1. Deng, W., Q. Shi, and J. Li, 2021. Attention-gate-based encoder-decoder network for automatical building extraction, IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 14: 2611-2620. https://doi.org/10.1109/JSTARS.2021.3058097 

  2. Foivos, I.D., F. Waldner, P. Caccetta, and C. Wu, 2020. ResUNet-a: A deep learning framework for semantic segmentation of remotely sensed data, ISPRS Journal of Photogrammetry and Remote Sensing, 162: 94-114. https://doi.org/10.48550/arXiv.1904.00592 

  3. Guo, M., H. Liu, Y. Xu, and Y. Huang, 2020. Building extraction based on U-Net with an attention block and multiple losses, Remote Sensing, 12(9): 1400. https://doi.org/10.3390/rs12091400 

  4. Han, D., J. Kim, and J. Kim, 2017. Deep pyramidal residual networks, Proc. of 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, HI, Jul. 21-26, pp. 6307-6315. https://doi.org/10.1109/CVPR.2017.668 

  5. Jin, Y., W. Xu, C. Zhang, X. Luo, and H. Jia, 2021. Boundary-aware refined network for automatic building extraction in very high-resolution urban aerial images, Remote Sensing, 13(4): 692. https://doi.org/10.3390/rs13040692 

  6. Li, C., L. Fu, Q. Zhu, J. Zhu, Z. Fang, Y. Xie, Y. Guo, and Y. Gong, 2021. Attention enhanced U-Net for building extraction from farmland based on google and WorldView-2 remote sensing images, Remote Sensing, 13(21): 4411. https://doi.org/10.3390/rs13214411 

  7. Ronneberger, O., P. Fischer, and T. Brox, 2015. U-Net: convolutional networks for biomedical image segmentation, arXiv preprint arXiv:1505.04597. https://doi.org/10.48550/arXiv.1505.04597 

  8. Wang, H. and M. Fang, 2022. Building extraction from remote sensing images using deep residual U-Net, European Journal of Remote Sensing, 55(1): 71-85. https://doi.org/10.1080/22797254.2021.2018944 

  9. Woo, S., J. Park, J.Y. Lee, and I.S. Kweon, 2018. CBAM: Convolutional Block Attention Module, In: Ferrari, V., Hebert, M., Sminchisescu, C., Weiss, Y. (eds), Computer Vision - ECCV 2018, Springer, Cham, Switzerland, vol. 11211, pp. 3-19. https://doi.org/10.1007/978-3-030-01234-2_1 

  10. Wu, T., Y. Hu, L. Peng, and R. Chen, 2020. Improved anchor-free instance segmentation for building extraction from high-resolution remote sensing images, Remote Sensing, 12(18): 2910. https://doi.org/10.3390/rs12182910 

  11. Ye, C.S., Y.M. Ahn, T.W. Baek, and K.T. Kim, 2022. UNet-based deep learning model performance analysis for semantic building segmentation of remote sensing images, Proc. of 2022 Fall Conference of the Korean Society for Remote Sensing, Busan, Nov. 7-9, p. 29. 

  12. Ye, Z., Y. Fu, M. Gan, J. Deng, A. Comber, and K. Wang, 2019. Building extraction from very high resolution aerial imagery using joint attention deep neural network, Remote Sensing, 11(24): 2970. https://doi.org/10.3390/rs11242970 

  13. Yi, Y., Z. Zhang, W. Zhang, C. Zhang, W. Li, and T. Zhao, 2019. Semantic segmentation of urban buildings from VHR remote sensing imagery using a deep convolutional neural network, Remote Sensing, 11(15): 1774. https://doi.org/10.3390/rs11151774 

  14. Zhang, Z., Q. Liu, and Y. Wang, 2018. Road extraction by deep residual U-Net, IEEE Geoscience and Remote Sensing Letters, 15(5): 749-753. https://doi.org/10.1109/LGRS.2018.2802944 

