$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

DeepLabV3+와 Swin Transformer 모델을 이용한 Sentinel-2 영상의 구름탐지
Cloud Detection from Sentinel-2 Images Using DeepLabV3+ and Swin Transformer Models 원문보기

대한원격탐사학회지 = Korean journal of remote sensing, v.38 no.6 pt.2, 2022년, pp.1743 - 1747  

강종구 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ,  박강현 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ,  김근아 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ,  윤유정 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ,  최소연 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ,  이양원 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공)

초록
AI-Helper 아이콘AI-Helper

Sentinel-2는 분광파장대나 공간해상도 측면에서 우리나라 차세대중형위성 4호(농림위성)의 모의영상으로 활용될 수 있다. 이 단보에서는 향후 농림위성영상에 적용하기 위한 예비실험으로, 딥러닝 기술을 이용한 Sentinel-2 영상의 구름탐지를 수행하였다. 전통적인 Convolutional Neural Network (CNN) 모델인 DeepLabV3+와 최신의 Transformer 모델인 Shifted Windows (Swin) Transformer를 이용한 구름탐지 모델을 구축하고, Radiant Earth Foundation (REF)에서 제공하는 22,728장의 학습자료에 대한 암맹평가를 실시하였다. Swin Transformer 모델은 0.886의 정밀도와 0.875의 재현율로, 과탐지와 미탐지가 어느 한쪽으로 치우치지 않는 경향을 보였다. 딥러닝 기반 구름탐지는 향후 우리나라 중심의 실험을 거쳐 농림위성 영상에 활용될 수 있을 것으로 기대된다.

Abstract AI-Helper 아이콘AI-Helper

Sentinel-2 can be used as proxy data for the Korean Compact Advanced Satellite 500-4 (CAS500-4), also known as Agriculture and Forestry Satellite, in terms of spectral wavelengths and spatial resolution. This letter examined cloud detection for later use in the CAS500-4 based on deep learning techno...

주제어

표/그림 (5)

AI 본문요약
AI-Helper 아이콘 AI-Helper

제안 방법

  • 이단보에서는 향후 농림위성영상에 적용하기 위한 예비실험으로, 딥러닝 기술을 이용한 Sentinel-2 영상의 구름 탐지를 수행하였다. 전통적인 CNN 모델인 DeepLabV3+와 최신의 Transformer 모델인 Swin Transformer를 이용한 구름탐지 모델을 구축하고, REF에서 제공하는 22,728장의 학습자료에 대한 암맹평가 결과, Swin Transformer 모델이 상당히 앞선 성능을 나타냈다.

대상 데이터

  • DeepLabV3+와SwinTransformer 모델훈련에서 손실함수(lossfunction)는 Binary Cross Entropy (BCE)를 사용하였고, 세밀한 가중치 조정을 위해 학습률(learning rate)은 1e-6로 설정하였으며, 옵티마이저(optimizer)는 학습의 안정성과 속도를 보장하는 Adaptive Moment Estimation (ADAM)을 사용하였다. DeepLabV3+는 백본(backbone)으로 resnet-101을 사용하였고, Swin Transformer를 위한 모델 구조는 Pyramid Attention Network (PAN)을 사용하였다. Blue,Green, Red, NIR의 4개 입력채널을 가진 DeepLabV3+와 Swin Transformer 모델의 하이퍼파라미터와 구동환경은 다양한 실험을 거쳐 Table 1과 같이 설정되었다.
  • 전체 데이터는 학습 데이터셋 11,748개와 시험 데이터셋 10,980개로구성되며,학습데이터셋에대하여훈련대 검증 영상이 9:1의 비율이 되도록 구성하였다. DeepLabV3+와SwinTransformer 모델훈련에서 손실함수(lossfunction)는 Binary Cross Entropy (BCE)를 사용하였고, 세밀한 가중치 조정을 위해 학습률(learning rate)은 1e-6로 설정하였으며, 옵티마이저(optimizer)는 학습의 안정성과 속도를 보장하는 Adaptive Moment Estimation (ADAM)을 사용하였다.

데이터처리

  • 시험 데이터셋에서 레이블 영상과 예측 영상을 비교하여 혼동행렬(confusionmatrix)을 작성하고,True Positive (TP), False Positive (FP), True Negative (TN), False Negative (FN)를 계산하였다. 또한 이를 통해 정확도(accuracy), 정밀도(precision), 재현율(recall), F1점수, 평균 교집합 대합집합 비율(Mean Intersection over Union, mIOU) 등의 성능지표를 산출하였다. 정확도는 예측 영상의 화소 중에 레이블 영상과 동일한 화소의 비율이다.
  • 시험 데이터셋에서 레이블 영상과 예측 영상을 비교하여 혼동행렬(confusionmatrix)을 작성하고,True Positive (TP), False Positive (FP), True Negative (TN), False Negative (FN)를 계산하였다. 또한 이를 통해 정확도(accuracy), 정밀도(precision), 재현율(recall), F1점수, 평균 교집합 대합집합 비율(Mean Intersection over Union, mIOU) 등의 성능지표를 산출하였다.
  • 입력 영상은 화소값을 평균(μ) 0, 표준편차(σ) 1의 분포가 되도록 z 표준화하여 사용하였다

이론/모형

  • 전체 데이터는 학습 데이터셋 11,748개와 시험 데이터셋 10,980개로구성되며,학습데이터셋에대하여훈련대 검증 영상이 9:1의 비율이 되도록 구성하였다. DeepLabV3+와SwinTransformer 모델훈련에서 손실함수(lossfunction)는 Binary Cross Entropy (BCE)를 사용하였고, 세밀한 가중치 조정을 위해 학습률(learning rate)은 1e-6로 설정하였으며, 옵티마이저(optimizer)는 학습의 안정성과 속도를 보장하는 Adaptive Moment Estimation (ADAM)을 사용하였다. DeepLabV3+는 백본(backbone)으로 resnet-101을 사용하였고, Swin Transformer를 위한 모델 구조는 Pyramid Attention Network (PAN)을 사용하였다.
본문요약 정보가 도움이 되었나요?

참고문헌 (6)

  1. Chen, L.C., Y. Zhu, G. Papandreou, F. Schroff, and H. Adam, 2018. Encoder-decoder with atrous separable convolution for semantic image segmentation, arXiv preprint arXiv:1802.02611. https://doi.org/10.48550/arXiv.1802.02611 

  2. Dosovitskiy, A., L. Beyer, A. Kolesnikov, D. Weissenborn, X. Zhai, T. Unterthiner, M. Dehghani, M. Minderer, G. Heigold, S. Gelly, J. Uszkoreit, and N. Houlsby, 2020. An Image is Worth 16 × 16 Words: Transformers for Image recognition at scale, arXiv preprint arXiv:2010.11929. https://doi.org/10.48550/arXiv.2010.11929 

  3. ESA (European Space Agency), 2022. Cloud Masks, https://sentinels.copernicus.eu/web/sentinel/technical-guides/sentinel-2-msi/level-1c/cloud-masks, Accessed on Nov. 30, 2022. 

  4. Kang, J., G. Kim, Y. Jeong, S. Kim, Y. Youn, S. Cho, and Y. Lee, 2021. U-Net cloud detection for the SPARCS cloud dataset from Landsat 8 images, Korean Journal of Remote Sensing, 37(5-1): 1149-1161. https://doi.org/10.7780/kjrs.2021.37.5.1.25 

  5. Liu, Z., Y. Lin, Y. Cao, H. Hu, Y. Wei, Z. Zhang, S. Lin, and B. Guo, 2021. Swin Transformer: Hierarchical vision transformer using shifted windows, arXiv preprint arXiv:2103.14030. https://doi.org/10.48550/arXiv.2103.14030 

  6. REF (Radiant Earth Foundation), 2022. Sentinel-2 Cloud Cover Segmentation Dataset, https://mlhub.earth/data/ref_cloud_cover_detection_challenge_v1, Accessed on Nov. 30, 2022. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로