건설현장에서 사진이란 시간이 흘러가면서 변하는 현장의 시각적인 데이터를 남기는 가장 간단하고 확실한 방법으로, 매 건설 프로젝트를 진행함에 따라서 현장의 관리자들은 수 많은 사진들을 찍고 관리하게 된다. 이렇게 찍은 사진들의 양은 시공 현장의 규모와 시공 품질에 따라 다르지만 공통적으로 수 천, 수 만장은 찍는 것이 일반적이다. 하지만 현장에서 발생하는 사진들은 전체적으로 데이터의 양이 크기 때문에 정리되지 않은 사진들로부터는 필요한 정보를 원하는 때 추출해서 활용하기가 쉽지 않다. 이로 인해 결국 이전 현장의 정리되지 않은 이미지 데이터를 추후의 프로젝트에서 다시 활용하는 것에는 상당한 불편함이 따르게 된다. 본 연구는 ...
건설현장에서 사진이란 시간이 흘러가면서 변하는 현장의 시각적인 데이터를 남기는 가장 간단하고 확실한 방법으로, 매 건설 프로젝트를 진행함에 따라서 현장의 관리자들은 수 많은 사진들을 찍고 관리하게 된다. 이렇게 찍은 사진들의 양은 시공 현장의 규모와 시공 품질에 따라 다르지만 공통적으로 수 천, 수 만장은 찍는 것이 일반적이다. 하지만 현장에서 발생하는 사진들은 전체적으로 데이터의 양이 크기 때문에 정리되지 않은 사진들로부터는 필요한 정보를 원하는 때 추출해서 활용하기가 쉽지 않다. 이로 인해 결국 이전 현장의 정리되지 않은 이미지 데이터를 추후의 프로젝트에서 다시 활용하는 것에는 상당한 불편함이 따르게 된다. 본 연구는 인공지능 알고리즘의 하나인 딥 러닝(deep learning)을 활용하여 기존 현장사진들을 기반으로 학습한 모델로 새롭게 주어지는 사진들을 사진에 담겨있는 공종에 따라서 자동으로 분류하는 시스템을 소개한다. 본 연구의 목적은 건설현장 사진에서 시각적으로 확인할 수 있는 공종을 기반으로 현장 사진을 분류하는 것이다. 그리고 이를 통해서 추가적으로 프로젝트에서 필요로 하는 과거의 이미지 데이터를 활용하기 편하게 하는 것에 최종적인 목적을 가지고 있다. 본 연구는 다음과 같이 진행되었다. 먼저 1 차적으로 실무자들을 통한 현장에서 직접 찍은 사진들을 먼저 수집하였고, 부족한 이미지들은 검색엔진을 통해서 보충하였다. 총 1,480 장의 현장 사진들을 활용하였고, 그 이후에 이 사진들을 분류하기 위해 공종 분류 기준을 정하였다. 분류 기준은 실질적으로 국내에서 적용될 수 있는 기준인 국내 기준으로 적용하였고 해당 기준에 따라서 16 개 카테고리에 사진을 분류해 데이터셋(dataset)을 구축하여 학습을 진행하였다. 적용한 알고리즘은 전이 학습(transfer Learning)을 기반으로 이미지넷(ImageNet) 을 사전 학습(pre-trained)한 모델들을 사용하였고, VGG16, VGG19, ResNet50, Inception V3, Inception-ResNet V2, MobileNets, Xception 을 사용하였다. 위 모델들을 비교평가 하기 위해서 데이터셋 이미지를 3:1 로 나누어 전체 이미지의 75%는 학습(training)에, 나머지 25%는 테스트(test) 이미지로 활용하였다. 평가지표로는 정밀도(precision)와 재현율(recall), F1 점수(F1 score) 수치를 활용하였고, 그 수치가 가장 높은 모델에 한하여 정밀도-재현율 그래프(precision-recall graph)를 통해서 평균 정밀도(mAP: mean average precision)을 구해서 정량적인 분류기의 성능을 수치화 하였다. 결과는 MobileNets 모델을 기반으로 전이 학습을 시킨 분류 모델이 정밀도 83.4%, 재현율 82.4%, F1 점수 85.8%를 보이며 가장 좋은 성능을 보였다.트레이닝 모델 별로는, ResNet50 모델을 이용한 분류 모델이 45.6%의 F1 점수를 보이며 특별히 낮은 수치를 보였고, MobileNets 기반 모델을 포함한 그 외의 모델들은 모두 73% 이상의 F1 점수를 보이며 실 적용이 가능한 성능을 보였다. 이 연구가 가지는 의의는 딥 러닝을 활용해 건설 현장 사진을 사진의 내용에 기반하여 분류한 첫 연구라는 점에 있다. 또한, 이미지 데이터셋을 구성하는 기준을 제시함으로서 비교적 적은 양의 사진으로도 실제로 활용 가능한 성능의 분류 모델을 학습하였다는 점에서 기여점을 가지고 있다. 이후의 연구를 통해서 분류 성능이 상대적으로 낮은 공종에 대해서 보완을 하여 더 적합한 데이터셋을 구축할 것이고, 더 발전된 이미지 분류 알고리즘을 활용하고 더 풍부하고 다양한 분류 모델을 개발하는 것을 목표로 하고 있다.
건설현장에서 사진이란 시간이 흘러가면서 변하는 현장의 시각적인 데이터를 남기는 가장 간단하고 확실한 방법으로, 매 건설 프로젝트를 진행함에 따라서 현장의 관리자들은 수 많은 사진들을 찍고 관리하게 된다. 이렇게 찍은 사진들의 양은 시공 현장의 규모와 시공 품질에 따라 다르지만 공통적으로 수 천, 수 만장은 찍는 것이 일반적이다. 하지만 현장에서 발생하는 사진들은 전체적으로 데이터의 양이 크기 때문에 정리되지 않은 사진들로부터는 필요한 정보를 원하는 때 추출해서 활용하기가 쉽지 않다. 이로 인해 결국 이전 현장의 정리되지 않은 이미지 데이터를 추후의 프로젝트에서 다시 활용하는 것에는 상당한 불편함이 따르게 된다. 본 연구는 인공지능 알고리즘의 하나인 딥 러닝(deep learning)을 활용하여 기존 현장사진들을 기반으로 학습한 모델로 새롭게 주어지는 사진들을 사진에 담겨있는 공종에 따라서 자동으로 분류하는 시스템을 소개한다. 본 연구의 목적은 건설현장 사진에서 시각적으로 확인할 수 있는 공종을 기반으로 현장 사진을 분류하는 것이다. 그리고 이를 통해서 추가적으로 프로젝트에서 필요로 하는 과거의 이미지 데이터를 활용하기 편하게 하는 것에 최종적인 목적을 가지고 있다. 본 연구는 다음과 같이 진행되었다. 먼저 1 차적으로 실무자들을 통한 현장에서 직접 찍은 사진들을 먼저 수집하였고, 부족한 이미지들은 검색엔진을 통해서 보충하였다. 총 1,480 장의 현장 사진들을 활용하였고, 그 이후에 이 사진들을 분류하기 위해 공종 분류 기준을 정하였다. 분류 기준은 실질적으로 국내에서 적용될 수 있는 기준인 국내 기준으로 적용하였고 해당 기준에 따라서 16 개 카테고리에 사진을 분류해 데이터셋(dataset)을 구축하여 학습을 진행하였다. 적용한 알고리즘은 전이 학습(transfer Learning)을 기반으로 이미지넷(ImageNet) 을 사전 학습(pre-trained)한 모델들을 사용하였고, VGG16, VGG19, ResNet50, Inception V3, Inception-ResNet V2, MobileNets, Xception 을 사용하였다. 위 모델들을 비교평가 하기 위해서 데이터셋 이미지를 3:1 로 나누어 전체 이미지의 75%는 학습(training)에, 나머지 25%는 테스트(test) 이미지로 활용하였다. 평가지표로는 정밀도(precision)와 재현율(recall), F1 점수(F1 score) 수치를 활용하였고, 그 수치가 가장 높은 모델에 한하여 정밀도-재현율 그래프(precision-recall graph)를 통해서 평균 정밀도(mAP: mean average precision)을 구해서 정량적인 분류기의 성능을 수치화 하였다. 결과는 MobileNets 모델을 기반으로 전이 학습을 시킨 분류 모델이 정밀도 83.4%, 재현율 82.4%, F1 점수 85.8%를 보이며 가장 좋은 성능을 보였다.트레이닝 모델 별로는, ResNet50 모델을 이용한 분류 모델이 45.6%의 F1 점수를 보이며 특별히 낮은 수치를 보였고, MobileNets 기반 모델을 포함한 그 외의 모델들은 모두 73% 이상의 F1 점수를 보이며 실 적용이 가능한 성능을 보였다. 이 연구가 가지는 의의는 딥 러닝을 활용해 건설 현장 사진을 사진의 내용에 기반하여 분류한 첫 연구라는 점에 있다. 또한, 이미지 데이터셋을 구성하는 기준을 제시함으로서 비교적 적은 양의 사진으로도 실제로 활용 가능한 성능의 분류 모델을 학습하였다는 점에서 기여점을 가지고 있다. 이후의 연구를 통해서 분류 성능이 상대적으로 낮은 공종에 대해서 보완을 하여 더 적합한 데이터셋을 구축할 것이고, 더 발전된 이미지 분류 알고리즘을 활용하고 더 풍부하고 다양한 분류 모델을 개발하는 것을 목표로 하고 있다.
주제어
#건설 Documentation 자동화 이미지 분류 딥 러닝 Automated construction documentation Image classification Deep learning
학위논문 정보
저자
길대영
학위수여기관
연세대학교 대학원
학위구분
국내석사
학과
건축공학과
지도교수
이강
발행연도
2019
총페이지
vii, 92장, x
키워드
건설 Documentation 자동화 이미지 분류 딥 러닝 Automated construction documentation Image classification Deep learning
※ AI-Helper는 부적절한 답변을 할 수 있습니다.