지하수는 지구 내의 민물 구성 중 94%를 차지하고 있으며 우리 생활에서 밀접하게 연관되어 있다. 지하수는 인구수의 증가로 인한 생활, 농업용수의 사용량과 기술 발전으로 인한 공업용수의 사용량이 점차 증가하는 추세를 보이고 있어, 지하수의 고갈로 인한 피해는 전세계적으로 나타나고 있다. 지하수가 고갈되면 물 부족, 지하수의 불순물 농도의 높아짐, 지반 침하, 지하수에 대량의 염분이 공급되어 생활용수로 사용을 못하는 등 우리 생활에 다양한 피해를 끼치고 있다. 이에 따른 지하수 고갈, 지반침하 등을 예방하고 지속 가능한 수자원을 위해 지하수위를 예측하는 것은 매우 중요하다. 이에 본 연구는 딥러닝을 이용하여 지하수위를 예측한다. 취득한 지하수위는 경상남도 밀양시 하남읍 대평리의 관측정(http://www.gims.go.kr)에서 측정한 지하수 높이이며 지하수위의 변수 요인으로는 기온, 강수량, 습도, ...
지하수는 지구 내의 민물 구성 중 94%를 차지하고 있으며 우리 생활에서 밀접하게 연관되어 있다. 지하수는 인구수의 증가로 인한 생활, 농업용수의 사용량과 기술 발전으로 인한 공업용수의 사용량이 점차 증가하는 추세를 보이고 있어, 지하수의 고갈로 인한 피해는 전세계적으로 나타나고 있다. 지하수가 고갈되면 물 부족, 지하수의 불순물 농도의 높아짐, 지반 침하, 지하수에 대량의 염분이 공급되어 생활용수로 사용을 못하는 등 우리 생활에 다양한 피해를 끼치고 있다. 이에 따른 지하수 고갈, 지반침하 등을 예방하고 지속 가능한 수자원을 위해 지하수위를 예측하는 것은 매우 중요하다. 이에 본 연구는 딥러닝을 이용하여 지하수위를 예측한다. 취득한 지하수위는 경상남도 밀양시 하남읍 대평리의 관측정(http://www.gims.go.kr)에서 측정한 지하수 높이이며 지하수위의 변수 요인으로는 기온, 강수량, 습도, 일조시간으로 선택하였고, 1년 전 지하수위를 포함하여 변수로 선정하였다. 지하수위의 예측을 위해 국가지하수정보센터의 국가지하수관측망에서 지하수위 데이터를 취득하고 기상데이터를 변수로 사용하기 위해 기상청에서 CSV(Comma-separated values)파일로 데이터를 취득 한다. 취득한 데이터를 병합하고 정규화를 적용하고, 모델을 학습하고 성능을 평가하기 위해 학습, 시험 데이터로 분할한다. 학습 데이터는 학습 데이터는 2009년부터 2015년까지 데이터를 지정하였고, 시험 데이터는 2016부터 2018년까지 지정하였다. 학습 데이터는 모델을 학습하기 위해 사용하고, 시험 데이터는 모델의 예측 성능을 평가하기 위해 사용한다. 본 연구는 학습 데이터를 이용하여 모델을 훈련시킨 후, 최적화 과정을 거친 다음 시험 데이터를 이용하여 예측한다. 각 모델의 성능을 평가하기 위해 오차 측정 방법인 RMSE(Root mean square error)와 COR(Correlation)을 사용하여 모델의 성능을 평가한다. 모델은 MLP(Multi layer perceptron), CNN(Convolution neural network), RNN(Recurrent neural network), LSTM(Long short term memory), GRU(Gate recurrent units)의 알고리즘을 이용하였다. 각 알고리즘의 특징이 달라 적용 분야와 데이터의 특징에 따라 성능이 다르다는 문제가 있어, 다양한 알고리즘을 사용하여 모델을 다양하게 구성하여 최적의 모델을 선정해야 한다. 본 논문은 단일 모델과 다중 모델로 구분하여 다양하게 모델을 구성하였다. 예측 결과 단일 모델 중에서 RMSE가 가장 낮은 모델은 CNN 알고리즘으로 이루어진 모델이 가장 낮게 나왔으며 RNN 알고리즘으로 이루어진 모델의 RMSE와 0.005 차이를 보였다. COR이 가장 높게 나온 모델은 GRU로 이루어진 모델이 가장 높게 나왔다. 다중 모델 중 RMSE가 가장 낮게 나온 모델은 GRU+MLP 알고리즘으로 이루어진 모델이며, RMSE가 0.958로 단일, 다중 모델 전체를 통틀어서 가장 낮게 나왔고 COR 또한 0.961로 가장 높게 나왔다. 이에 예측 결과를 세밀하게 분석하기 위해 지하수위와 오차가 가장 낮게 측정된 GRU+MLP 모델의 예측 결과값을 추세, 계절성, 잔류로 분해하여 비교하였다. 예측값의 추세는 2009년부터 지하수위 추세와의 오차가 크게 측정되었고, 2012년 이후 오차가 낮게 측정되다가 2016년 이후 오차가 크게 측정된 것을 확인할 수 있다. 예측값의 계절성은 상승과 하강 구간에는 지하수위의 계절성과 오차가 낮았으며, 상승에서 하강, 하강에서 상승할 때의 지하수위의 오차가 높았다. 사계절로 오차를 측정하였을 때, 가을과 겨울의 오차가 가장 높았다. 겨울은 지하수위가 가장 낮은 시기에 해당한다. 지하수위가 특정 지점에서 높아지거나 낮아지면 발견하지 못한 지하수위의 변수가 있으며, 지하수위가 가장 높고 낮은 시기인 가을철과 겨울철에 오차가 높은 것으로 판단된다. 잔류는 강수량에 의한 변화와 인위적인 요인 등의 많은 변수들이 존재하기에 추세와 계절성에 비해 오차가 높은 것으로 판단된다.
지하수는 지구 내의 민물 구성 중 94%를 차지하고 있으며 우리 생활에서 밀접하게 연관되어 있다. 지하수는 인구수의 증가로 인한 생활, 농업용수의 사용량과 기술 발전으로 인한 공업용수의 사용량이 점차 증가하는 추세를 보이고 있어, 지하수의 고갈로 인한 피해는 전세계적으로 나타나고 있다. 지하수가 고갈되면 물 부족, 지하수의 불순물 농도의 높아짐, 지반 침하, 지하수에 대량의 염분이 공급되어 생활용수로 사용을 못하는 등 우리 생활에 다양한 피해를 끼치고 있다. 이에 따른 지하수 고갈, 지반침하 등을 예방하고 지속 가능한 수자원을 위해 지하수위를 예측하는 것은 매우 중요하다. 이에 본 연구는 딥러닝을 이용하여 지하수위를 예측한다. 취득한 지하수위는 경상남도 밀양시 하남읍 대평리의 관측정(http://www.gims.go.kr)에서 측정한 지하수 높이이며 지하수위의 변수 요인으로는 기온, 강수량, 습도, 일조시간으로 선택하였고, 1년 전 지하수위를 포함하여 변수로 선정하였다. 지하수위의 예측을 위해 국가지하수정보센터의 국가지하수관측망에서 지하수위 데이터를 취득하고 기상데이터를 변수로 사용하기 위해 기상청에서 CSV(Comma-separated values)파일로 데이터를 취득 한다. 취득한 데이터를 병합하고 정규화를 적용하고, 모델을 학습하고 성능을 평가하기 위해 학습, 시험 데이터로 분할한다. 학습 데이터는 학습 데이터는 2009년부터 2015년까지 데이터를 지정하였고, 시험 데이터는 2016부터 2018년까지 지정하였다. 학습 데이터는 모델을 학습하기 위해 사용하고, 시험 데이터는 모델의 예측 성능을 평가하기 위해 사용한다. 본 연구는 학습 데이터를 이용하여 모델을 훈련시킨 후, 최적화 과정을 거친 다음 시험 데이터를 이용하여 예측한다. 각 모델의 성능을 평가하기 위해 오차 측정 방법인 RMSE(Root mean square error)와 COR(Correlation)을 사용하여 모델의 성능을 평가한다. 모델은 MLP(Multi layer perceptron), CNN(Convolution neural network), RNN(Recurrent neural network), LSTM(Long short term memory), GRU(Gate recurrent units)의 알고리즘을 이용하였다. 각 알고리즘의 특징이 달라 적용 분야와 데이터의 특징에 따라 성능이 다르다는 문제가 있어, 다양한 알고리즘을 사용하여 모델을 다양하게 구성하여 최적의 모델을 선정해야 한다. 본 논문은 단일 모델과 다중 모델로 구분하여 다양하게 모델을 구성하였다. 예측 결과 단일 모델 중에서 RMSE가 가장 낮은 모델은 CNN 알고리즘으로 이루어진 모델이 가장 낮게 나왔으며 RNN 알고리즘으로 이루어진 모델의 RMSE와 0.005 차이를 보였다. COR이 가장 높게 나온 모델은 GRU로 이루어진 모델이 가장 높게 나왔다. 다중 모델 중 RMSE가 가장 낮게 나온 모델은 GRU+MLP 알고리즘으로 이루어진 모델이며, RMSE가 0.958로 단일, 다중 모델 전체를 통틀어서 가장 낮게 나왔고 COR 또한 0.961로 가장 높게 나왔다. 이에 예측 결과를 세밀하게 분석하기 위해 지하수위와 오차가 가장 낮게 측정된 GRU+MLP 모델의 예측 결과값을 추세, 계절성, 잔류로 분해하여 비교하였다. 예측값의 추세는 2009년부터 지하수위 추세와의 오차가 크게 측정되었고, 2012년 이후 오차가 낮게 측정되다가 2016년 이후 오차가 크게 측정된 것을 확인할 수 있다. 예측값의 계절성은 상승과 하강 구간에는 지하수위의 계절성과 오차가 낮았으며, 상승에서 하강, 하강에서 상승할 때의 지하수위의 오차가 높았다. 사계절로 오차를 측정하였을 때, 가을과 겨울의 오차가 가장 높았다. 겨울은 지하수위가 가장 낮은 시기에 해당한다. 지하수위가 특정 지점에서 높아지거나 낮아지면 발견하지 못한 지하수위의 변수가 있으며, 지하수위가 가장 높고 낮은 시기인 가을철과 겨울철에 오차가 높은 것으로 판단된다. 잔류는 강수량에 의한 변화와 인위적인 요인 등의 많은 변수들이 존재하기에 추세와 계절성에 비해 오차가 높은 것으로 판단된다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.