[논문]딥러닝 기반 LSTM 모형을 이용한 감조하천 수위 예측

정성호; 조효섭; 김정엽; 이기하

doi:10.3741/jkwra.2018.51.12.1207

딥러닝 기반 LSTM 모형을 이용한 감조하천 수위 예측
Prediction of water level in a tidal river using a deep-learning based LSTM model 원문보기

Journal of Korea Water Resources Association = 한국수자원학회논문집, v.51 no.12, 2018년, pp.1207 - 1216

정성호 (경북대학교 과학기술대학 건설방재공학과) , 조효섭 (환경부 한강홍수통제소 수자원정보센터) , 김정엽 (환경부 한강홍수통제소 수자원정보센터) , 이기하 (경북대학교 과학기술대학 건설방재공학과)

초록
AI-Helper

본 연구는 물리적 수리 수문모형의 적용이 제한적인 감조하천에서의 수위예측을 목적으로 하고 있으며, 이를 위해 한강 잠수교를 대상으로 딥러닝 오픈소스 소프트웨어 라이브러리인 TensorFlow를 활용하여 LSTM 모형을 구성하고 2011년부터 2017년까지의 10분 단위의 잠수교 수위, 팔당댐 방류량과 한강하구 강화대교지점의 예측조위 자료를 이용하여 모형학습(2011~2016) 및 수위예측(2017)을 수행하였다. 모형 매개변수는 민감도 분석을 통해 은닉층의 개수는 6개, 학습속도는 0.01, 학습횟수는 3000번로 결정하였으며, 모형 학습 시 학습정보의 시간적 양을 결정하는 중요한 매개변수인 시퀀스길이는 1시간, 3시간, 6시간으로 변화시키며 모의하였다. 최종적으로 선행시간에 따른 모의 예측능력을 평가하기 위해 LSTM 모형의 예측 선행시간을 6개(1 ~ 24시간)로 구분하여 실측수위와 예측수위와의 비교 분석을 수행한 결과, LSTM 모형의 최적의 성능을 내는 결과는 시퀀스길이를 1시간으로 하였을 때로 분석되었으며, 특히 선행시간 1시간에 대한 예측정확도는 RMSE는 0.065 m, NSE는 0.99로 실측수위에 매우 근접한 예측 결과를 나타내었다. 또한 시퀀스길이에 상관없이 선행시간이 길어질수록 모형의 예측 정확도는 2017년 전기간에 걸쳐 평균적으로 RMSE 0.08 m에서 0.28 m로 오차가 증가하였으며, NSE는 0.99에서 0.74로 감소하였다.

Abstract ▼ AI-Helper

Discharge or water level predictions at tidally affected river reaches are currently still a great challenge in hydrological practices. This research aims to predict water level of the tide dominated site, Jamsu bridge in the Han River downstream. Physics-based hydrodynamic approaches are sometimes not applicable for water level prediction in such a tidal river due to uncertainty sources like rainfall forecasting data. In this study, TensorFlow deep learning framework was used to build a deep neural network based LSTM model and its applications. The LSTM model was trained based on 3 data sets having 10-min temporal resolution: Paldang dam release, Jamsu bridge water level, predicted tidal level for 6 years (2011~2016) and then predict the water level time series given the six lead times: 1, 3, 6, 9, 12, 24 hours. The optimal hyper-parameters of LSTM model were set up as follows: 6 hidden layers number, 0.01 learning rate, 3000 iterations. In addition, we changed the key parameter of LSTM model, sequence length, ranging from 1 to 6 hours to test its affect to prediction results. The LSTM model with the 1 hr sequence length led to the best performing prediction results for the all cases. In particular, it resulted in very accurate prediction: RMSE (0.065 cm) and NSE (0.99) for the 1 hr lead time prediction case. However, as the lead time became longer, the RMSE increased from 0.08 m (1 hr lead time) to 0.28 m (24 hrs lead time) and the NSE decreased from 0.99 (1 hr lead time) to 0.74 (24 hrs lead time), respectively.

주제어

표/그림 (10)

그림 Fig. 1. Recurrent neural network structure (Geron, 2017)
그림 Fig. 2. LSTM Structure (Greff, 2017)
그림 Fig. 3. Jamsu bridge location
그림 Fig. 4. Time series of water level at the jamsu bridge in 2017
그림 Fig. 5. Time series data sets for LSTM applications
그림 Fig. 6. Water level time series and scatter plots for lead time of 1 hr ~ 6 hrs
표 Table 1. RMSE results of different sequence length cases
표 Table 2. NSE results of different sequence length cases
그림 Fig. 7. Water level time series and scatter plots for lead time of 9 hrs ~ 24 hrs
그림 Fig. 8. Comparison of water levels for the specific rainfall events

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

본 연구는 물리적 수리·수문모형의 적용이 제한적인 조위 영향을 받는 감조하천에서의 수위예측을 목적으로 하고 있으며,이를 위해 한강 잠수교를 대상으로 딥러닝 오픈소스 소프트웨어 라이브러리인 TensorFlow를 활용하여 LSTM 모형을 구성하고 2011년부터 2017년까지의 10분 단위의 잠수교 수위, 팔당댐 방류량과 한강하구 강화대교지점의 예측조위 자료를 이용하여 수위예측을 수행하였다.
본 연구에서는 심층신경망 구조의 LSTM모형을 구축하여 감조하천에서 조위영향에 따른 한강 잠수교의 수위예측을 수행하고 선행시간(lead time)별 예측 정확도를 분석하는 것을 목적으로 한다. Fig.
본 연구에서는 심층신경망(deep neural network) 구조를 갖는 딥러닝 기반의 순환신경망(recurrent neural network, RNN) 모형을 구축하여 한강 잠수교의 수위예측을 수행하고 선행시간에 따른 예측 정확도를 분석한다. 이를 위해 RNN은 구글에서 개발하고 배포한 딥러닝 오픈소스 소프트웨어 라이브러인 TensorFlow (https://www.

제안 방법

org)의 LSTM 알고리즘을 적용하며, LSTM 기반의 신경망 모형의 학습과 검증을 위해 총 7년 기간(2011 ~2017년)의 10분 단위 잠수교 수위자료, 팔당댐 방류량과 강화대교의 예측 조위자료를 활용한다. 2011년부터2016년까지의 자료는 LSTM 모형의 학습(training), 2017년 자료는 LSTM 모형의 검증(validation)에 활용하고, 민감도 분석(sensitivity analysis)을 통해 LSTM 모형의 최적 매개변수(optimal hyper-parameters)를 추정하여 선행시간 1시간, 3시간, 6시간, 9시간, 12시간, 24시간(6 Cases)에 대한 잠수교 수위를 예측하고 그 정확도를 분석한다.
본 연구는 물리적 수리·수문모형의 적용이 제한적인 조위 영향을 받는 감조하천에서의 수위예측을 목적으로 하고 있으며,이를 위해 한강 잠수교를 대상으로 딥러닝 오픈소스 소프트웨어 라이브러리인 TensorFlow를 활용하여 LSTM 모형을 구성하고 2011년부터 2017년까지의 10분 단위의 잠수교 수위, 팔당댐 방류량과 한강하구 강화대교지점의 예측조위 자료를 이용하여 수위예측을 수행하였다. 모형 매개변수는 민감도 분석을 통해 은닉층의 개수는 6개, 학습속도는 0.01, 학습횟수는 3000번로 결정하였으며, 모형 학습 시 학습정보의 시간적 양을 결정하는 중요한 매개변수인 시퀀스길이는 1시간, 3시간, 6시간으로 변화시키며 모의하였다. 최종적으로 선행시간에 따른 모의예측능력을 평가하기 위해 LSTM 모형의 예측 선행시간을 6개(1 ~ 24시간)로 구분하여 실측수위와 예측수위와의 비교·분석을 수행한 후, 다음과 같은 결과를 도출하였다.
본 연구에서는 2011년부터 2016년의 자료는 신경망 학습을 위해 활용하고 2017년은 검증 및 시험데이터로 활용하여 예측 정확도를 비교·분석한다.
우선, MinMaxscaler 변환을 이용하여 Fig. 5의 시계열 자료를 정규화(normalization) 하였으며, 학습에 사용되는 입력데이터의 길이를 조정하는 시퀀스길이(sequence_length)는 1시간(t-5 ~ t), 3시간(t-17 ~ t), 6시간(t-35 ~ t)으로 변화하며신경망 학습을 수행하였다. 즉, 기본자료가 10분단위로 구성되어 있기 때문에 현재시간이 t일 때 시퀀스길이가 6일 경우t-5 ~ t까지 60분(1시간) 자료가 학습으로 활용, 시퀀스길이가 18일 경우 t-17 ~ t까지 180분(3시간) 자료가 학습에 활용됨을 의미한다.
전술한 바와 같이 본 연구에서는 강우자료 및 지류 유입량 등 수문기상 정보를 배제하고, 10분단위의 각 잠수교의 수위 자료와 팔당댐의 방류량 자료 및 강화대교의 예측조위 세 가지 최소한의 자료만을 사용하여 LSTM 모형을 학습하고, 6개의 선행시간(1, 3, 6, 9, 12, 24시간)에 대한 잠수교 수위를 예측하고 그 성능을 평가하였다.
최종적으로 선행시간에 따른 모의예측능력을 평가하기 위해 LSTM 모형의 예측 선행시간을 6개(1 ~ 24시간)로 구분하여 실측수위와 예측수위와의 비교·분석을 수행한 후, 다음과 같은 결과를 도출하였다.

대상 데이터

본 연구에서는 심층신경망 구조의 LSTM모형을 구축하여 감조하천에서 조위영향에 따른 한강 잠수교의 수위예측을 수행하고 선행시간(lead time)별 예측 정확도를 분석하는 것을 목적으로 한다. Fig. 5는 LSTM 모형의 학습과 예측을 위해 사용되는 2011년부터 2017년 11월 30일까지의 10분단위의 팔당댐의 방류량과 한강하구의 강화대교의 예측조위 및 잠수교의 수위 시계열 자료이다. 본 연구에서는 2011년부터 2016년의 자료는 신경망 학습을 위해 활용하고 2017년은 검증 및 시험데이터로 활용하여 예측 정확도를 비교·분석한다.

데이터처리

또한 민감도 분석을 통해 학습속도(learning_rate)는 0.01, 반복시행횟수(iteration)는 3000번, 은닉층 개수는 6으로 구성하였으며, 이상의 LSTM 모형 매개변수에 따른 선행시간 1시간(t+6), 3시간(t+18), 6시간(t+36), 9시간(t+54),12시간(t+72), 24시간(t+144)의 잠수교 수위예측을 수행하고, 예측정확도의 정량화를 위해 RMSE (Root Mean SquareError)와 NSE (Nash-Sutcliffe Efficiency) 두 개의 평가지수를 사용하여 비교·분석하였다.

이론/모형

본 연구에서는 구글의 브레인 프로젝트팀에서 개발하여 공개이후 많은 프로그램 개발자, 연구자들이 사용하고 있으며, 개발진들과 전세계적 온·오프라인 피드백을 통해 지속적으로 업그레이드 되고 있는 딥러닝 오픈 프레임워크인 TensorFlow(https://www.tensorflow.org/)를 사용한다.
본 연구에서는 심층신경망(deep neural network) 구조를 갖는 딥러닝 기반의 순환신경망(recurrent neural network, RNN) 모형을 구축하여 한강 잠수교의 수위예측을 수행하고 선행시간에 따른 예측 정확도를 분석한다. 이를 위해 RNN은 구글에서 개발하고 배포한 딥러닝 오픈소스 소프트웨어 라이브러인 TensorFlow (https://www.TensorFlow.org)의 LSTM 알고리즘을 적용하며, LSTM 기반의 신경망 모형의 학습과 검증을 위해 총 7년 기간(2011 ~2017년)의 10분 단위 잠수교 수위자료, 팔당댐 방류량과 강화대교의 예측 조위자료를 활용한다. 2011년부터2016년까지의 자료는 LSTM 모형의 학습(training), 2017년 자료는 LSTM 모형의 검증(validation)에 활용하고, 민감도 분석(sensitivity analysis)을 통해 LSTM 모형의 최적 매개변수(optimal hyper-parameters)를 추정하여 선행시간 1시간, 3시간, 6시간, 9시간, 12시간, 24시간(6 Cases)에 대한 잠수교 수위를 예측하고 그 정확도를 분석한다.

성능/효과

Figs. 6 and 7은 시퀀스길이 1시간(t-5 ~ t)의 LSTM 모형을 이용한 선행시간별 2017년 잠수교 수위 예측결과를 나타내고 있으며, 수위비교 결과에서도 나타났듯이 선행시간이 짧을수록 2017년 예측기간에 대해 저수위뿐만 아니라 고수위까지 안정적으로 예측하는 것을 확인할 수 있다. 반면에 선행시간이 길어질수록 수위의 시간적 패턴은 유사하게 모의하고 있으나 우측 산포도에서 볼 수 있듯이 중고수위에서 실측수위의 오차가 크게 발생하는 것을 확인할 수 있다.
Tables 1 and 2는 LSTM 모형의 각 시퀀스길이에 따른 RMSE와 NSE 분석결과를 나타내고 있다. 그 결과, 학습에 사용되는 시퀀스길이가 길어질수록 전반적으로 예측 정확도는 낮아지고 있으나 12시간 및 24시간 예측 결과는 유사하거나 미세하게 향상되는 것으로 나타났다.
99로 실측수위에 매우 근접한 예측 결과를 나타내었다. 다만, 모형 학습 시 시퀀스길이가 길어질수록 전 기간에 걸쳐 동일한 선행시간에 대해 정확도가 미세하게 감소하는 것으로 나타났으며, 시퀀스길이에 상관없이 선행시간이 길어질수록 모형의 예측정확도는 평균적으로 RMSE 0.08 m에서 0.28 m로 오차가 증가하였으며, NSE는 0.99에서 0.74로 감소한 것으로 분석되었다.
둘째, 실제 홍수기기간 중 완전잠수(6.5 m)를 초과한 사상에 대한 분석한 결과, 7월 집중호우로 인한 사상에서는 선행시간 6시간이하의 경우에서는 첨두수위에 대해 어느 정도의 정확도가 확보되었으나 9시간이후에서는 첨두수위 및 전체적인 수위곡선이 과소모의된 것으로 분석되었다. 8월 사상의 경우 완전잠수가 발생한 첨두수위 전·후로 고수위가 지속되어 선행시간의 정보를 기억하여 학습에 반영하는 LSTM의 특성으로 7월에 비해 선행시간별 첨두수위 모의결과의 재현성이 높게 나타났으나 마찬가지로 선행시간 9시간이후의 경우, 수위곡선이 전반적으로 과소추정된 것으로 확인되었다.
또한, LSTM 모형의 선행시간이 길어질수록 평균적으로 RMSE는 0.08 m에서 0.28 m로 0.2 m 오차가 증가하였으며, NSE는 0.99에서 0.74로 모형의 예측 정확도가 감소하였다. 예측 정확도의 경우 시퀀스길이를 1시간으로 주었을 때 가장 높게 나타났으며, 이는 해당 선행시간에 대한 예측을 위해 LSTM 학습 진행 시 시퀀스길이를 선행시간과 동일하게 조정하는 것이 예측의 정확도를 보장하는 것은 아닌 것을 의미한다.
6 and 7은 시퀀스길이 1시간(t-5 ~ t)의 LSTM 모형을 이용한 선행시간별 2017년 잠수교 수위 예측결과를 나타내고 있으며, 수위비교 결과에서도 나타났듯이 선행시간이 짧을수록 2017년 예측기간에 대해 저수위뿐만 아니라 고수위까지 안정적으로 예측하는 것을 확인할 수 있다. 반면에 선행시간이 길어질수록 수위의 시간적 패턴은 유사하게 모의하고 있으나 우측 산포도에서 볼 수 있듯이 중고수위에서 실측수위의 오차가 크게 발생하는 것을 확인할 수 있다.
예측 정확도의 경우 시퀀스길이를 1시간으로 주었을 때 가장 높게 나타났으며, 이는 해당 선행시간에 대한 예측을 위해 LSTM 학습 진행 시 시퀀스길이를 선행시간과 동일하게 조정하는 것이 예측의 정확도를 보장하는 것은 아닌 것을 의미한다. 선행시간 1시간의 경우 RMSE는 0.065 m, NSE는 0.99로 매우 우수한 것으로 분석되었다.
74로 모형의 예측 정확도가 감소하였다. 예측 정확도의 경우 시퀀스길이를 1시간으로 주었을 때 가장 높게 나타났으며, 이는 해당 선행시간에 대한 예측을 위해 LSTM 학습 진행 시 시퀀스길이를 선행시간과 동일하게 조정하는 것이 예측의 정확도를 보장하는 것은 아닌 것을 의미한다. 선행시간 1시간의 경우 RMSE는 0.
첫째, LSTM 모형의 최적의 성능을 내는 결과는 시퀀스길이를 1시간(t-5 ~ t)으로 하였을 때로 분석되었으며, 특히 선행시간 1시간에 대한 예측정확도는 RMSE는 0.065 m, NSE는 0.99로 실측수위에 매우 근접한 예측 결과를 나타내었다. 다만, 모형 학습 시 시퀀스길이가 길어질수록 전 기간에 걸쳐 동일한 선행시간에 대해 정확도가 미세하게 감소하는 것으로 나타났으며, 시퀀스길이에 상관없이 선행시간이 길어질수록 모형의 예측정확도는 평균적으로 RMSE 0.

후속연구

이에 본 연구에서는 조위영향을 받는 감조하천에서의 수위예측을 위한 물리적 수리·수문모형기반 시스템의 보완적 수단으로 딥러닝 기반의 LSTM 모형을 제안하였으며, 향후 딥러닝 관련 알고리즘과 컴퓨팅 능력의 지속적인 향상으로 인하여 다양한 인자를 기반으로 하는 시계열 예측모의가 가능할 것으로 판단된다.
8월 사상의 경우 완전잠수가 발생한 첨두수위 전·후로 고수위가 지속되어 선행시간의 정보를 기억하여 학습에 반영하는 LSTM의 특성으로 7월에 비해 선행시간별 첨두수위 모의결과의 재현성이 높게 나타났으나 마찬가지로 선행시간 9시간이후의 경우, 수위곡선이 전반적으로 과소추정된 것으로 확인되었다. 일반적으로 수위예측을 위한 선행시간이 길어질수록 예측정확도가 감소하는 것을 확인하였으나 시계열 분석 시 현재시점을기준으로 과거의 자료가 어느 정도 구간까지 영향을 미치는지에 대한 자료구조의 시계열 특성(자기상관성 등)을 분석하고,LSTM의 중요 매개변수인 시퀀스 길이의 객관적인 설정을 위한 후속 연구가 필요하다.
이에 본 연구에서는 조위영향을 받는 감조하천에서의 수위예측을 위한 물리적 수리·수문모형기반 시스템의 보완적 수단으로 딥러닝 기반의 LSTM 모형을 제안하였으며, 향후 딥러닝 관련 알고리즘과 컴퓨팅 능력의 지속적인 향상으로 인하여 다양한 인자를 기반으로 하는 시계열 예측모의가 가능할 것으로 판단된다. 특히 한강하류부와 같이 자연적, 인위적 구속(regulated)을 동시에 받는 특정지점의 비선형 수문시계열 분석이 목적일 경우, 방대한 자료의 장기적인 정보를 기억하며 이를 조정하여 예측에 반영하는 LSTM 모형은 홍수예보뿐만 아니라 수문·기상학적 분석에서의 활용 및 응용이 가능할 것으로 판단된다.

질의응답

핵심어	질문	논문에서 추출한 답변
	인공신경망의 구조는 어떻게 구성되는가?	딥러닝의 기초가 되는 단일 인공신경망은 뇌세포의 뉴런의 동작을 흡사하게 구현하여 입력값(input data)에 대한 가중치(weight) 신호를 주어 정보를 전달하도록 만든 구조이다. 일반적으로 인공신경망의 구조는 입력층(input layer), 은닉층(hidden layer), 출력층(output layer)의 세 개의 층으로 구성되어 있으며, 입력층에서 은닉층을 통하여 출력층까지 각 층(layer)사이의 가중치를 순차적으로 업데이트하며 예측값과 실제값과의 오차를 최소화하면서 학습을 하는 신경망을 피드포워드신경망(feed forward neurual network FFNN)이라고 한다. 이러한 구조에서 2개 이상의 은닉층을 가지면 다층신경망, 그 이상일 경우를심층신경망(deep neural network) 또는 딥러닝으로 구분한다.
	단일 인공신경망은 무엇인가?	심층 학습을 뜻하는 딥러닝(deep learning)은 인공지능 분야에서 가장 많은 연구가 이루어지고 있으며 자연언어처리,음성 인식 및 이미지 인식 등의 연구에서 높은 정확도를 보이는 등 여러 분야에서 다양하게 쓰이고 있다. 딥러닝의 기초가 되는 단일 인공신경망은 뇌세포의 뉴런의 동작을 흡사하게 구현하여 입력값(input data)에 대한 가중치(weight) 신호를 주어 정보를 전달하도록 만든 구조이다. 일반적으로 인공신경망의 구조는 입력층(input layer), 은닉층(hidden layer), 출력층(output layer)의 세 개의 층으로 구성되어 있으며, 입력층에서 은닉층을 통하여 출력층까지 각 층(layer)사이의 가중치를 순차적으로 업데이트하며 예측값과 실제값과의 오차를 최소화하면서 학습을 하는 신경망을 피드포워드신경망(feed forward neurual network FFNN)이라고 한다.
	인공신경망 구조를 기반으로 다층신경망과 딥러닝을 구분하는 기준은 무엇인가?	일반적으로 인공신경망의 구조는 입력층(input layer), 은닉층(hidden layer), 출력층(output layer)의 세 개의 층으로 구성되어 있으며, 입력층에서 은닉층을 통하여 출력층까지 각 층(layer)사이의 가중치를 순차적으로 업데이트하며 예측값과 실제값과의 오차를 최소화하면서 학습을 하는 신경망을 피드포워드신경망(feed forward neurual network FFNN)이라고 한다. 이러한 구조에서 2개 이상의 은닉층을 가지면 다층신경망, 그 이상일 경우를심층신경망(deep neural network) 또는 딥러닝으로 구분한다. 그리고 딥러닝 기반 모형개발을 위한 다양한 오픈소스 프레임워크가 존재하며, 이러한 프레임워크는 여러 소프트웨어 라이브러리와 API (Application Programming Interface)를 지원함으로써 개발자로 하여금 모형 개발과 구현까지의 소요시간을 줄여줄 뿐만 아니라 성능향상에 도움을 준다.

저자의 다른 논문 :

LOADING...

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증