최근 수위 예측을 위한 개념적 기반, 수문학적, 물리적 기반 모형 등의 단점을 극복하고자 홍수예측을 위해 자료지향형 모형 중의 하나인 다중선형회귀 모형이 널리 도입되고 있다. 본 연구의 목적은 이러한 다중선형회귀 모형의 서로 다른 회귀계수 선정 방법에 따른 홍수예측 성능을 비교 검토하고 이를 통해 적절한 다중회귀 홍수예측 모형을 구축하는 것이다. 이를 위해 입력자료의 자기상관분석을 통해 독립변수의 시간 규모를 결정한 후 최소 자승법, 가중 최소 자승법, 단계별 선택법의 각기 다른 회귀계수 산정 방법을 이용한 홍수예측 모형을 구축하고 중랑천 유역의 다양한 홍수사상에 대해 적용하였다. 구축된 모형들의 성능을 평가하기 위해 평균제곱근오차, Nash-Suttcliffe 효율계수, 평균절대오차, 수정 결정계수와 같이 4개의 통계지표들을 사용하였다. 모의결과 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 가장 정확한 예측 결과를 보였고, 최소자승법을 이용한 홍수예측 모형이 가중 최소자승법을 이용한 홍수예측 모형보다 좀 더 나은 예측 결과를 나타냈다.
최근 수위 예측을 위한 개념적 기반, 수문학적, 물리적 기반 모형 등의 단점을 극복하고자 홍수예측을 위해 자료지향형 모형 중의 하나인 다중선형회귀 모형이 널리 도입되고 있다. 본 연구의 목적은 이러한 다중선형회귀 모형의 서로 다른 회귀계수 선정 방법에 따른 홍수예측 성능을 비교 검토하고 이를 통해 적절한 다중회귀 홍수예측 모형을 구축하는 것이다. 이를 위해 입력자료의 자기상관분석을 통해 독립변수의 시간 규모를 결정한 후 최소 자승법, 가중 최소 자승법, 단계별 선택법의 각기 다른 회귀계수 산정 방법을 이용한 홍수예측 모형을 구축하고 중랑천 유역의 다양한 홍수사상에 대해 적용하였다. 구축된 모형들의 성능을 평가하기 위해 평균제곱근오차, Nash-Suttcliffe 효율계수, 평균절대오차, 수정 결정계수와 같이 4개의 통계지표들을 사용하였다. 모의결과 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 가장 정확한 예측 결과를 보였고, 최소자승법을 이용한 홍수예측 모형이 가중 최소자승법을 이용한 홍수예측 모형보다 좀 더 나은 예측 결과를 나타냈다.
Recently to overcome limitations of conceptual, hydrological and physics based models for flood stage forecasting, multiple linear regression model as one of data-driven models have been widely adopted for forecasting flood streamflow(stage). The objectives of this study are to compare performance o...
Recently to overcome limitations of conceptual, hydrological and physics based models for flood stage forecasting, multiple linear regression model as one of data-driven models have been widely adopted for forecasting flood streamflow(stage). The objectives of this study are to compare performance of different multiple linear regression models according to regression coefficient estimation methods and determine most effective multiple linear regression flood stage forecasting models. To do this, the time scale was determined through the autocorrelation analysis of input data and different flood stage forecasting models developed using regression coefficient estimation methods such as LS(least square), WLS(weighted least square), SPW(stepwise) was applied to flood events in Jungrang stream. To evaluate performance of established models, fours statistical indices were used, namely; Root mean square error(RMSE), Nash Sutcliffe efficiency coefficient (NSEC), mean absolute error (MAE), adjusted coefficient of determination($R^{*2}$). The results show that the flood stage forecasting model using SPW(stepwise) parameter estimation can carry out the river flood stage prediction better in comparison with others, and the flood stage forecasting model using LS(least square) parameter estimation is also found to be slightly better than the flood stage forecasting model using WLS(weighted least square) parameter estimation.
Recently to overcome limitations of conceptual, hydrological and physics based models for flood stage forecasting, multiple linear regression model as one of data-driven models have been widely adopted for forecasting flood streamflow(stage). The objectives of this study are to compare performance of different multiple linear regression models according to regression coefficient estimation methods and determine most effective multiple linear regression flood stage forecasting models. To do this, the time scale was determined through the autocorrelation analysis of input data and different flood stage forecasting models developed using regression coefficient estimation methods such as LS(least square), WLS(weighted least square), SPW(stepwise) was applied to flood events in Jungrang stream. To evaluate performance of established models, fours statistical indices were used, namely; Root mean square error(RMSE), Nash Sutcliffe efficiency coefficient (NSEC), mean absolute error (MAE), adjusted coefficient of determination($R^{*2}$). The results show that the flood stage forecasting model using SPW(stepwise) parameter estimation can carry out the river flood stage prediction better in comparison with others, and the flood stage forecasting model using LS(least square) parameter estimation is also found to be slightly better than the flood stage forecasting model using WLS(weighted least square) parameter estimation.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 기존의 개념적, 수문학적, 물리적 기반 모형 등의 단점을 극복하고자 최근 수위 예측을 위해 널리 사용되고 있는 자료지향형 모형 중의 하나인 다중선형회귀 모형의 회귀계수 선정 방법에 따른 홍수예측 모형을 구축하고 모의 결과를 비교·검토하였다.
회귀식의 형태를 선정하는 것은 회귀모형 구축시 중요한 사항이다. 이에 본 연구에서는 잔차와 독립변수간의 산포도를 통하여 회귀식 선정을 검토하였다. 본래 잔차와 독립변수의 산포도에서는 어떠한 경향도 보이지 않는 것이 바람직하다(노형진과 정한열, 2001).
가설 설정
H1:적어도 한 개 이상의 βi는 0이 아니다.
제안 방법
2. 독립변수의 시간 규모를 결정한 후 최소 자승법, 가중 최소 자승법, 단계별 선택법의 각기 다른 회귀계수 산정 방법을 이용한 다중선형회귀 홍수예측 모형을 구축하였다.이를 위해 각 모형의 구축단계에서 모형의 유의성을 검토하기 위해 분산분석을 통한 회귀성 검정을 수행하고 개별 회귀계수에 대한 t-검정을 수행하여 모형을 구축하고 중랑천 유역의 다양한 홍수사상에 대해 적용하였다.
선정된 기간의 호우 사상의 대상 유역에 대한 5개의 강우 관측소의 강우자료와 중랑교 수위관측소의 수위를 사용하였다. 강우자료는 대상 유역의 5개의 강우관측소로부터 얻어진 각각의 강우량으로부터 유역의 평균 강우량을 산정하여 사용하였다. 중랑천 유역은 총 유역면적 296.
계별 선택법을 통해 독립변수가 종속변수의 예측에 기여 하는지를 판단하여 독립변수의 추가와 제거를 수행하였고 이를 통해 다중선형회귀 홍수예측 모형을 구축하였다. 표 5는 각 선행 예측시간별 홍수예측 모형의 회귀계수 산정결과와 각 독립변수의 개별회귀계수 t-검정 값을 나타내고 있다.
구축된 각각의 다중선형회귀 홍수예측 모형을 이용하여 홍수예측을 수행하였다. 표 8은 Training 과정을 통해 구축된 각각의 다중선형회귀 홍수예측 모형을 이용한 모형의 테스트 결과 중 30분과 180분 선행시간의 통계지표를 나타내고 있다.
따라서 본 연구에서는 효율적인 홍수예측 모형 구축을 위해 입력자료의 자기상관분석을 통해 입력자료의 시간적 규모를 결정한 후 각기 다른 회귀계수 산정 방법을 이용한 홍수예측 모형을 구축하고 홍수예측 결과를 비교·검토하였다.
그림 2는 30분 간격의 수위 시계열의 12차 자기상관분석을 통해 계산된 자기상관계수 값을 자기상관함수(Autocorrelation function)로 표현한 것이다. 본 연구에서는 대상 유역인 중랑천의 규모를 고려하여 최대 선행 예측 시간을 3시간, 즉 t+6으로 결정하였다. 시간 규모 결정을 위한 자기상관계수 값을 0.
단계별 선택법에 의해 모형 선택을 할 때에는 두 가지 종류의 검정을 실시하여야 한다. 즉, 전진선택법에서 사용하였던 변수를 추가할 것인지를 대한 검정과 후진소거법에서의 검정인 변수 를 제거할 것인지에 대한 검정을 필요로 한다. 단계별 선택법을 사용할 때 변수선택의 기준은 다음과 같다.
표 5는 각 선행 예측시간별 홍수예측 모형의 회귀계수 산정결과와 각 독립변수의 개별회귀계수 t-검정 값을 나타내고 있다. 표에서 보는 바와 같이 30분 예측 모형의 경우 독립변수의 추가 및 제거과정을 통해 최종적으로 H(t-2), H(t-3), H(t-4)의 독립변수들이 제거된 상태로 홍수예측 모형이 구축되었고 60분 예측 모형의 경우에는 R(t-4)와 H(t-4)의 독립변수들이 제거된 상태로 홍수예측 모형이 구축되었다.표 6에서 보는 바와 같이 30분 후의 홍수예측 모형은 식 (20)와 같이 표현됨을 알 수 있다.
회귀분석 결과와 최소자승법을 이용한 회귀계수 산정 방법을 통해 다중선형회귀 홍수예측 모형을 구축하였다. 표 4는 각 선행 예측시간별 홍수예측 모형의 회귀계수 산정결과와 각 독립변수의 개별회귀계수 t-검정 값을 나타내고 있다.
대상 데이터
유역의 평균 강우량은 각 강우관측소에서 측정된 값을 티센법을 이용하여 면적가중치를 주어 유역전체의 평균값으로 사용하였다. 다중선형회귀 홍수예측 모형을 개발을 위한 training 자료로 2002년~2003년의 9개 호우사상을 사용하였고 2004년과 2005년의 8개 호우사상 중 4개를 test를 위한 자료로 나머지 4개의 호우사상을 모형의 검증을 위해 사용하였다. 모형의 구축을 위한 수위와 강우자료는 30분 관측자료를 사용하였다.
다중선형회귀 홍수예측 모형을 개발을 위한 training 자료로 2002년~2003년의 9개 호우사상을 사용하였고 2004년과 2005년의 8개 호우사상 중 4개를 test를 위한 자료로 나머지 4개의 호우사상을 모형의 검증을 위해 사용하였다. 모형의 구축을 위한 수위와 강우자료는 30분 관측자료를 사용하였다. 이는 본 연구의 대상 유역인 중랑천의 경우 홍수예측을 위한 최소 선행시간이 30분 정도가 적당하다고 판단되었으며, 자료의 획득측면에서도 30분 관측자료 유용하였기에 30분 관측자료를 사용하였다
선정된 기간의 호우 사상의 대상 유역에 대한 5개의 강우 관측소의 강우자료와 중랑교 수위관측소의 수위를 사용하였다. 강우자료는 대상 유역의 5개의 강우관측소로부터 얻어진 각각의 강우량으로부터 유역의 평균 강우량을 산정하여 사용하였다.
실시간 홍수예측을 위한 지점으로 중랑천 하류 지점인 중랑교 지점을 선정하였고 모형을 구축하기 위한 입력 자료로는 2002년부터 2005년까지의 17개 호우사상을 선정하였다. 표 1은 선정된 강우사상의 특성을 나타내고 있다.
자기상관분석을 통해 결정된 독립변수의 시간규모를 근거로 통계모형 구축을 위해 R(t), R(t-1), R(t-2), R(t-3), R(t-4), H(t), H(t-1), H(t-2), H(t-3), H(t-4)의 강우와 수위관측 자료를 이용하였다. H는 수위자료, R은 강우자료를 나타내며 H와 R의 숫자들은 입력자료의 시간분포를 의미한다.
강우자료는 대상 유역의 5개의 강우관측소로부터 얻어진 각각의 강우량으로부터 유역의 평균 강우량을 산정하여 사용하였다. 중랑천 유역은 총 유역면적 296.04 km2 로 소규모 유역에 속하므로 각 관측소의 강우량을 각각 서로 다른 입력변수로 고려할 만큼 지체시간이 길지 않다고 판단되었고, 따라서 강우자료는 유역 전체를 대표하는 하나의 강우량 값을 산정하여 사용하였다. 유역의 평균 강우량은 각 강우관측소에서 측정된 값을 티센법을 이용하여 면적가중치를 주어 유역전체의 평균값으로 사용하였다.
데이터처리
1. 다중선형회귀 홍수예측 모형 구축을 위한 독립변수의 시간 규모를 결정하기 위해 입력자료에 대한 자기상관분석을 수행하였다. 자기상관분석 결과를 통해 선행 예측 시간을 3시간, 즉 t+6으로 결정하고 자기상관계수가 0.
3. 구축된 다중선형회귀 홍수 예측 모형들의 홍수 예측에 대한 성능을 평가하게 위해 평균제곱근오차, Nash-Suttcliffe효율계수, 평균절대오차, 조정 결정계수와 같은 4개의 통계지표들을 사용하였다. 모의결과 단계별 선택법을 이용한다중선형회귀 홍수예측 모형이 가장 정확한 예측 결과를 보였고, 최소 자승법을 이용한 홍수예측 모형이 가중 최소자승법을 이용한 홍수예측 모형보다 좀 더 나은 예측 결과를 보이고 있음을 확인 할 수 있었다.
표 4는 각 선행 예측시간별 홍수예측 모형의 회귀계수 산정결과와 각 독립변수의 개별회귀계수 t-검정 값을 나타내고 있다. 각 독립변수의 종속변수 Y에 대한 영향력의 대소를 판단하기 위한 개별회귀계수의 유의성 검토에는 표에서 보는 바와 같이 t-검정 값을 이용한다. t-검정 값이 높은 변수일수록 종속변수 Y를 예측하는데 공헌도가 높다고 판단하며 식 (17)과같이 계산한다.
본 연구에서와 같이 강우와 수위자료를 이용한 수위예측 회귀모형 구축시 독립변수로 사용되는 강우와 수위자료의 적절한 시간 규모를 결정하는 것은 무엇보다 중요하다. 따라서 본 연구에서는 다중선형회귀 모형에서 독립변수로 사용되는 수위와 강우의 시간 규모를 결정하기 위해 자기상관분석 (Autocorrelation analysis)을 수행하였다. 자기상관이란 시계열자료가 일정 시간 단위에 따라서 시차상관(lag correlation)을 의미하는 것이다.
모형간의 정량적 평가를 위해 검증사상 4개의 홍수예측 결과에 대해 평균제곱근오차, 효율계수, 평균절대오차, 수정 결정계수를 각각 계산하여 표 9에 나타내었다. 평균제곱근오차는 30분 선행시간의 경우 4개의 검증 사상 모두에 대해 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 0.
표 8은 Training 과정을 통해 구축된 각각의 다중선형회귀 홍수예측 모형을 이용한 모형의 테스트 결과 중 30분과 180분 선행시간의 통계지표를 나타내고 있다. 사용된 통계지표는 앞서 제시한 수정 결정계수(R*2 , adjusted coefficient of determination)와 평균제곱근오차(Root MeanSquare Error), Nash-Sutcliffe 효율계수(Efficiency Coefficient), 평균절대오차(Mean Absolute Error)를 이용하였다. 통계지표를 간단히 설명하면 다음과 같다.
앞선 다중선형회귀 홍수예측 모형 구축과 같은 방법으로 회귀성 검정을 수행하였고 이 회귀분석 결과와 가중 최소자승법을 이용한 회귀계수 산정 방법을 통해 다중선형회귀 홍수예측 모형을 구축하였다. 표 5는 각 선행 예측시간별 홍수예측 모형의 회귀계수 산정결과와 각 독립변수의 개별회귀계수 t-검정 값을 나타내고 있다.
독립변수의 시간 규모를 결정한 후 최소 자승법, 가중 최소 자승법, 단계별 선택법의 각기 다른 회귀계수 산정 방법을 이용한 다중선형회귀 홍수예측 모형을 구축하였다.이를 위해 각 모형의 구축단계에서 모형의 유의성을 검토하기 위해 분산분석을 통한 회귀성 검정을 수행하고 개별 회귀계수에 대한 t-검정을 수행하여 모형을 구축하고 중랑천 유역의 다양한 홍수사상에 대해 적용하였다.
이론/모형
종속변수와 가장 밀접한 연관성이 있는 몇 개의 독립변수만을 선택하여 이를 회귀모형에 포함시키는 방법이 변수 선택법이다. 본 연구에서는 각 단계별로 변수의 추가와 제거를 통한 최적의 모형을 선택하는 방법인 단계별 선택법(Stepwise)을 사용하였다. 단계별 선택법은 전진선택법에 의해 새로운 변수를 추가하고 추가된 변수에 의해 만들어진 새로운 모형에서 기존의 독립변수를 후진소거법에 의해 제거할 수 있는지를 판단하는 과정을 거치게 된다.
실시간 수위 예측을 위해서 본 연구에서 개발한 모형을 한강유역의 중랑천에 적용하였다. 중랑천 유역은 동경 127°03'~127°08', 북위 37°40'~37°48'사이에 위치하는데 본류인 중랑천은 경기도 양주군 주내면 산북리 불국산에서 발원하여 의정부시를 지나 남류하고, 서울시 성동구 사근동에 이르러 유역의 최대지류인 청계천이 합류하고, 성수대교 우안쪽으로 한강본류에 유입한다.
04 km2 로 소규모 유역에 속하므로 각 관측소의 강우량을 각각 서로 다른 입력변수로 고려할 만큼 지체시간이 길지 않다고 판단되었고, 따라서 강우자료는 유역 전체를 대표하는 하나의 강우량 값을 산정하여 사용하였다. 유역의 평균 강우량은 각 강우관측소에서 측정된 값을 티센법을 이용하여 면적가중치를 주어 유역전체의 평균값으로 사용하였다. 다중선형회귀 홍수예측 모형을 개발을 위한 training 자료로 2002년~2003년의 9개 호우사상을 사용하였고 2004년과 2005년의 8개 호우사상 중 4개를 test를 위한 자료로 나머지 4개의 호우사상을 모형의 검증을 위해 사용하였다.
성능/효과
0.5시간의 예측 결과를 도시한 그림 5(a)를 살펴보면 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형의 수정 결정계수가 0.996으로 최소 자승법과 가중 최소자승법을 이용한 홍수예측 모형의 수정 결정계수 0.995와 0.992에 비해 크게 산정된 것을 확인할 수 있다. 3시간의 예측 결과인 그림 5(b)의 경우에도 단계별 선택법을 이용한다중선형회귀 홍수에측 모형의 수정 결정계수가 0.
5시간의 예측치와 관측치간의 오차를 도시한 그림 6(a)의좌측 그림을 살펴보면 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 다른 두 모형에 비해 오차가 작게 나타나고 있음을 알 수 있고 이러한 결과는 좌측 그림의 ZoomA영역을 확대해서 도시한 우측 그림을 통해 명확히 알 수 있다. 3시간의 예측치와 관측치간의 오차를 도시한 그림6(b)의 좌측 그림의 경우에서도 마찬가지로 다중선형회귀 홍수예측 모형이 다른 두 모형에 비해 오차가 작게 나타나고있음을 알 수 있고 이를 통해 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 가장 우수한 예측 능력을 보이고 있음을 확인할 수 있었다
예측 선행시간이 길어질수록 평균제곱근오차가 세 모형 모두 조금씩 증가하는 것을 확인할 수 있었으나 단계별 선택법을 이용한 홍수예측 모형의 증가량이 상대적으로 작은 것을 알 수 있었다. 180분 선행시간의 결과를 비교해보면 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형의 평균제곱근오차가 최소 0.086 m에서 최대 0.200 m로 다른 두 모형에 비해 가장 우수한 예측 성능을 보이고 있음을 확인할 수 있다.
Nash-Sutcliffe 효율계수(NSEC)의 경우에도 모든 선행시간에 대해 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 최소 자승법과 가중 최소 자승법을 이용한 홍수예측 모형에 비해 최소 0.001에서 최대 0.141 정도의 높은 값을 나타내고 있음을 확인할 수 있었다. 평균절대오차와 수정 결정계수에 대한 각 모형별 결과를 비교해보면 예측 선행시간별로 다소 차이는 있으나 단계별 선택법을 이용한 다중선형 회귀 홍수예측 모형이 다른 두 모형에 비해 우수한 예측 성능을 보이고 있음을 확인 할 수 있고, 또한 가중 최소 자승법을 이용한 홍수예측 모형보다는 최소 자승법을 이용한 홍수예측 모형이 조금 더 우수한 예측 정확도를 보이고 있음을 확인 할 수 있었다.
그림에서 보는 바와 같이 30분 선행 기간의 경우에는 본 연구에서 구축한 3개의 다중선형회귀 홍수예측 모형 모두 예측 수위와 관측 수위가 상당히 잘 일치하고 있음을 알 수 있고 특히 첨두예측에 있어서도 세 모형 모두 상당히 만족할 만한 결과를 나타내고 있다. 그러나 예측 선행시간이 길어질수록 가중 최소 자승법을 이용한 다중선형회귀 홍수예측 모형의 경우 예측 정확도가 다른 두 모형에 비해 떨어지는 것을 확인할 수 있고, 특히 첨두예측에 있어서 다소 과대 예측되는 경향을 보이고 있음을 확인할 수 있다. 최소자승법과 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형의 경우에도 선행시간이 길어짐에 따라 예측 정확도가 다소 감소하는 경향을 보이고 있기는 하나 3시간의 선행시간을 감안한다면 상당히 만족할 만한 예측 결과를 보이고 있음을 확인할 수 있다.
그림에서 관측값은 실선으로 나타내었고 각 모형의 예측값은 점으로 나타내었다. 그림에서 보는 바와 같이 30분 선행 기간의 경우에는 본 연구에서 구축한 3개의 다중선형회귀 홍수예측 모형 모두 예측 수위와 관측 수위가 상당히 잘 일치하고 있음을 알 수 있고 특히 첨두예측에 있어서도 세 모형 모두 상당히 만족할 만한 결과를 나타내고 있다. 그러나 예측 선행시간이 길어질수록 가중 최소 자승법을 이용한 다중선형회귀 홍수예측 모형의 경우 예측 정확도가 다른 두 모형에 비해 떨어지는 것을 확인할 수 있고, 특히 첨두예측에 있어서 다소 과대 예측되는 경향을 보이고 있음을 확인할 수 있다.
표에서 보는 바와 같이 세 모형 모두 선행예측 시간이 증가함에 따라 예측 정확도가 다소 감소하는 경향을 보이고 있음을 알수 있다. 또한 세 모형간 예측 정확도를 비교해보면 단계별 선택법을 이용한 홍수예측 회귀모형의 결과가 가장 우수한 것을 확인할 수 있다.
이러한 결과를 통해 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형의 홍수 예측 능력이 가장 우수한 것을 확인할 수 있고 가중 최소 자승법을 이용한 다중선형회귀 홍수예측 모형의 홍수예측 능력이 가장 떨어짐을 확인할 수 있다. 또한 최소 자승법을 이용한 다중선형회귀 홍수예측 모형이 가중 최소 자승법을 이용한 다중선형회귀 홍수예측 모형에 비해 조금 더 정확한 예측 결과를 보여주고 있음을 알 수 있었다.
구축된 다중선형회귀 홍수 예측 모형들의 홍수 예측에 대한 성능을 평가하게 위해 평균제곱근오차, Nash-Suttcliffe효율계수, 평균절대오차, 조정 결정계수와 같은 4개의 통계지표들을 사용하였다. 모의결과 단계별 선택법을 이용한다중선형회귀 홍수예측 모형이 가장 정확한 예측 결과를 보였고, 최소 자승법을 이용한 홍수예측 모형이 가중 최소자승법을 이용한 홍수예측 모형보다 좀 더 나은 예측 결과를 보이고 있음을 확인 할 수 있었다. 이러한 결과는단계별 선택법을 이용한 회귀계수 추정의 경우 각 단계별로 독립변수의 진입과 제거를 통해 종속변수(예측 수위)에대한 예측 능력이 가장 우수한 최적의 모형을 구축할 수 있기 때문인 것으로 판단된다.
본 연구에서 구축된 다중선형회귀 홍수예측 모형간의 보다 정확한 비교를 위해 그림 5에 t+1(0.5 hr), t+6(3.0 hr)의 선행시간에 대한 예측치와 관측치를 도시하고 수정결정계수값을 산정하여 함께 나타내었고 그림 6에 t+1(0.5 hr),t+6(3.0 hr)의 선행시간에 대한 예측치와 관측치간의 오차를 나타내었다. 0.
본 연구에서는 대상 유역인 중랑천의 규모를 고려하여 최대 선행 예측 시간을 3시간, 즉 t+6으로 결정하였다. 시간 규모 결정을 위한 자기상관계수 값을 0.75이상으로 결정하였고, 그림에서 보는 바와 같이 0.75이상의 자기상관계수 값을 갖기 위해서는 시차가 10차 이하 이여야 하는 것을 확인할 수 있다. 따라서 최대 선행 예측 시간이 t+6이므로 이를 통해 최종적으로 독립변수의 선행유출(수위)시간을 t-4로 결정하였다.
070 m로 가장 크게 나타나고 있음을 알 수 있다. 예측 선행시간이 길어질수록 평균제곱근오차가 세 모형 모두 조금씩 증가하는 것을 확인할 수 있었으나 단계별 선택법을 이용한 홍수예측 모형의 증가량이 상대적으로 작은 것을 알 수 있었다. 180분 선행시간의 결과를 비교해보면 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형의 평균제곱근오차가 최소 0.
08로 다소 커지고 있음을 알 수있다. 이러한 결과를 통해 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형의 홍수 예측 능력이 가장 우수한 것을 확인할 수 있고 가중 최소 자승법을 이용한 다중선형회귀 홍수예측 모형의 홍수예측 능력이 가장 떨어짐을 확인할 수 있다. 또한 최소 자승법을 이용한 다중선형회귀 홍수예측 모형이 가중 최소 자승법을 이용한 다중선형회귀 홍수예측 모형에 비해 조금 더 정확한 예측 결과를 보여주고 있음을 알 수 있었다.
다중선형회귀 홍수예측 모형 구축을 위한 독립변수의 시간 규모를 결정하기 위해 입력자료에 대한 자기상관분석을 수행하였다. 자기상관분석 결과를 통해 선행 예측 시간을 3시간, 즉 t+6으로 결정하고 자기상관계수가 0.75이상 의 값을 갖도록 독립변수의 시간 규모를 결정하였으며 그 결과 독립변수의 선행유출(수위)시간을 t-4로 결정하였다
그러나 예측 선행시간이 길어질수록 가중 최소 자승법을 이용한 다중선형회귀 홍수예측 모형의 경우 예측 정확도가 다른 두 모형에 비해 떨어지는 것을 확인할 수 있고, 특히 첨두예측에 있어서 다소 과대 예측되는 경향을 보이고 있음을 확인할 수 있다. 최소자승법과 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형의 경우에도 선행시간이 길어짐에 따라 예측 정확도가 다소 감소하는 경향을 보이고 있기는 하나 3시간의 선행시간을 감안한다면 상당히 만족할 만한 예측 결과를 보이고 있음을 확인할 수 있다.
141 정도의 높은 값을 나타내고 있음을 확인할 수 있었다. 평균절대오차와 수정 결정계수에 대한 각 모형별 결과를 비교해보면 예측 선행시간별로 다소 차이는 있으나 단계별 선택법을 이용한 다중선형 회귀 홍수예측 모형이 다른 두 모형에 비해 우수한 예측 성능을 보이고 있음을 확인 할 수 있고, 또한 가중 최소 자승법을 이용한 홍수예측 모형보다는 최소 자승법을 이용한 홍수예측 모형이 조금 더 우수한 예측 정확도를 보이고 있음을 확인 할 수 있었다.
모형간의 정량적 평가를 위해 검증사상 4개의 홍수예측 결과에 대해 평균제곱근오차, 효율계수, 평균절대오차, 수정 결정계수를 각각 계산하여 표 9에 나타내었다. 평균제곱근오차는 30분 선행시간의 경우 4개의 검증 사상 모두에 대해 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 0.011 m ~0.049 m로 가장 작게 나타나고, 가중 최소 자승법을 이용한 홍수예측 모형이 0.019 m~0.070 m로 가장 크게 나타나고 있음을 알 수 있다. 예측 선행시간이 길어질수록 평균제곱근오차가 세 모형 모두 조금씩 증가하는 것을 확인할 수 있었으나 단계별 선택법을 이용한 홍수예측 모형의 증가량이 상대적으로 작은 것을 알 수 있었다.
후속연구
이러한 결과는단계별 선택법을 이용한 회귀계수 추정의 경우 각 단계별로 독립변수의 진입과 제거를 통해 종속변수(예측 수위)에대한 예측 능력이 가장 우수한 최적의 모형을 구축할 수 있기 때문인 것으로 판단된다. 이러한 결과는 향후 도달시간이 짧아 충분한 선행시간을 확보하기 어려운 중소하천, 특히 도심하천의 홍수 예경보에 활용될 수 있을 것으로 판단된다.
질의응답
핵심어
질문
논문에서 추출한 답변
하천 흐름의 정확한 예측은 무엇에 대한 중요한 요소인가?
하천의 유량과 수위와 같은 하천 흐름을 정확히 예측하는 것은 유역계획이나 지속적인 수자원 관리를 위해서 중요한 요소이다(Brooks et al., 2003).
유량과 수위의 관계식의 단점은 무엇인가?
그 중 하천 수위는 홍수경보 발령시 중요한 변수이나 하천의 일반적인 수문학적 예보 모형에서의 결과 값으로는 대개 유량이 계산되며 홍수의 경보를 위해서는 수위-유량관계식을 통해 예측된 유량을 하천 수위로 변환하는 과정을 거치게 된다. 그러나 유량과 수위의 관계식이 완전하지 않기 때문에 유량에서 수위로의 변환과정에 어떤 오차나 불확실성이 항상 존재할 수 있다는 단점이 있다. 하천 수위는 쉽고 직접적으로 측정할 수 있기 때문에 홍수를 예측하는데 있어서 유량보다 유용하다.
수위 예측에 관한 방법 중 가장 널리 사용되는 자료 지향형 기반 모형에는 무엇이 있는가?
개념적, 단위도 그리고 물리적 기반의 모형들에 대한 개발과 검증에 관련된 여러 제한 사항들 때문에(Kokkonen and Jakeman, 2001), 최근 자료 지향형 기반의 모형이 홍수예측에 널리 도입되고 있다. 최근 널리 사용되고 있는 자료 지향형 모형의 기법으로는 다중선형회귀, 인공신경망, 퍼지추론 시스템 등이 있다. 이러한 모형들은 기존의 모형과 비교해서 물리적인 성질이 완전히 밝혀지지 않은 비선형(nonlinear)이거나 동적(dynamic)인 모형의 잡음자료(noisy data)를 처리하는데 용이하며, 모형을 구축하는데 있어서 복잡한 수학적인 지식이 필요하지 않기 때문에 상대적으로 모형개발을 위한 절차가 간단하고, 결과값을 얻기까지의 계산시간 역시 많이 소요되지 않는 장점을 가지고 있다.
참고문헌 (22)
건설교통부(2005) 주요지천 홍수예보 프로그램 개선.
김경탁, 김주훈, 최윤석(2006) 중소하천에유역에서의 홍수예보 및 예측에 관한 연구. 한국수자원학회 학술발표회논문집, 한국수자원학회, pp. 1126-1130.
성지연, 허준행(2009) 통계적 모형을 이용한 지천 홍수예측. 한국수자원학회 학술발표회논문집, 한국수자원학회, pp. 1524-1527.
윤강훈, 김태균(2003) 레이더 예측 강우를 이용한 다중회귀 유출 모형의 개발. 대한토목학회 학술발표회 논문집, 대한토목학회, pp. 2187-2198.
윤강훈, 신현민(1994) 한강인도교 수위와 영향인자간의 다중회귀 분석에 의한 홍수위 예측모형. 한국수자원학회지, 한국수자원학회, 제27권, 제3호, pp. 55-69.
윤용남, 원석연(1991) 미계측 중소유역의 월유출량 산정을 위한 다중회귀모형 연구. 한국수자원학회지, 한국수자원학회, 제24권, 제3호, pp. 71-82.
이범희(2010) 회귀분석에 의한 도시홍수 예보시스템의 개발. 대한토목학회논문집, 대한토목학회, 제30권 제4B호, pp. 347-359.
정동국, 이범희(2009) 회귀기법을 이용한 도시홍수위 예측모형의 개발. 한국수자원학회논문집, 한국수자원학회, 제43권, 제2호, pp. 221-231.
Brooks, K.N., Ffolliott, P.E., Gregersen, H.M., and DeBani, L.F. (2003) Hydrology and the management of watersheds, Iowa State Press, Ames, IA.
Chiew, F. and McMahon, T. (1994) Application of the daily rainfall runoff model MODHYDROLOG to 28 catchments. Journal of Hydrology, Vol. 153, No. 4, pp. 383-416.
Chaoulakou, A., Assimacopoulos, D., and Lekkas, T. (1999) Forecasting daily maximum ozon concentration in the Athens basin. Environmental Monitoring and Assessment, Vol. 56, pp. 97-112.
Huynh Ngoc Phien and Nguyen Duc Anh Kha (2003) Flood forecasting for the upper reach of the Red River Basin, North Vietnam, http://www.wrc.org.za
Jakeman, J.J., Littlewood, I.G., and Whitehead, P.G. (1990) Computation of the instantaneous unit hydrograph and identifiable component flows with application to two small upland catchment. Journal of Hydrology, Vol. 117, pp. 275-300.
Kokkonen, T.S. and Jakeman, A.J. (2001) A comparison of metric and conceptual approaches in rainfall-runoff modeling and its implications. Water Resources Research, Vol. 37, No. 9, pp. 2345-2353.
McKerchar, A.I. and Delleur, J.W. (1974) Applications of seasonal parametric linear stochastic models to monthly flow data. Water Resources Research, Vol. 10, pp. 246-255.
Phien, H.N., Huong, B.K., and Loi, P.D. (1990) Daily forecasting with regression analysis. Water SA, Vol. 16, No. 3, pp. 179-184.
Schilling, K.E. and Wolter, C.F (2005) Estimation of streamflow, baseflow and nitrate-nitrogen loads in Iwoa using multiple regression models. Journal of American Water Resources Association, Vol. 41, No. 6, pp. 1333-1346.
Tangborn, W.V. and Rasmussen, L.A. (1976) Hydrology of North Cascades region, Washington-part 2: a proposed hydrometeorological streamflow prediction method. Water Resources Research, Vol. 12, pp. 203-216.
VanderKwaak, J.E. and Loague, K. (2001) Hydrologic-response simulations for the R-5 catchment with a comprehensive physics- based model. Water Resources Research, Vol. 37, No. 4, pp. 999.
Yurekli, K., Kurung, A., and Ozturk, F. (2005) Testing residuals of an ARIMA model on the Cekerek stream watershed in Turkey. Turkish Journal of Engineering and Environmental Sciences, Vol. 29, pp. 61-74.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.