국내에서 수공구조물의 설계를 위한 확률강우량을 산정하기 위해서 널리 사용되는 강우강도식은 주로 회귀분석을 적용한 형태가 일반적이지만, 본 연구에서는 각 지점별 적정확률분포형의 누가분포함수를 활용하여 강우강도식의 형태를 결정하고, 매개변수는 유전자알고리즘을 적용하여 추정하는 강우강도식을 제안하고자 한다. 기존에 사용하던 강우강도식과의 정확도 비교를 위하여 기상청 22개 지점에 대한 재현기간, 지속기간별 평균제곱근오차, 평균제곱근 상대오차를 검토한 결과 누가분포함수를 활용한 강우강도식이 더 높은 정확도를 가짐을 보였으며, 또한, 최근의 집중호우에 대한 영향을 살펴보기 위하여 2006년 까지의 강우자료를 이용하여 기존의 회귀식에 의한 방법과 누가분포함수를 활용한 경우의 결과값을 비교한 결과 이 경우에도 누가분포함수를 활용한 강우강도식의 정확도가 더 높음을 알 수 있었다. 결과적으로 본 연구에서 제안된 누가분포함수를 활용한 강우강도식은 기존의 회귀분석을 활용한 강우강도식보다 정확도면에서 우수하다고 할 수 있으며, 국내에 충분히 적용가능한 형태의 강우강도식이라고 판단된다.
국내에서 수공구조물의 설계를 위한 확률강우량을 산정하기 위해서 널리 사용되는 강우강도식은 주로 회귀분석을 적용한 형태가 일반적이지만, 본 연구에서는 각 지점별 적정확률분포형의 누가분포함수를 활용하여 강우강도식의 형태를 결정하고, 매개변수는 유전자알고리즘을 적용하여 추정하는 강우강도식을 제안하고자 한다. 기존에 사용하던 강우강도식과의 정확도 비교를 위하여 기상청 22개 지점에 대한 재현기간, 지속기간별 평균제곱근오차, 평균제곱근 상대오차를 검토한 결과 누가분포함수를 활용한 강우강도식이 더 높은 정확도를 가짐을 보였으며, 또한, 최근의 집중호우에 대한 영향을 살펴보기 위하여 2006년 까지의 강우자료를 이용하여 기존의 회귀식에 의한 방법과 누가분포함수를 활용한 경우의 결과값을 비교한 결과 이 경우에도 누가분포함수를 활용한 강우강도식의 정확도가 더 높음을 알 수 있었다. 결과적으로 본 연구에서 제안된 누가분포함수를 활용한 강우강도식은 기존의 회귀분석을 활용한 강우강도식보다 정확도면에서 우수하다고 할 수 있으며, 국내에 충분히 적용가능한 형태의 강우강도식이라고 판단된다.
Intensity-Duration-Frequency (IDF) curve that is essential to calculate rainfall quantiles for designing hydraulic structures in Korea is generally formulated by regression analysis. In this study, IDF curve derived by the cumulative distribution function ("IDF by CDF") of the proper probability dis...
Intensity-Duration-Frequency (IDF) curve that is essential to calculate rainfall quantiles for designing hydraulic structures in Korea is generally formulated by regression analysis. In this study, IDF curve derived by the cumulative distribution function ("IDF by CDF") of the proper probability distribution function (PDF) of each site is suggested, and the corresponding parameters of IDF curve are computed using genetic algorithm (GA). For this purpose, IDF by CDF and the conventional IDF derived by regression analysis ("IDF by REG") were computed for 22 Korea Meteorological Administration (KMA) rainfall recording sites. Comparisons of RMSE (root mean squared error) and RRMSE (Relative RMSE) of rainfall intensities computed from IDF by CDF and IDF by REG show that IDF by CDF is more accurate than IDF by REG. In order to accommodate the effect of the recent intensive rainfall of Korea, the rainfall intensities computed by the two IDF curves are compared with that by at-site frequency analysis using the rainfall data recorded by 2006, and the result from IDF by CDF show the better performance than that from IDF by REG. As a result, it can be said that the suggested IDF by CDF curve would be the more efficient IDF curve than that computed by regression analysis and could be applied for Korean rainfall data.
Intensity-Duration-Frequency (IDF) curve that is essential to calculate rainfall quantiles for designing hydraulic structures in Korea is generally formulated by regression analysis. In this study, IDF curve derived by the cumulative distribution function ("IDF by CDF") of the proper probability distribution function (PDF) of each site is suggested, and the corresponding parameters of IDF curve are computed using genetic algorithm (GA). For this purpose, IDF by CDF and the conventional IDF derived by regression analysis ("IDF by REG") were computed for 22 Korea Meteorological Administration (KMA) rainfall recording sites. Comparisons of RMSE (root mean squared error) and RRMSE (Relative RMSE) of rainfall intensities computed from IDF by CDF and IDF by REG show that IDF by CDF is more accurate than IDF by REG. In order to accommodate the effect of the recent intensive rainfall of Korea, the rainfall intensities computed by the two IDF curves are compared with that by at-site frequency analysis using the rainfall data recorded by 2006, and the result from IDF by CDF show the better performance than that from IDF by REG. As a result, it can be said that the suggested IDF by CDF curve would be the more efficient IDF curve than that computed by regression analysis and could be applied for Korean rainfall data.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 누가분포함수를 활용한 강우강도식의 국내 적용성을 살펴보기 위하여, 기존에 사용되던 회귀분석을 활용한 강우강도식의 결과와 정확도를 비교해 보았으며, 최근까지의 강우자료를 사용하여 새로운 강우강도식의 매개변수를 제시하였다. 누가분포함수를 활용한 강우강도식의 매개 변수를 추정하는데 있어서는 유전자알고리즘을 사용하였으며, 비교적 충분한 기간 동안 강우자료가 기록된 기상청 22개 지점에 대해서 평균제곱근오차(RMSE)와 평균제곱근 상대오차(RRMSE)를 최소화시키는 형태의 목적함수를 구성하여서 최적 매개변수를 추정하였다.
본 연구에서는 우리나라 주요지점에 대한 적정 확률분포형을 결정한 후 해당 확률분포형의 누가분포함수를 이용하여 식 (9), (10)과 같은 형태를 가지는 강우강도식의 매개변수를 유전자알고리즘을 이용하여 추정한 후 완성된 강우강도식으로부터 얻어진 강우강도와, 기존의 식 (3)과 같은 회귀 분석을 활용한 강우강도식을 이용하여 얻어진 강우강도를 서로 비교하여 누가분포함수를 활용한 강우강도식의 적용성을 검토하고자 하였다. 여기서, 기존에 사용되던 식 (1), (2)보다 식 (3)을 이용한 이유는 다른 두 가지 식들보다 정확도 면에서 더 높은 결과를 보이기 때문이고(김태순 등, 2007), 비교적 최근의 자료를 활용한 연구결과(건설교통부, 2000)와의 비교가 가능하기 때문이다.
본 연구의 목적은 기존에 국내에 적용되고 있던 강우강도식의 형태를 이론적인 근거를 가지는 형태로 개선하기 위한 것으로서, Koutsoyiannis et al.(1998)에 의해서 제안된 누가 분포함수를 활용한 강우강도식의 형태를 기본적으로 활용하고 매개변수를 추정하는데 있어서는 회귀분석방법보다 적용성에 있어서 더 효율적인 유전자알고리즘을 이용하여, 전국에 있는 기상청산하 22개 관측지점에 대한 강우강도식의 매개변수를 새롭게 추정하여 제안하고자 한다.
빈도해석절차의 특성상 관측자료의 기간이 길수록 더 안정적인 결과를 보인다고 할 수 있기 때문에 본 연구에서는 사용된 기상청 22개 지점 중 관측 기록년수가 가장 긴 상위 8개 지점인 서울(000108_GEV), 대구(000143_GEV), 전주(000146_GUM), 울산(000152_GEV), 광주(000156_GEV), 부산(000159_GUM), 목포(000165_GEV), 여수(000168_GEV)의 대해서 개체수와 세대수에 따른 목적함수의 변화를 살펴보았다.
제안 방법
본 연구의 목적은 기존에 국내에 적용되고 있던 강우강도식의 형태를 이론적인 근거를 가지는 형태로 개선하기 위한 것으로서, Koutsoyiannis et al.(1998)에 의해서 제안된 누가 분포함수를 활용한 강우강도식의 형태를 기본적으로 활용하고 매개변수를 추정하는데 있어서는 회귀분석방법보다 적용성에 있어서 더 효율적인 유전자알고리즘을 이용하여, 전국에 있는 기상청산하 22개 관측지점에 대한 강우강도식의 매개변수를 새롭게 추정하여 제안하고자 한다.
, 2002). NSGA-II는 원래 다목적 문제의 최적화를 위해서 개발되었으나 최근에는 단일목적함수에도 적용이 가능하도록 소스코드가 수정되었으며, 일반적으로 흔히 쓰이고 있는 유전자알고리즘 기법인 SGA(Simple Genetic Algorithm)보다 더 좋은 결과값을 주기 때문에 본 연구에서 사용하였다. NSGA-II의 순서도는 Fig.
2는 각 지점에 대해서, 개체수 100, 500, 1000, 2000, 3000, 4000, 5000개와 세대수 3000번까지의 결과값으로 목적함수중의 하나인 RRMSE를 도시한 것이다. RMSE에 비해서 RRMSE는 상대적인 오차를 나타내기 때문에 보다 정확한 값을 나타낸다고 생각되어서 RRMSE를 이용하였다. 8개 지점의 결과를 살펴보면, 여수의 경우 개체수가 100개인 경우를 제외하고는 다른 모든 개체수를 적용한 결과에서 매우 적은 세대수를 반복회수로 사용하더라도 빠르게 수렴되는 것으로 나타났고, 서울, 울산, 부산은 개체수 100개와 500개를, 대구와 전주는 100개, 500개, 1000개를, 그리고 광주와 목포는 개체수 100개, 500개, 2000개를 제외한 모든 개체수에서 매우 적은 세대수를 사용하더라도 가장 적은 목적함수값에 매우 근접한 목적함수값을 나타내는 것으로 나타났다.
누가분포함수를 이용한 강우강도식인 식 (9)와 (10)이 국내에 적용 가능한지 알아보기 위하여, 1999년까지의 강우자료를 적용하여 매개변수를 추정한 후 식 (3)과 정확도를 비교해 보았다. 아래의 Table 2에서 OF_I(RMSE)의 90_GEV는 a) 유전자알고리즘의 목적함수로 RMSE인 식 (11)을 사용하고, b) 속초(090)지점의 적정 확률분포형인 GEV분포형을 사용한 강우강도식인 식 (10)의 매개변수를 추정하여 완성된 강우강도식으로 강우강도를 계산한 후, 지점빈도해석을 활용하여 구한 속초지점에서의 지속기간별 재현기간별 강우 강도와 비교한 RMSE와 RRMSE를 구한 것이다.
본 연구에서는 누가분포함수를 활용한 강우강도식의 국내 적용성을 살펴보기 위하여, 기존에 사용되던 회귀분석을 활용한 강우강도식의 결과와 정확도를 비교해 보았으며, 최근까지의 강우자료를 사용하여 새로운 강우강도식의 매개변수를 제시하였다. 누가분포함수를 활용한 강우강도식의 매개 변수를 추정하는데 있어서는 유전자알고리즘을 사용하였으며, 비교적 충분한 기간 동안 강우자료가 기록된 기상청 22개 지점에 대해서 평균제곱근오차(RMSE)와 평균제곱근 상대오차(RRMSE)를 최소화시키는 형태의 목적함수를 구성하여서 최적 매개변수를 추정하였다. 유전자알고리즘을 적용하기 위해서 필요한 세대수는 3000번, 개체수 5000개로 하였다.
본 연구에서는 목적함수로 RMSE를 사용한 경우의 결과를 Objective Function_I(OF_I)이라고 하였고, RRMSE를 사용한 경우의 결과를 Objective Function_II(OF_II)로 하여 매개변수를 추정하였다.
앞 절까지의 결과는 기존에 유도된 강우강도식과의 비교를 위하여 누가분포함수를 활용한 강우강도식의 매개변수는 유전자알고리즘을 이용하여 추정하고, 기존의 회귀분석에 의한 강우강도식의 매개변수는 건설교통부(2000)에 나와 있는 매개변수 값을 이용하여 서로간의 정확도를 비교해 본 것이다. 여기서는 최근의 연구결과(김태순 등, 2007; 신주영 등, 2007)를 이용하여 식 (3)의 매개변수를 2006년까지의 자료를 활용하여 유전자알고리즘으로 새로 구하고 동시에 누가분포함수를 활용한 강우강도식의 매개변수 역시 유전자알고리즘으로 구하여 정확도를 비교해 보았다.
앞 절까지의 결과는 기존에 유도된 강우강도식과의 비교를 위하여 누가분포함수를 활용한 강우강도식의 매개변수는 유전자알고리즘을 이용하여 추정하고, 기존의 회귀분석에 의한 강우강도식의 매개변수는 건설교통부(2000)에 나와 있는 매개변수 값을 이용하여 서로간의 정확도를 비교해 본 것이다. 여기서는 최근의 연구결과(김태순 등, 2007; 신주영 등, 2007)를 이용하여 식 (3)의 매개변수를 2006년까지의 자료를 활용하여 유전자알고리즘으로 새로 구하고 동시에 누가분포함수를 활용한 강우강도식의 매개변수 역시 유전자알고리즘으로 구하여 정확도를 비교해 보았다.
식 (9)와 (10)을 각 지점에 적용하여 매개변수를 추정할 때 사용된 변수들은 λ, ψ, κ, θ, η이며, 각각의 매개변수가 가지는 범위는 0<λ, 0<ψ<4, 0<κ<10, 0<θ<3, 0<η<1로 설정하였다. 유전자알고리즘을 수행할 때 사용한 목적함수는 주어진 확률분포형에 의한 확률강우량을 이용한 강우강도값과 식 (9) 그리고 식 (10)을 이용해서 구한 강우강도와의 차이를 이용한 평균제곱근오차(Root Mean Squared Error, RMSE)와 평균제곱근 상대오차(Relative RMSE, RRMSE)를 최소화 하는 형태의 목적함수를 사용하였다.
이번에는 이런 평균적인 값이 아닌 임의의 재현기간에 대한 정확도와 지속기간을 장기간과 단기간으로 구분했을때의 정확도를 비교해보았다. 이때 사용한 재현기간은 국내에서 수공구조물을 설계할 때 가장 많이 쓰이는 재현기간인 30년, 50년, 100년, 200년(건설교통부, 1993)에 대하여 RMSE, RRMSE를 계산하여 비교해 보았으며, 지속기간은 12시간을 기준으로 12시간 미만인 단기간과 12시간 이상인 장기간으로 나누어서 정확도를 각각 비교해 보았다. 단, 여기서 장-단기간으로 지속기간을 구분한 것은 매개변수를 추정할 때가 아닌 정확도 비교만을 위해서 구분한 것이며, 매개변수를 추정할 때는 장-단기간의 구분 없이 추정한 것이다.
이를 위해서 기존에 사용되던 강우강도식 중에서 비교적 정확도가 높다고 알려진 허준행 등(허준행 등, 1999)이 개발한 강우강도식을 대상으로 새롭게 유도된 강우강도식의 정확도를 비교하고, 매개변수 추정을 위한 유전자알고리즘을 적용하는데 있어서 필수적인 개체수(population number)와 세대수(generation number)를 결정하며, 대상지점에 대한 새로운 강우강도식의 매개변수를 제안함으로써 국내에 적용할 수 있는 새로운 강우강도식을 제시하고자 한다.
1절에서 언급한 10가지 경우의 지속 기간에 대한 RMSE와 RRMSE를 평균한 값이므로, 누가분포함수를 활용한 강우강도식의 평균적인 정확도를 나타내고 있다. 이번에는 이런 평균적인 값이 아닌 임의의 재현기간에 대한 정확도와 지속기간을 장기간과 단기간으로 구분했을때의 정확도를 비교해보았다. 이때 사용한 재현기간은 국내에서 수공구조물을 설계할 때 가장 많이 쓰이는 재현기간인 30년, 50년, 100년, 200년(건설교통부, 1993)에 대하여 RMSE, RRMSE를 계산하여 비교해 보았으며, 지속기간은 12시간을 기준으로 12시간 미만인 단기간과 12시간 이상인 장기간으로 나누어서 정확도를 각각 비교해 보았다.
이번에는 지속기간 12시간을 기준으로, 12시간 미만의 단기간 지속기간인 1, 2, 3, 6, 9시간과 12시간 이상의 장기간 지속기간인 12, 15, 18, 24, 48 지속기간을 이용하여 강우강도식의 정확도를 비교해 보았다. Fig.
대상 데이터
연구대상 강우자료는 보다 정확한 비교를 위하여 연구가 실시되었던 2000년 식 (3)의 매개변수를 산정할 때 사용한 자료를 동일하게 사용하였다(건설교통부, 2000; 한국건설기술연구원, 2000). 이때 사용된 강우자료는 당시의 전국에 있는 기상청 산하 68개 관측소의 자료 중 자료기간이 30년 정도 되는 비교적 장기간 관측된 강우자료에 대하여 이동 지속기간 1, 2, 3, 6, 9, 12, 15, 18, 24, 48시간 별 매년 최대치 자료를 모두 사용하였으며, 다음의 Table 1에 해당지점과 기상청에서 관리하는 지점코드, 적정확률분포형, 대상 지점의 자료기록년수, 그리고 해당지점이 위치한 유역이 표시되어 있다.
누가분포함수를 활용한 강우강도식의 매개 변수를 추정하는데 있어서는 유전자알고리즘을 사용하였으며, 비교적 충분한 기간 동안 강우자료가 기록된 기상청 22개 지점에 대해서 평균제곱근오차(RMSE)와 평균제곱근 상대오차(RRMSE)를 최소화시키는 형태의 목적함수를 구성하여서 최적 매개변수를 추정하였다. 유전자알고리즘을 적용하기 위해서 필요한 세대수는 3000번, 개체수 5000개로 하였다.
연구대상 강우자료는 보다 정확한 비교를 위하여 연구가 실시되었던 2000년 식 (3)의 매개변수를 산정할 때 사용한 자료를 동일하게 사용하였다(건설교통부, 2000; 한국건설기술연구원, 2000). 이때 사용된 강우자료는 당시의 전국에 있는 기상청 산하 68개 관측소의 자료 중 자료기간이 30년 정도 되는 비교적 장기간 관측된 강우자료에 대하여 이동 지속기간 1, 2, 3, 6, 9, 12, 15, 18, 24, 48시간 별 매년 최대치 자료를 모두 사용하였으며, 다음의 Table 1에 해당지점과 기상청에서 관리하는 지점코드, 적정확률분포형, 대상 지점의 자료기록년수, 그리고 해당지점이 위치한 유역이 표시되어 있다. 또한, 강우강도식의 매개변수를 구하기 위해서 사용한 자료는 해당 지점의 적정확률분포형에 따른 지속기간, 재현기간별 확률강우량(quantile) 값이며, 이때 사용된 확률분포형의 매개변수 추정방법은 모두 확률가중모멘트법(probability weighted moment)이다.
이론/모형
본 연구에서는 유전자알고리즘을 적용하기 위하여 최근에 가장 활발히 적용되고 있는 다목적 유전자알고리즘 기법인 NSGA-II(Non-dominated Sorting Genetic Algorithm-II)를 적용하였다. NSGA-II는 기존에 개발되었던 NSGA(Srinivas and Deb, 1994)의 단점을 보완하기 위하여 1) 가장 우수한 염색체를 다음 세대로 전달하는 기능을 하는 엘리티즘(elitism)을 적용하고, 2) 염색체의 다양성(diversity)을 확보하기 위한 sharing 기법에서 사용자가 임의로 설정하는 sharing parameter를 없앤 군집거리방법(crowding distance)을 적용하였으며, 3) NSGA에 비해서 염색체의 순위(ranking)를 매기는 복잡도(complexity)를 줄이는 개선을 한 기법이다(Deb et al.
성능/효과
RMSE에 비해서 RRMSE는 상대적인 오차를 나타내기 때문에 보다 정확한 값을 나타낸다고 생각되어서 RRMSE를 이용하였다. 8개 지점의 결과를 살펴보면, 여수의 경우 개체수가 100개인 경우를 제외하고는 다른 모든 개체수를 적용한 결과에서 매우 적은 세대수를 반복회수로 사용하더라도 빠르게 수렴되는 것으로 나타났고, 서울, 울산, 부산은 개체수 100개와 500개를, 대구와 전주는 100개, 500개, 1000개를, 그리고 광주와 목포는 개체수 100개, 500개, 2000개를 제외한 모든 개체수에서 매우 적은 세대수를 사용하더라도 가장 적은 목적함수값에 매우 근접한 목적함수값을 나타내는 것으로 나타났다.
이는 OF_I의 경우 관측값과 추정값간의 확률강우량에 관한 RMSE를 최소화시키는 형태로 구성되었기 때문에 상대적으로 큰 확률강우량을 가지는 장기간의 지속기간에 대한 결과값이 정확하게 나오는 경향이 있으며, 반대로 OF_II의 경우 확률강우량간의 상대적인 차이를 최소화시키는 형태의 목적함수인 RRMSE를 최소화시키는 형태로 구성되었기 때문에 단기간의 지속기간에 대한 정확도가 더 높게 나오는 경향이 있기 때문이다(신주영 등, 2007). 결과적으로 Fig. 4의 결과에 의하면 단기간과 장기간에 해당하는 경우 모두 누가분포함수를 활용한 강우강도식의 정확도가 회귀분석을 활용한 강우강도식의 정확도보다 높은 것으로 나타났다.
결과적으로 개체수는 2000개이상이면 충분하고 세대수 역시 200번 정도에서 8개 지점이 모두 수렴되는 것으로 나타났으며, 일반적으로 유전자알고리즘은 세대수를 증가시키는 것보다는 개체수를 증가시키는 것이 해를 구하는 효율면에서 더 좋다고 할 수 있으므로 본 연구에서 세대수를 200회로 사용하고 개체수는 충분히 크다고 할 수 있는 5000개를 사용하였다.
또한, RRMSE에 의한 결과를 살펴보면, OF_I(RMSE)는 모든 지점에서 최소 RRMSE를 갖는 경우가 없는 것으로 나타났고 OF_II(RRMSE)는 21개 지점에서 최소 RRMSE를 나타냈으며 식 (3)에 의한 경우는 1개 지점에서 최소 RRMSE를 갖는 것으로 나타났다. 결정계수의 결과를 살펴보면 OF_I(RMSE)가 1개 지점에서 다른 두 가지 방법보다 큰 결정계수 값을 보여주고 있고, OF_II(RRMSE)는 22개 지점 중에서 모두 13개 지점에서 결정계수가 최대이며, 식 (3)에 의한 경우는 모두 8개 지점에서 결정계수가 최대인 것으로 나타났다.
Table 3은 이와 같이 구한 결과를 보여주는 것으로써, RMSE를 비교했을때는 OF_I이 1개소, OF_II가 11개소, 식 (3)에 의한 경우가 10개소에서 최소값을 보였으며, RRMSE를 비교하였을때는 OF_II가 15개소, 식 (3)에 의한 경우가 7개소에서 최소값을 보이는 것으로 나타나서 1999년까지의 강우자료를 이용한 와 비교해서는 식 (3)에 의한 결과값이 좀더 양호해진 것으로 나타났다. 그러나, 재현기간별로 구분한 경우와 함께 지속기간으로 구분한 경우를 도시한 Fig. 5와 Fig. 6를 살펴보면 거의 모든 경우에 대해서 누가분포함수를 활용한 강우강도식의 정확도가 회귀분석을 활용한 강우강도식보다 높은 것으로 나타나서, 2006년까지의 강우자료를 활용하여서 매개변수를 추정하더라도 누가분포를 활용한 강우강도식의 정확도가 더 높은 것으로 나타났다.
여기서 RMSE를 살펴보면 OF_I(RMSE)가 1개 지점에서 다른 두 가지 방법보다 적은 RMSE값을 보여주고 있고, OF_II(RRMSE)는 22개 지점중에서 모두 15개 지점에서 RMSE가 최소이며, 식 (3)에 의한 경우는 모두 6개 지점에서 RMSE가 최소인 것으로 나타났다. 또한, RRMSE에 의한 결과를 살펴보면, OF_I(RMSE)는 모든 지점에서 최소 RRMSE를 갖는 경우가 없는 것으로 나타났고 OF_II(RRMSE)는 21개 지점에서 최소 RRMSE를 나타냈으며 식 (3)에 의한 경우는 1개 지점에서 최소 RRMSE를 갖는 것으로 나타났다. 결정계수의 결과를 살펴보면 OF_I(RMSE)가 1개 지점에서 다른 두 가지 방법보다 큰 결정계수 값을 보여주고 있고, OF_II(RRMSE)는 22개 지점 중에서 모두 13개 지점에서 결정계수가 최대이며, 식 (3)에 의한 경우는 모두 8개 지점에서 결정계수가 최대인 것으로 나타났다.
4는 각각 지속기간 1시간~9시간에 해당하는 강우강도를 비교한 결과와 지속기간 12시간~48시간에 해당하는 강우강도를 비교한 결과를 나타낸 것이다. 앞서 설명한 재현기간별로 정확도를 비교한 결과에서는 전반적으로 OF_II가 OF_I보다 높은 정확도를 가지는 것으로 나타났지만, 여기서는 단기간의 지속기간에 해당하는 경우에는 OF_II를 사용하는 것이 더 높은 정확도를 갖는 것으로 나타났고, 장기간의 지속기간에 해당하는 경우에는 OF_I이 OF_II보다 더 높은 정확도를 보이는 것으로 나타났다.
Table 2에서 굵은 이탤릭체로 표기된 값은 같은 지점에 대한 결과 중 RMSE가 가장 적은 것을 나타내고 있고, 음영과 함께 굵은 이탤릭체로 표기된 값은 RRMSE가 가장 적은 것을 나타내고, 이탤릭체에 밑줄이 쳐진 값은 결정계수(coefficient of determination, COD)가 가장 큰 것을 나타내고 있는 것이다. 여기서 RMSE를 살펴보면 OF_I(RMSE)가 1개 지점에서 다른 두 가지 방법보다 적은 RMSE값을 보여주고 있고, OF_II(RRMSE)는 22개 지점중에서 모두 15개 지점에서 RMSE가 최소이며, 식 (3)에 의한 경우는 모두 6개 지점에서 RMSE가 최소인 것으로 나타났다. 또한, RRMSE에 의한 결과를 살펴보면, OF_I(RMSE)는 모든 지점에서 최소 RRMSE를 갖는 경우가 없는 것으로 나타났고 OF_II(RRMSE)는 21개 지점에서 최소 RRMSE를 나타냈으며 식 (3)에 의한 경우는 1개 지점에서 최소 RRMSE를 갖는 것으로 나타났다.
상자수염도의 특성상 전체적으로 1st quartile과 3rd quartile간의 간격이 좁으면서 동시에 box의 형태가 전체적으로 다른 값들보다 적은 값을 갖는 경우가 전체적으로 적은 오차를 갖는 것이라고 말할 수 있으며, 여기에 덧붙여서 이상치가 나타나지 않는 것이 보다 안정적으로 강우강도를 계산할 수 있는 경우라고 할 수 있을 것이다. 이런 관점에서 살펴본다면, 재현기간 30년의 경우 RMSE, RRMSE 모두 OF_II가 가장 정확한 결과값을 보인다고 말할 수 있으며, 재현기간 50년, 100년, 200년 모두, 재현기간 200년의 RRMSE가 OF_I이 가장 정확한 경우를 제외하고는 모두 OF_II가 가장 정확한 것으로 나타났다. 즉, 재현기간별로 정확도를 살펴본 8가지 경우 모두 누가분포함수를 활용한 강우강도식의 정확도가 회귀분석을 활용한 강우강도식보다 높은 정확도를 보이면서 동시에 안정적인 값을 보이는 것을 알 수 있다.
정확도의 비교를 위해서는 각 지점별로 모든 재현기간과 지속기간에 대한 RMSE, RRMSE값의 평균값을 비교하였으며, 보다 정확한 비교를 위하여 재현기간 30년, 50년, 100년, 200년에 해당하는 강우강도값만의 RMSE와 RRMSE, 그리고 지속시간 12시간을 기준으로 단기간과 장기간 지속 기간에 해당하는 강우강도값의 RMSE, RRMSE를 비교한 결과 누가분포함수를 활용한 강우강도식의 정확도가 기존의 회귀분석에 의한 강우강도식의 정확도보다 높은 것으로 나타났다.
이런 관점에서 살펴본다면, 재현기간 30년의 경우 RMSE, RRMSE 모두 OF_II가 가장 정확한 결과값을 보인다고 말할 수 있으며, 재현기간 50년, 100년, 200년 모두, 재현기간 200년의 RRMSE가 OF_I이 가장 정확한 경우를 제외하고는 모두 OF_II가 가장 정확한 것으로 나타났다. 즉, 재현기간별로 정확도를 살펴본 8가지 경우 모두 누가분포함수를 활용한 강우강도식의 정확도가 회귀분석을 활용한 강우강도식보다 높은 정확도를 보이면서 동시에 안정적인 값을 보이는 것을 알 수 있다.
후속연구
개체수는 유전자알고리즘이 수행될 때 사용될 가능해(possible solution)의 개수를 의미하는 것으로 많을수록 좋다고 생각하기 쉽지만 프로그램의 수행속도가 느려짐으로 인해서 생기는 단점을 고려해서 가장 적절한 개수의 개체수를 선택하는 것이 일반적이며, 유전자알고리즘의 수행회수를 결정하는 세대수는 일정한 회수가 반복되고 나면 목적함수의 개선정도가 뚜렷하게 낮아지는 지점을 선택해서 가장 작은 회수를 반복하도록 하는 것이 일반적이다. 결과적으로 개체수와 세대수 모두 유전자알고리즘을 이용해서 최적화를 할 경우 민감도 분석을 통해서 최적의 개수를 결정하는 과정이 필요하다.
최근의 집중호우에 의한 강우강도식 정확도의 변화를 살펴보기 위해서 2006년까지의 강우자료를 이용하여 누가분포함수를 활용한 강우강도식과 회귀분석을 활용한 강우강도식의 매개변수를 유전자알고리즘으로 각각 구한 후, 얻어진 강우강도식으로 강우강도를 구해서 RMSE, RRMSE를 비교한 결과 누가분포함수를 활용한 경우의 정확도가 더 높은 것으로 나타났다. 본 연구의 결과는 그 동안 제안자의 주관적인 판단에 의해서 제시되던 국내 강우강도식의 형태를 개선하는데 있어서 각 지점의 적정확률분포형을 고려한 강우강도식을 개발할 수 있음을 보여주는 것이며, 또한 강우강도식의 매개변수를 추정하는데 있어서도 최소자승법 등의 기존 방법보다 유연하다고 알려진 유전자알고리즘을 적용함으로써 보다 적절한 매개변수를 손쉽게 얻을 수 있어 국내의 수공구조물 설계 시 보다 유용하게 적용할 수 있을 것으로 판단된다.
질의응답
핵심어
질문
논문에서 추출한 답변
대상지점에 대한 적정확률분포형을 적합도검정등의 방법의 장단점은 무엇인가?
이런 방법은 정확한 확률강우량값을 얻을 수 있는 장점이 있는 반면에 적어도 30년 이상의 기간동안 구축된 강우량 자료가 필요하며, 확률분포형의 매개변수를 구하거나 적합도 검정을 하는 등의 과정에 상당히 전문적인 지식이 필요하다는 단점이 있다. 반면에, 빈도해석으로 구한 확률강우량을 활용한 강우강도식(intensity-duration-frequency curve)은, 빈도 해석을 통한 분석보다는 정확도가 떨어지지만 한번 강우강도식의 매개변수를 결정해놓으면 별다른 추가적인 작업 없이도 비교적 정확한 확률강우량 혹은 강우강도를 얻을 수 있으며, 또한 과거의 강우자료가 구축되지 않은 임의의 지속 기간에 대한 결과값도 손쉽게 얻을 수 있는 장점이 있다.
강우강도식은 무엇인가?
강우강도식은 강우강도-지속기간-재현기간(Intensity-DurationFrequency, IDF) 사이의 관계를 나타내기 위해서 사용하는 식으로, 주로 수공구조물을 설계할 때 복잡한 빈도해석(frequency analysis)을 거치지 않고 간략하게 원하는 재현기간에 대한 강우강도 혹은 확률강우량을 산정하기 위해서 사용한다. 우리나라에서는 주로 Talbot, Sherman, Japanese형과 같이 간단한 형태의 강우강도식이 사용되고 있으며, 국내에서 개발된 강우강도식은 이원환 등(1993), 허준행 등(1999)이 제안한 식이 있다.
유전자알고리즘이란 무엇인가?
유전자알고리즘은 1970년대에 Holland(1975)에 의해서 구체화되고 Goldberg(1989)에 의해서 각종 공학분야에 적용되기 시작한 기법으로, 염색체(chromosome)의 집합으로 이루어진 군(population)을 이용하여 교배(crossover), 돌연변이(mutation), 선택(selection)등의 유전자연산자(genetic operator)를 적용하여 주어진 문제의 최적해를 구하는 최적화기법이다. 유전자알고리즘은 기존의 최적화 기법들이 가지고 있었던 단점중의 하나인 목적함수(objective function)의 형태에 따른 기법적용의 제약이 없으며, 각종 제약조건들의 비선형성을 비교적 효율적으로 처리할 수 있는 최적화 기법으로 알려져 있다.
이원환(1980) 도시하천 및 하수도 개수계획상의 계획강우량 설정에 관한 추계학적 해석. 대한토목학회지, 대한토목학회, 제28권 제4호, pp. 81-93
이원환(1997) 개정판 수문학, 문운당, 서울
이원환, 박상덕, 최성열(1993) 한국 대표확률강우강도식의 유도. 대한토목학회 논문집, 대한토목학회, 제13권 제1호, pp. 115-120
한국건설기술연구원(2000) 강우자료 추출 및 확률강우량 산정프로그램 개발 최종보고서, 연세대학교 건설공학연구소
허준행, 김경덕, 한정훈(1999) 지속기간별 강우자료의 적정분포형 선정을 통한 확률강우강도식의 유도. 한국수자원학회 논문집, 한국수자원학회, Vol. 32, No. 3, pp. 247-254
Baldassarre, G.D., Brath, G., A., and Montanari, A. (2006) Reliability of different depth-duration-frequency equations for estimating short-duration design storms. Water Resources Research, 42, W12501, doi:10.1029/2006WR004911
Deb, K., Pratap, A., Agarwal, S., and Meyarivan, T. (2002) A fast and elitist multiobjective genetic algorithm: NSGA-II. Evolutionary Computation, IEEE Transactions on, Vol. 6, No. 2, pp. 182-197
Giustolisi, O., Savic, D. and Kapelan, Z., 2006. Multi-Objective Evolution Polynomial Regression, 7th International Conference on Hydroinformatics (HIC 2006), Nice, FRANCE
Holland, J.H. (1975) Adaptation in natural and artificial systems, University of Michigan Press
Kim, T. (2005) Multireservoir System Optimization Using Multi-Objective Genetic Algorithms, PhD dissertation, Yonsei University, Seoul
Koutsoyiannis, D., Kozonis, D., and Manetas, A. (1998) A mathematical framework for studying rainfall intensity-duration-frequency relationships. Journal of Hydrology, Vol. 206, No. 1-2, pp. 118-135
Meyer, A.F.B. (1928) The elements of hydrology, London, Chapman & Hall, New York, J. Wiley
Mohymont, B., Demaree, G.R., and Faka, D.N. (2004) Establishment of IDF-curves for precipitation in the tropical area of Central Africa - comparison of techniques and results. Natural Hazards and Earth System Sciences, Vol. 4, pp. 375-387
Sherman, C.W. (1931) Frequency and intensity of excessive rainfalls at Boston, Massachushtts. Transactions, ASCE, 95(Paper No.1780), pp. 951-960
Srinivas, N. and Deb, K. (1994) Multiobjective optimization using nondominated sorting in genetic algorithms. Evolutionary Computation, Vol. 2, No. 3, pp. 221-248
※ AI-Helper는 부적절한 답변을 할 수 있습니다.