다목적 유전자알고리즘을 이용한 Tank 모형 매개변수 최적화(I): 방법론과 모형구축 Optimization of Tank Model Parameters Using Multi-Objective Genetic Algorithm (I): Methodology and Model Formulation원문보기
본 연구의 목적은 개념적인 강우-유출모형인 Tank 모형의 매개변수를 산정하기 위한 다목적 유전자알고리즘의 적용성을 평가하는 것이다. 다목적 유전자알고리즘 기법으로는 최근에 가장 많이 사용되는 기법중의 하나인 NSGA-II를 채택하여 Tank 모형과 결합하였으며, 4가지 목적함수(유출용적오차, 평균제곱근 오차, 고수유량 평균제곱근 오차 및 저수유량 평균제곱근 오차)값을 최소화하는 형태의 목적함수를 적용하였다. NSGA-II는 목적함수의 개수가 많아지면 한 번의 실행에 의해 굉장히 많은 수의 파레토최적해를 구하는 단점을 가지고 있기 때문에 구해진 파레토최적해 중에서 어떤 해가 최우선해 인지를 결정해야 할 필요가 있으며, 이러한 고차원적인 의사결정을 위하여 선호적순서화(preference ordering) 기법을 적용하였다. NSGA-II를 이용하여 Tank모형의 매개변수를 추정할 때 초기조건이 최적화과정에 미칠 수 있는 영향을 최소화하기 위해 세대수(generation number)와 개체군의 크기(population size)에 대한 민감도분석을 수행하였다. 분석결과 Tank모형의 매개변수 최적화를 위한 세대수와 개체군 크기의 초기 값을 각각 900번과 1000개로 선정하는 것이 적합한 것으로 나타났다.
본 연구의 목적은 개념적인 강우-유출모형인 Tank 모형의 매개변수를 산정하기 위한 다목적 유전자알고리즘의 적용성을 평가하는 것이다. 다목적 유전자알고리즘 기법으로는 최근에 가장 많이 사용되는 기법중의 하나인 NSGA-II를 채택하여 Tank 모형과 결합하였으며, 4가지 목적함수(유출용적오차, 평균제곱근 오차, 고수유량 평균제곱근 오차 및 저수유량 평균제곱근 오차)값을 최소화하는 형태의 목적함수를 적용하였다. NSGA-II는 목적함수의 개수가 많아지면 한 번의 실행에 의해 굉장히 많은 수의 파레토최적해를 구하는 단점을 가지고 있기 때문에 구해진 파레토최적해 중에서 어떤 해가 최우선해 인지를 결정해야 할 필요가 있으며, 이러한 고차원적인 의사결정을 위하여 선호적순서화(preference ordering) 기법을 적용하였다. NSGA-II를 이용하여 Tank모형의 매개변수를 추정할 때 초기조건이 최적화과정에 미칠 수 있는 영향을 최소화하기 위해 세대수(generation number)와 개체군의 크기(population size)에 대한 민감도분석을 수행하였다. 분석결과 Tank모형의 매개변수 최적화를 위한 세대수와 개체군 크기의 초기 값을 각각 900번과 1000개로 선정하는 것이 적합한 것으로 나타났다.
The objective of this study is to evaluate the applicability of multi-objective genetic algorithm(MOGA) in order to calibrate the parameters of conceptual rainfall-runoff model, Tank model. NSGA-II, one of the most imitating MOGA implementations, is combined with Tank model and four multi-objective ...
The objective of this study is to evaluate the applicability of multi-objective genetic algorithm(MOGA) in order to calibrate the parameters of conceptual rainfall-runoff model, Tank model. NSGA-II, one of the most imitating MOGA implementations, is combined with Tank model and four multi-objective functions such as to minimize volume error, root mean square error (RMSE), high flow RMSE, and low flow RMSE are used. When NSGA-II is employed with more than three multi-objective functions, a number of Pareto-optimal solutions usually becomes too large. Therefore, selecting several preferred Pareto-optimal solutions is essential for stakeholder, and preference-ordering approach is used in this study for the sake of getting the best preferred Pareto-optimal solutions. Sensitivity analysis is performed to examine the effect of initial genetic parameters, which are generation number and Population size, to the performance of NSGA-II for searching the proper paramters for Tank model, and the result suggests that the generation number is 900 and the population size is 1000 for this study.
The objective of this study is to evaluate the applicability of multi-objective genetic algorithm(MOGA) in order to calibrate the parameters of conceptual rainfall-runoff model, Tank model. NSGA-II, one of the most imitating MOGA implementations, is combined with Tank model and four multi-objective functions such as to minimize volume error, root mean square error (RMSE), high flow RMSE, and low flow RMSE are used. When NSGA-II is employed with more than three multi-objective functions, a number of Pareto-optimal solutions usually becomes too large. Therefore, selecting several preferred Pareto-optimal solutions is essential for stakeholder, and preference-ordering approach is used in this study for the sake of getting the best preferred Pareto-optimal solutions. Sensitivity analysis is performed to examine the effect of initial genetic parameters, which are generation number and Population size, to the performance of NSGA-II for searching the proper paramters for Tank model, and the result suggests that the generation number is 900 and the population size is 1000 for this study.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
강우-유출모형 (rainfall-runoff model)의 목적 중에하나는 강우-유출이라는 자연현상을 이해하고, 이를 통해 다양한 수자원 문제에 요구되는 신뢰성 높은 유출량 자료를 산정하는데 있다. 이와 같은 유출모형은 복잡한 실세계를 단순한 형태로 개념화하여 표현하는데, 이러한 과정에서 많은 매개변수들이 필요하게 되며, 정확하고 신뢰성 있는 모형의 매개변수 산정은 강우-유출모형을 이용한 유출분석에 있어서 매우 중요한 과정이라 할 수 있다
본 연구에서는 다목적 최적화방법인 NSGA-Ⅱ를 이용하여 개념적 유출모형인 Tank 모형의 매개변수를 보다 신뢰성 있게 추정할 수 있는 방법을 제안하였다. 관측 유량에 대한 모의유량의 적합도를 향상시키기 위해 유출 용적 오차(V0와 평균제곱근오차(RMSE)를 목적함수로 선정하였으며, 홍수기 첨두유량 모의와 갈수기의 저수 유량 모의 정확도 개선을 위해 저수유량 및 고수 유량 평균제곱근오차(L & H_RMSE)도 목적함수로 고려하였다.
본 연구에서는 이를 해결하기 위한 방안의 하나로써, 다목적 유전자알고리즘 기법중의 하나인 NSGA-H (Non-dominated Sorting Genetic Algorithm-Ⅱ; Deb et. al., 2002) 와 선호적순서화 방법을 적용하여 Tank 모형의 매개변수를 추정하는 방법론을 제시하고 적용 결과를 분석하고자 한다.
제안 방법
관측 유량에 대한 모의유량의 적합도를 향상시키기 위해 유출 용적 오차(V0와 평균제곱근오차(RMSE)를 목적함수로 선정하였으며, 홍수기 첨두유량 모의와 갈수기의 저수 유량 모의 정확도 개선을 위해 저수유량 및 고수 유량 평균제곱근오차(L & H_RMSE)도 목적함수로 고려하였다. NSGA-Ⅱ는 목적함수의 수가 증가될수록 더욱 많은 수의 파레토최적해를 추정하므로, 구해진 파레토 최적해 중에서 어떤 해가 가장 우수한 해인지를 결정하기 위해 선호적순서화 기법이 적용되었다.
이것은 실제 자연현상의 진화(evolution) 에서 차세대 개체가 반드시 우성을 가지는 것은 아닌 것으로 쉽게 설명할 수 있다. 대부분의 기존 유전자 알고리즘 연구에서 이러한 초기조건을 명시하지 않거나임의적으로 선택한 값을 제시하였는데, 전역 최적해를 추정하기 위해서는 이러한 특성에 대한 분석이 선행되어야만 한다고 판단되므로, 본 연구에서는 초기조건 중영향이 크다고 판단되는 세대수 및 개체군 크기에 대한민감도 분석을 수행하였다.
유출용적오차는 유출량에 대한 모의 정확도를 향상시키기 위해 선정하였으며, 평균제곱근오차는 전체기간에서의 관측치와 모의치의 오차를 줄이고 적합성을 높이기 위해 채택하였다. 또한 홍수기에 발생하는 큰 고수유량 (peak flow) 모의와 갈수기 동안의 저수유량(low flow) 에 대한 모의 정확도를 향상시키고자 저수 및 고수 유량 평균 제곱근 오차를 선택하였다.
본 연구에서는 NSGA-Ⅱ를 이용하여 추정된 Tank 모형의 매개변수들이 물리적인 값의 범위를 벗어나지 않도록 제약조건을 설정하였다. NSGA-n 뿐만 아니라 모든 유전자 알고리즘 기법이 난수 발생 (random number generation) 에 의존하므로 발생된 난수가 유출모의에 부적합한 해를 산정하지 않도록 하여야 한다.
본 연구에서는 Tank 모형이 관측수문곡선을 전체적으로 잘 모의하도록 하기 위한 목적함수로 유출용적 오차(Volume Error, VE), 평균제곱근오차(Root Mean Square Error, RMSE), 저수유량 평균제곱근오차(Low Flow RMSE, L_RMSE), 고수유량 평균제곱근 오차 (High Flow RMSE, H_RMSE) 등 4개를 선정하였다. 유출용적오차는 유출량에 대한 모의 정확도를 향상시키기 위해 선정하였으며, 평균제곱근오차는 전체기간에서의 관측치와 모의치의 오차를 줄이고 적합성을 높이기 위해 채택하였다.
4와 같이 구축하였다. 우선 Tank 모형의 소스 코드를 수정하여 NSGA-n 기법과 결합한다. 그 다음 다양한 수문사상을 모의할 수 있는 매개변수의 추정이 가능하도록 적합한 목적함수들을 결정한다.
선정하였다. 유출용적오차는 유출량에 대한 모의 정확도를 향상시키기 위해 선정하였으며, 평균제곱근오차는 전체기간에서의 관측치와 모의치의 오차를 줄이고 적합성을 높이기 위해 채택하였다. 또한 홍수기에 발생하는 큰 고수유량 (peak flow) 모의와 갈수기 동안의 저수유량(low flow) 에 대한 모의 정확도를 향상시키고자 저수 및 고수 유량 평균 제곱근 오차를 선택하였다.
이러한 매개변수셑 중에서 더 적합한 셑을 선정하기 위해 세 가지 목적함수를 각 두 개의 목적함수 조합으로 만들고 이에 대한 파레토최적해를 산정한다(Table 1). Fig.
세대수와 개체군 크기가 결정되면 실제 적용을 통해 파레토최적해들을 추정하게 된다. 추정된 최적해들은 선호적순서화기법을 통해 최적해들의 수를 줄여나가게 되며, 최종적으로 최우선해를 선정하고 Tank 모형을 검정하게 된다.
대상 데이터
따라서, 본 연구에서는 단일목적함수인 RMSE 값을 최소화 시키는 것을 기준으로, 세대수 900회와 개체수 1000개인 경우를 채택하였다. 유전자 알고리즘이 해를 탐색하는데 있어서 적절한 세대수와 개체수를 결정하는 것은 매우 중요한 절차로써, 특히 Tank 모형과 같이 모형의 구조가 비교적 단순한 경우에는 민감도분석과 같은 절차를 수행하여 가장 적절한 개수의 세대수와 개체 수를 결정하는 절차가 반드시 필요하다고 할 수 있다.
그러나 전역최적해 산정의 가능성을 향상시키기 위해 세대수와 개체군 크기를 계속해서 증가시킬 경우, Tank 모형의 최적화 시에 해의 개선되는 정도에 비하여 과다한 계산 시간이 소요될 수 있으므로 최단의 계산 시간을 통해서 최고의 효율을 얻을 수 있는 초기조건을 결정하는 절차가 필요하다. 본 연구에서는 이와 같은 다목적 유전자알고리즘의 초기조건으로 최적 세대수 900개 및 개체군 크기 1000개를 선정하였다.
이론/모형
이런 현상은 파레토 지배가 가지는 원리를 생각하면 당연한 것으로, 목적함수가 많아지면 그 만큼 서로 비선점 (non-dominated) 관계에 있는 해의 개수가 늘어나게 되는 것이다. 따라서 다수의 파레토최적해 중 사용자가 원하는 파레토최적 해를 선택하는 과정이 필요하게 되며, 이를 위해서 본 연구에서는 선호적순서화(Das, 1999X 적용하였다. Khu and Madsen(2005)은 선호적순서화와 NSGA-Ⅱ를 강우 -유출모형인 MIKE11/NAM 모형의 매개변수의 추정에 적용하여, 390여개의 파레토 최적해 중에서 최종적으로 3개의 우수한 파레토 최적해를 추출하였다.
본 연구에서 적용한 다목적 유전자알고리즘 기법인 NSGA-H는 기존 NSGA(Srinivas and Deb, 1994)의 단점을 보완한 기법으로, 비선점 정렬방법 (non-dominated sorting)의 복잡도(complexity)가 감소하였으며, 사용자가 sharing parameter를 정의할 필요가 없이 군집거리 (crowding distance)를 도입하여 각각의 자원을 보다 효율적으로 배분(niching)되도록 하였고, 현재 세대 (genaration)의 최적해를 다음 세대로 넘겨주는 엘리티즘(elitism)이 적용되었다. 엘리티즘 적용으로 인해 수렴속도를 높였고, 군집거리 개념을 적용하여 순위를 결정하는 속도가 다른 다목적 유전자알고리즘 기법들보다 빠르다(Deb, 2002).
본 연구에서 적용한 저수 및 고수유량 평균 제곱근 오차는 Madsen(2000)이 제시한 사상(event)을 고려하는 방법을 적용하였다. Madsen(2000)은 저수 및 고수 유량을 구분하는 기준으로 특정 유량값을 이용하지 않고, 저수유량이 지속되는 사상 혹은 고수유량이 발생하는 사상들을 고려한 방법을 Eq.
본 연구에서는 다목적 유전자알고리즘인 NSGA-Ⅱ를 이용하여 Tank 모형의 매개변수를 추정하기 위한 방법을 Fig. 4와 같이 구축하였다. 우선 Tank 모형의 소스 코드를 수정하여 NSGA-n 기법과 결합한다.
성능/효과
또한 Fig. 6(b)와 같이 개체군 크기에 따른 변화를 살펴본 결과, 세대수의 증가에 따라 나타나는 목적함수의 뚜렷한 군집성에 비하여 일정한 경향이 나타나지는 않았지만, 개체군 크기가 클수록 보다 개선되는 경향을 나타냈다. Fig.
Fig. 6(c)와 같이 같은 개체군 크기에서 세대 수가 300 이하일 때에는 정도가 비교적 좋지 못한 해를 산정하는 것으로 나타났다. 결과적으로 세대수 500 이상, 개체군 크기 400 이상일 경우 NSGA-Ⅱ에서 산정되는 목적함수의 차이는 미세한 것으로 나타났다.
NSGA-Ⅱ의 Tank 모형 매개변수 추정 시 초기조건이 전역최적해 추정에 미칠 수 있는 영향을 최소화하기 위해 세대수와 개체군 크기에 대한 민감도분석을 수행한 결과 계산횟수가 늘어날수록 즉 세대수와 개체군 크기를 증가시킬수록 목적함수가 개선되는 것으로 나타났다. 그러나 전역최적해 산정의 가능성을 향상시키기 위해 세대수와 개체군 크기를 계속해서 증가시킬 경우, Tank 모형의 최적화 시에 해의 개선되는 정도에 비하여 과다한 계산 시간이 소요될 수 있으므로 최단의 계산 시간을 통해서 최고의 효율을 얻을 수 있는 초기조건을 결정하는 절차가 필요하다.
6(c)와 같이 같은 개체군 크기에서 세대 수가 300 이하일 때에는 정도가 비교적 좋지 못한 해를 산정하는 것으로 나타났다. 결과적으로 세대수 500 이상, 개체군 크기 400 이상일 경우 NSGA-Ⅱ에서 산정되는 목적함수의 차이는 미세한 것으로 나타났다.
세대수 및 개체군 크기 모두를 100부터 1000까지 100개의 단위로 그 조합을 달리하며 Tank 모형의 평균제곱근 오차의 변화를 살펴본 결과, 대체적으로 세대수 및 개체군 크기의 증가에 따라 목적 함수가 점차 적으로 감소하는 결과를 나타내었다. 그러나 초기조건에 최대의 값을 부여한 세대수 1000과 개체군의 크기 1000의 모의 결과와 세대수 900과 개체군의 크기 1000의 모의에 의한 결과값을 비교하면, 세대수 900에 의한 RMSE가 오히려 약 0.4X106의 차이로 더 우수한 것으로 나타났다.
2는 두 개씩의 목적함수 조합에 따른 매개변수셑들을 2차원 평면에 도시한 것이다. 목적함수 1과 목적함수 2의 조합으로부터 H, C, A의 파레토프론트 (Pareto-front)가 3차원 조합과 공통적인 파레토최적 해를 갖는 것으로 나타났다. 다른 두 조합인 목적함수 2 와 목적함수 3의 조합은 각각 8개 (J, I , H, G, F, E, B, A)와 4개(H, K , L, J)가 파레토최적해인 것으로 나타났다.
5는 NSGA-Ⅱ의 목적함수로 단일 목적함수인 RMSE를 사용하여 수행한 최적화의 결과를 도시한 것으로, 세로축은 목적함수인 RMSE를 나타내며, 삼각형 표시들은 각 세대수 및 개체군 크기에 따른 목적함수값을 나타낸다. 세대수 및 개체군 크기 모두를 100부터 1000까지 100개의 단위로 그 조합을 달리하며 Tank 모형의 평균제곱근 오차의 변화를 살펴본 결과, 대체적으로 세대수 및 개체군 크기의 증가에 따라 목적 함수가 점차 적으로 감소하는 결과를 나타내었다. 그러나 초기조건에 최대의 값을 부여한 세대수 1000과 개체군의 크기 1000의 모의 결과와 세대수 900과 개체군의 크기 1000의 모의에 의한 결과값을 비교하면, 세대수 900에 의한 RMSE가 오히려 약 0.
동일 세대수에 있는 목적함수들은 각각의 개체군 크기에 따라 분포하는데 개체군 크기가 커질수록 목적함수 값이 작게 나타나는 것을 볼 수 있다. 세대수가 500 이상일 때에는 비교적 군집하는 분포를 보이는데 이것은 세대수를 500 이상으로 적용하였을 때에 개체군 크기에 따른 영향이 줄어들어 목적함수들의 편차가 현저하게 줄어드는 것으로 나타났다. 또한 Fig.
후속연구
다목적 유전자알고리즘의 경우 세대수는 그 크기를 증가시킨다고 해서 반드시 해의 정확도가 항상 향상되는 것은 아니며, 개체수의 크기를 증가시킬 경우에는 계산 시간이 급격하게 늘어나며 해의 수렴성 또한 떨어지게 되는 것이 일반적이다. 결과적으로 이러한 결정은 공학적으로 유리하지 못한 선택이 될 수도 있으므로 실제 최적화 수행 전에 이러한 유전자 알고리즘의 특성에 대한 고찰이 본 연구에서와 같이 충분히 선행되어야 할 것이다.
참고문헌 (17)
건설교통부 (2000). 수자원장기종합계획(water vision 2020) 보고서
Das, I. (1999). 'A preference ordering among various Pareto optimal alternatives', Structural and Multidisciplinary Optimization, Vol. 18(1), pp. 3035
Deb, K, Pratap, A., Agarwal, S., and Meyarivan, T. (2002). 'A fast and elitist multiobjective genetic algorithm: NSGA-II', IEEE Transactions on Evolutionary Computation, Vol. 6(2), pp. 182-197
Duan, Q. (1991). A global optimization strategy for efficient and effective calibration of hydrologic models, PhD dissertation, University of Arizona, Tucson
Duan, Q. (2002). 'Global optimization for watershed model calibration', Calibration of Watershed Models, Q. Duan, H. V. Gupta, S. Sorooshian, A. N. Rousseau, and R. Turcotte, eds., American Geophysical Union
Gupta, H.V., Sorooshian, S., and Yapo, P.O. (1998). 'Toward improved calibration of hydrologic models: Multiple and noncornmensurable measures of information', Water Resources Research, Vol. 34(4), pp. 751-763
Holland, J.H. (1975). Adaptation in natural and artificial systems, University of Michigan Press
Khu, S. T., and Madsen, H. (2005). 'Multiobjective calibration with Pareto preference ordering: An application to rainfall-runoff model calibration', Water Resources Research, Vol. 41(3), W03004, doi:10.1029/2004WR003041
Madsen, H. (2000). 'Automatic calibration of a conceptual rainfall-runoff model using multiple objectives', Journal of Hydrology, Vol. 235(3-4), pp. 276-288
Srinivas, N., and Deb, K. (1994). 'Multiobjective optimization using nondominated sorting in genetic algorithms', Evolutionary Computation, Vol. 2(3), pp. 221-248
Van Veldhuizen, D.A., and Lamont, G.B. (2000). 'Multiobjective evolutionary algorithms: Analyzing the state-of-the-art', Evolutionary Computation, Vol. 8(2), pp. 125-147
Vrugt, J.A., Gupta, H.V., Bastidas, L.A., Bouten, W., and Sorooshian, S. (2003). 'Effective and efficient algorithm for multiobjective optimization of hydrologic models', Water Resources Research, Vol. 39(8), 1214, doi:10.1029/2002WR001746
Yokoo, Y., Kazama, S., Sawamoto, M., and Nishimura, H. (2001). 'Regionalization of lumped water balance model parameters based on multiple regression', Journal of Hydrology, Vol. 246(1-4), pp. 209-222
※ AI-Helper는 부적절한 답변을 할 수 있습니다.