통합모델의 강수물리과정 모수 최적화를 위한 알고리즘 비교 연구 : 마이크로 유전알고리즘과 하모니 탐색 알고리즘 An intercomparison study between optimization algorithms for parameter estimation of microphysics in Unified model : Micro-genetic algorithm and Harmony search algorithm원문보기
기상수치예보모델의 강수물리과정은 강수 발생과 연관된 입자의 낙하속도, 부착 및 자동전환, 입자크기분포 등의 과정을 다룬다. 하지만 수치예보모델의 미세물리과정과 모수에는 상당한 불확실성이 내포되어 있다. 수치예보모델의 불확실성을 줄이기 위하여 일반적으로 모수 추정을 사용한다. 이 연구에서는 모수 추정을 위한 최적화 알고리즘으로 마이크로 유전알고리즘과 하모니탐색 알고리즘을 사용하고 우리나라에서 발생한 강수사례에 대해 통합모델의 강수물리과정에서 사용하는 모수를 최적화하였다. 두 알고리즘의 서로 다른 특성으로 인해 최적화 과정 중의 차이가 보였다. 마이크로 유전알고리즘은 440회 수행 후 약 1.033의 적합도로 수렴하였고 하모니탐색 알고리즘은 60번 수행 후 약 1.031의 적합도로 수렴하였다. 이를 통해 하모니탐색 알고리즘이 마이크로 유전알고리즘보다 더 빨리 최적의 모수를 탐색하는 것을 알 수 있었다. 따라서 계산비용이 방대한 기상수치예보모델의 최적화 문제에서 빠른 시간 내에 최적의 모수를 탐색해야 한다면 하모니 탐색 알고리즘이 더 적합하다는 것을 확인하였다.
기상수치예보모델의 강수물리과정은 강수 발생과 연관된 입자의 낙하속도, 부착 및 자동전환, 입자크기분포 등의 과정을 다룬다. 하지만 수치예보모델의 미세물리과정과 모수에는 상당한 불확실성이 내포되어 있다. 수치예보모델의 불확실성을 줄이기 위하여 일반적으로 모수 추정을 사용한다. 이 연구에서는 모수 추정을 위한 최적화 알고리즘으로 마이크로 유전알고리즘과 하모니탐색 알고리즘을 사용하고 우리나라에서 발생한 강수사례에 대해 통합모델의 강수물리과정에서 사용하는 모수를 최적화하였다. 두 알고리즘의 서로 다른 특성으로 인해 최적화 과정 중의 차이가 보였다. 마이크로 유전알고리즘은 440회 수행 후 약 1.033의 적합도로 수렴하였고 하모니탐색 알고리즘은 60번 수행 후 약 1.031의 적합도로 수렴하였다. 이를 통해 하모니탐색 알고리즘이 마이크로 유전알고리즘보다 더 빨리 최적의 모수를 탐색하는 것을 알 수 있었다. 따라서 계산비용이 방대한 기상수치예보모델의 최적화 문제에서 빠른 시간 내에 최적의 모수를 탐색해야 한다면 하모니 탐색 알고리즘이 더 적합하다는 것을 확인하였다.
The microphysical processes of the numerical weather prediction (NWP) model cover the following : fall speed, accretion, autoconversion, droplet size distribution, etc. However, the microphysical processes and parameters have a significant degree of uncertainty. Parameter estimation was generally us...
The microphysical processes of the numerical weather prediction (NWP) model cover the following : fall speed, accretion, autoconversion, droplet size distribution, etc. However, the microphysical processes and parameters have a significant degree of uncertainty. Parameter estimation was generally used to reduce errors in NWP models associated with uncertainty. In this study, the micro- genetic algorithm and harmony search algorithm were used as an optimization algorithm for estimating parameters. And we estimate parameters of microphysics for the Unified model in the case of precipitation in Korea. The differences which occurred during the optimization process were due to different characteristics of the two algorithms. The micro-genetic algorithm converged to about 1.033 after 440 times. The harmony search algorithm converged to about 1.031 after 60 times. It shows that the harmony search algorithm estimated optimal parameters more quickly than the micro-genetic algorithm. Therefore, if you need to search for the optimal parameter within a faster time in the NWP model optimization problem with large calculation cost, the harmony search algorithm is more suitable.
The microphysical processes of the numerical weather prediction (NWP) model cover the following : fall speed, accretion, autoconversion, droplet size distribution, etc. However, the microphysical processes and parameters have a significant degree of uncertainty. Parameter estimation was generally used to reduce errors in NWP models associated with uncertainty. In this study, the micro- genetic algorithm and harmony search algorithm were used as an optimization algorithm for estimating parameters. And we estimate parameters of microphysics for the Unified model in the case of precipitation in Korea. The differences which occurred during the optimization process were due to different characteristics of the two algorithms. The micro-genetic algorithm converged to about 1.033 after 440 times. The harmony search algorithm converged to about 1.031 after 60 times. It shows that the harmony search algorithm estimated optimal parameters more quickly than the micro-genetic algorithm. Therefore, if you need to search for the optimal parameter within a faster time in the NWP model optimization problem with large calculation cost, the harmony search algorithm is more suitable.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 이 연구에서는 통합모델의 강수 물리과정 최적화를 위해 메타-휴리스틱 계열의 알고리즘 중에서 초기 수렴성이 좋은 것으로 알려진 μ-GA와 HS를 비교하였다.
이 연구에서는 통합모델 강수물리과정의 효율적인 최적화를 위해 μ-GA와 HS의 탐색 특성을 비교하였다.
이 절에서는 통합모델의 강수물리 모수화 과정과 최적화하고자 하는 모수, 최적화 알고리즘, 실험 사례, 적합도 함수 구성 방법에대해 설명하고자 한다.
따라서 이 연구에서는 통합모델의 강수 물리과정 최적화를 위해 메타-휴리스틱 계열의 알고리즘 중에서 초기 수렴성이 좋은 것으로 알려진 μ-GA와 HS를 비교하였다. 초기 수렴 속도, 모수에 대한 탐색 특징, 강수예측성능 향상에 미치는 각 모수별 민감도를 분석하여 계산비용이 방대한 기상수치예보모델의 최적화 문제에 효율적으로 사용할 수 있는 방법에 대해 고찰하고자 한다.
가설 설정
특히 통합모델에서는 N0 -λ의 관계식을 식 (2)와 같이 x1과 x2를 사용하여 모수화하고 있다. 이 연구에서는 강우입자분포에서 x1과 x2를 최적화를 위한 모수로 선정하였다.
제안 방법
3가지 강수 사례에 대해 통합모델을 이용하여 24시간 강수예측을 수행하고, 예측한 1시간 누적 강수량에 대해 기상청자동기상관측망(Automatic Weather Station, AWS) 관측 자료를 이용하여 검증하였다. 이 연구에서 사용한 AWS 관측자료는 사례별로 각각 699, 702, 703개 이다.
세 번째 사례는 2015년 7월 24일 수도권 지역을 중심으로 일 누적강수량 약 100 mm가 기록된 사례이다. 3가지 사례모두 집중호우가 발생한 사례이지만, 강수가 집중된 지역이 서로 다른 사례를 선정하여 다양한 강수 유형에 대해 동시에 최적화가 되도록 하였다.
각 알고리즘별 모수 탐색 과정을 살펴보면 μ-GA는 지역탐색특성이 반영되어 재시작을 반복하며 높은 적합도의 모수 부근으로 수렴하여 추가적으로 반복한다면 더 높은 적합도의 모수로 수렴할 가능성을 보여주었다. HS는 적합도가 높은 모수로 빠르게 수렴한 뒤 그 값에 대한 확인 작업을 반복적으로 수행하였다.
이러한 원인은 두 알고리즘의 수행 과정의 차이로μ-GA는 한 세대 내에서 소수의 개체들에 대한 값이 할당되고 세대 내의 각 개체들에 대한 적합도 판정 후 다음 세대에 적합도 판정결과가 반영되는 과정으로 수행되기 때문에 HS보다 수렴속도가 느린 것으로 판단된다. 그리고 HS는 탐색 초기에 빠른 속도로 높은 적합도의 값을 탐색하고 그 값에 대한 확인 절차를 지속적으로 수행하였다.
그림 6은 μ-GA가 탐색한 전체 모수에 대한 적합도 분포이고, 그림 7은 HS를 적용하였을 때의 분포이다. 각 모수간의 민감도 비교를 위해 5개의 모수(x1, x2, 지표입자 수농도(ndrop), 구름과 강수의 상관계수(corr), 입자 감소 고도(height))간의 상대분포를 각각 나타내었다. 또한 그림에서 색은 적합도를 나타내며 빨간색으로 표시될수록 적합도가 높음을 의미한다.
경계층에서 지표까지 구름입자의 수농도를 점차 감소시키는 과정에 사용되는 지표입자 수농도(ndrop)와 입자 감소 고도(height)를 최적화 모수로 선택하였다. 여기서, 입자 감소 고도는 구름입자의 수농도가 감소되기 시작하는 고도를 의미한다.
각 모수의 탐색범위는 표 1의 최소, 최댓값을 적용하였고 돌연변이 연산은 없도록 하였다. 교배방법은 single point crossover와 uniform crossover 방법이 있지만 uniform crossover 방법을 사용하여 0.5의 교배율로 설정하였다. uniform crossover는 부모 사이에 고정된 혼합비율을 사용하고 0.
적합도를 계산할 때, 식 (8)에서 통합모델의 기본 값으로 나누어 줌에 따라 1 이상의 적합도를 가지면 기존의 통합모델 결과(CNTL)보다 개선되었다고 할 수 있다. 구성된 적합도 함수를 이용하여 3가지 강수 사례에 대해 강수량을 예측하고 적합도 평가를 하게 된다.
이러한 원인은 두 알고리즘의 수행 과정의 차이로μ-GA는 한 세대 내에서 소수의 개체들에 대한 값이 할당되고 세대 내의 각 개체들에 대한 적합도 판정 후 다음 세대에 적합도 판정결과가 반영되는 과정으로 수행되기 때문에 HS보다 수렴속도가 느린 것으로 판단된다. 그리고 HS는 탐색 초기에 빠른 속도로 높은 적합도의 값을 탐색하고 그 값에 대한 확인 절차를 지속적으로 수행하였다.
지표입자 수농도(ndrop)는 통합모델 내에서 모수를 이용하여 섭동을 만들 때 적용하는 범위를 사용하였다[14]. 그리고 입자 감소 고도(height)는 현재 150m의 값을 사용하고 있으며 고도를 낮추는 범위로 넓히기 위해 100m부터 시작하고 하층운의 계산에 영향을 주지 않기 위해 500m로 범위를 제한하였다.
기상수치예보모델의 일종인 통합모델의 강수물리과정을 최적화하기 위하여 μ-GA와 HS를 사용하였고, 두 알고리즘의 최적화 과정에서 나타나는 특징을 살펴보았다.
57을 사용한 바 있다[13]. 두 모수는 강수유형에 따라 적합한 모수 값의 변동 폭이 크기 때문에 각각 0.05에서 100, 1에서 10으로 범위를 넓게 하여 모수를 탐색하도록 하였다. 구름과 강수의 상관계수(corr)는 현재 0.
통합모델의 강수물리과정 최적화 실험 과정은 그림 1과 같다. 먼저 2가지 알고리즘에 최적화하고자 하는 5개의 모수를 적용하고, 추정된 모수를 이용하여 통합모델에서 강수량을 예측하면 강수예측숙련도를 기반으로 한 적합도 평가를 통하여 최적모수를 반복적으로 탐색하는 구조로 시스템을 구축하였다.
이 연구에서 사용한 AWS 관측자료는 사례별로 각각 699, 702, 703개 이다. 분할표를 이용하여 검증하는 강수검증 지수 중 가장 대표적인 BIAS(Bias)와 CSI(Critical SuccessIndex)를 이용하여 적합도 함수를 구성하였다. BIAS와 CSI는 각각 식 (6)과 식 (7)처럼 계산된다.
새로운 하모니 벡터 값은 μ-GA 실험에서와 마찬가지로 표 1의 최소, 최댓값을 적용하여 각 모수의 범위 내에서 선택되도록 하였다.
선정된 3가지 강수 사례에 대해 동시에 강수예측성능을 개선하도록 μ-GA와 HS를 각각 적용하여 최적화를 수행하였다.
이 연구에서는 통합모델 강수물리과정의 효율적인 최적화를 위해 μ-GA와 HS의 탐색 특성을 비교하였다. 우리나라 여름철에 발생한 대표적인 3가지 강수 사례를 이용하고 통합모델 강수물리과정에 사용되는 5가지 모수에 대해 최적화 실험을 수행하였다.
이 연구를 통해 기상수치모델의 물리과정 최적화 문제에 대한 두 알고리즘의 특성을 확인하였다. HS가 μ-GA 보다 초기수렴속도가 빠른 것을 확인하였다.
최적화를 위해 통합모델의 강수물리과정 중에서 강우입자크기분포, 입자의 부착 및 자동 전환 과정과 관련된 5가지 모수에 대해 최적화 실험을 수행하였다. 강우입자크기분포는 3개의 매개변수를 가지는 감마함수 형태로 식 (1)과 같이 표현된다[10].
한편, 입자의 부착과정에 사용되는 구름과 강수의 상관계수(p, corr)도 최적화 모수로 선정하였다. 입자의 부착과정 Macc은 식 (4)로 계산되고, 추가 보정과정을 거치는데 보정인자 E는 식 (5)와 같다[11].
대상 데이터
우리나라에서 발생한 호우의 대표 사례를 반영하기 위하여 남부, 영동, 수도권지역에서 발생한 3가지 강수사례를 선정하였다. 3가지 사례는 모두 일 누적강수량 100 mm 이상의 여름철 집중호우 사례이며, 첫 번째 사례는 2014년 8월 1일 태풍 나크리(NAKRI)의 영향으로 남부지방에 일 누적강수량 약 400 mm가 기록된 사례이다. 두 번째 사례는 2015년 6월 25일 온대저기압의 영향으로 전국적으로 강수가 있었으며, 특히 영동지방에 일 누적강수량 약 200 mm가 기록되었다.
3가지 사례는 모두 일 누적강수량 100 mm 이상의 여름철 집중호우 사례이며, 첫 번째 사례는 2014년 8월 1일 태풍 나크리(NAKRI)의 영향으로 남부지방에 일 누적강수량 약 400 mm가 기록된 사례이다. 두 번째 사례는 2015년 6월 25일 온대저기압의 영향으로 전국적으로 강수가 있었으며, 특히 영동지방에 일 누적강수량 약 200 mm가 기록되었다. 세 번째 사례는 2015년 7월 24일 수도권 지역을 중심으로 일 누적강수량 약 100 mm가 기록된 사례이다.
두 번째 사례는 2015년 6월 25일 온대저기압의 영향으로 전국적으로 강수가 있었으며, 특히 영동지방에 일 누적강수량 약 200 mm가 기록되었다. 세 번째 사례는 2015년 7월 24일 수도권 지역을 중심으로 일 누적강수량 약 100 mm가 기록된 사례이다. 3가지 사례모두 집중호우가 발생한 사례이지만, 강수가 집중된 지역이 서로 다른 사례를 선정하여 다양한 강수 유형에 대해 동시에 최적화가 되도록 하였다.
우리나라에서 발생한 호우의 대표 사례를 반영하기 위하여 남부, 영동, 수도권지역에서 발생한 3가지 강수사례를 선정하였다. 3가지 사례는 모두 일 누적강수량 100 mm 이상의 여름철 집중호우 사례이며, 첫 번째 사례는 2014년 8월 1일 태풍 나크리(NAKRI)의 영향으로 남부지방에 일 누적강수량 약 400 mm가 기록된 사례이다.
이 연구에서 μ-GA 실험에 사용된 세대는 총 50세대이며, 각 세대 당 개체 수는 12개이다.
3가지 강수 사례에 대해 통합모델을 이용하여 24시간 강수예측을 수행하고, 예측한 1시간 누적 강수량에 대해 기상청자동기상관측망(Automatic Weather Station, AWS) 관측 자료를 이용하여 검증하였다. 이 연구에서 사용한 AWS 관측자료는 사례별로 각각 699, 702, 703개 이다. 분할표를 이용하여 검증하는 강수검증 지수 중 가장 대표적인 BIAS(Bias)와 CSI(Critical SuccessIndex)를 이용하여 적합도 함수를 구성하였다.
이론/모형
모수 추정에는 다양한 방법이 사용되고 있지만 이 연구에서는 마이크로 유전알고리즘(Microgenetic algorithm, μ-GA)과 하모니 탐색 알고리즘(Harmony search algorithm, HS)을 사용하고자 한다.
이 연구에서는 ENDGame(Even Newer Dynamics for General Atmospheric Modeling of the Environment) 기반의 통합모델 버전 9.0을 사용하는 국지예보모델을 사용하였다. 국지예보모델의 예측 영역은 그림 2와 같이 극동아시아 지역으로 한반도 지역은 1.
성능/효과
(a)의 남부지방 강우 사례는 약 90 mm 이상의 강수에서 두 알고리즘 모두 CNTL보다 약 ETS 0.05의 값이 감소하였지만 약120 mm 이상의 강수에서는 μ-GA는 ETS가 약 0.1 증가하였고, HS는 약 0.15 증가하였다.
(b)의 영동지방 강우 사례는 20 mm 이상의 강수에서 μ-GA와 HS가 CNTL 강수 예측성을 개선하는 것을 확인할 수 있었다.
(c)의 수도권 강우 사례도 μ-GA와 HS가 CNTL 보다 ETS 값이 약 0.05 상승하면서 강수 예측성이 개선되는 것을 확인하였다.
100 mm 이상의 강한 강수에서 CNTL보다 μ-GA와 HS가 예측성을 개선하는 것을 볼 수 있었다.
각 알고리즘별 모수 탐색 과정을 살펴보면 μ-GA는 지역탐색특성이 반영되어 재시작을 반복하며 높은 적합도의 모수 부근으로 수렴하여 추가적으로 반복한다면 더 높은 적합도의 모수로 수렴할 가능성을 보여주었다.
HS가 μ-GA 보다 초기수렴속도가 빠른 것을 확인하였다. 그리고 μ-GA는 수행 기간 동안 지속적으로 더 높은 적합도로 수렴되는 양상을 보여 추가적으로더 높은 적합도의 모수로 수렴할 가능성을 보여주었다. 이러한 두 알고리즘의 탐색 특성을 이해하고 장점을 활용하여 상황에 따라 알고리즘을 적절히 선택한다면 더 적합한 최적화를 수행할 수 있을 것이다.
이러한 결과는 강수 예측성에 x2가 가장 민감한 모수임을 보여주었다. 그리고 최적화 된 값을 적용하여 강수 예측성을 검증해 보았을 때, 두 알고리즘 모두 기존의 결과를 개선하였고 특히 강한 강수에 대해 개선되는 정도가 컸다.
남부지방 사례에 대해서는 HS가 μ-GA 보다 높은 강수예측 성능을 보였으나, 영동지방과 수도권 사례에서는 μ-GA가 HS보다 다소 높은 강수 예측성능을 보였다.
또한 HS의 예측성 검증 결과가 μ-GA보다 더 높은 것을 볼 수 있었다.
또한, 최적화된 다섯 모수 중 x2는 다른 모수 값에 상관없이 약 1.7 에서 항상 적합도가 높다는 것을 확인하였고, 두 알고리즘에서도 상당히 유사한 값을 산출하였다. 이러한 결과는 강수 예측성에 x2가 가장 민감한 모수임을 보여주었다.
사례별 최적화된 결과를 임계값 별로 정리해보면 남부지방사례에서는 110 mm 이상의 강한 강수에 대한 예측을 획기적으로 개선하였고, 영동지방의 사례는 25 mm 이상의 강한 강수에 대해서 개선하였다. 수도권 사례에서는 전체 임계값에 대해 개선하였다.
총 600번 수행 중 μ-GA는 440번째에서 최대 적합도가 되었고, HS는 60번째 수행에서 최대적합도가 되어 HS가 μ-GA보다 초기 수렴속도가 더 빠르다는 것을 알 수 있다.
최종 수렴된 결과에서 최적 모수를 탐색하기까지의 시간을 보면 HS가 μ-GA보다 더 빨랐다.
후속연구
그리고 μ-GA는 수행 기간 동안 지속적으로 더 높은 적합도로 수렴되는 양상을 보여 추가적으로더 높은 적합도의 모수로 수렴할 가능성을 보여주었다. 이러한 두 알고리즘의 탐색 특성을 이해하고 장점을 활용하여 상황에 따라 알고리즘을 적절히 선택한다면 더 적합한 최적화를 수행할 수 있을 것이다.
참고문헌 (20)
J. Wilkinson, R. Forbes, D. Wilson, The large-scale precipitation parameterization scheme, Unified model documentation paper 026, 2015.
M. Tong, and M. Xye, "Simultaneous estimation of microphysical parameters and atmospheric state with simulated radar data and ensemble square root kalman filter. Part I: Sensitivity analysis and parameter identifiability", Monthly weather review, vol. 136, pp. 1630-1648, 2008.
H. Moradkhani, S. Sorooshian, H. V. Gupta, P. R. Houser, "Dual state-parameter estimation of hydrological models using ensemble kalman filter", Advances in water resources, vol. 28, pp. 135-147, 2005.
Y. H. Lee, S. K. Park, and D. E. Chang, "Parameter estimation using the genetic algorithm and its impact on quantitative precipitation forecast", Annales Geophysicae, vol. 24, pp. 3185-3189, 2006.
X. Yu, S. K. Park, Y. H. Lee, and Y. S. Choi, "Quantitative precipitation forecast of a tropical cyclone through optimal parameter estimation in a convective parameterization", SOLA, vol. 9, pp. 36-39, 2013.
S. Hong, X. Yu, S. K. Park, Y. S. Choi, and B. Myoung, "Assessing optimal set of implemented physical parameterization schemes in a multi-physics land surface model using genetic algorithm", Geoscientific Model Development, vol. 7, pp. 2517-2529, 2014.
S. Hong, S. K. Park, and X. Yu, "Scheme-Based Optimization of land surface model using a micro-genetic algorithm: Assessment of its performance and usability for regional applications", SOLA, vol. 11, pp. 129-133, 2015.
X. S. Yang, "Harmony Search as Metaheuristic Algorithm", Studies in Computational Intelligence, Springer Berlinm, vol. 191, pp. 1-14, 2009.
C. Peraza, F. Valdez, and O. castillo, "A Harmony search algorithm comparison with genetic algorithms", Fuzzy logic augmentation of nature-inspired optimizatio nmetaheuristics, vol. 574, pp. 105-123. 2015.
S. J. Abel, and I. A. Boutle, "An improved representation of the raindrop size distribution for single-moment microphysics schemes", Quarterly Journal of the Royal Meteorological Society, vol. 138, pp. 2151-2162, 2012.
I. A. Boutle, S. J. Abel, P. G. Hill and C. J. Morcrette, "Spatial variability of liquid cloud and rain : observations and microphysical effects", Quarterly Journal of the Royal Meteorological Society, vol. 140, pp. 583-594, 2014.
J. M. Wilkinson, A. N. F. Porson, F. J. Bornemann, M. Weeks, P. R. Field and A. P. Lock, "Improved microphysical parameterization of drizzle and fog for operational forecasting using the Met Office Unified Model", Quarterly Journal of the Royal Meteorological Society, vol. 139, pp. 488-500, 2013.
J. Wilkinson, R. Forbes, D. Wilson, The large-scale precipitation parameterization scheme, Unified model documentation paper 026, 2011.
S. Beare, W. Tennant, and C. Sanchez, Stochastic Physics Code in the UM, Unified model documentation paper 081, 2015.
J. Holland, Adaptation in natural and artificial systems, University of Michigan Press, 1975.
D. E. Goldberg, Genetic algorithms in search, optimization and machine learning, Addison-Wesley, 1989.
K. Krishnakumar, "Micro-genetic Algorithm for Stationary and Non-stationary Function Optimization", Intelligent Control and Adaptive Systems, Vol. 1196, pp. 282-296. 1989.
Y. H. Lee, J. E. Nam, S. W. Joo, "Optimization of Z-R relationship in the summer of 2014 using a micro genetic algorithm", JKIIS, vol. 26, no. 1, pp. 1-8, 2016.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.