Bayesian MCMC를 이용한 저수량 점 빈도분석: I. 이론적 배경과 사전분포의 구축 At-site Low Flow Frequency Analysis Using Bayesian MCMC: I. Theoretical Background and Construction of Prior Distribution원문보기
저수분석(low flow analysis)은 수자원공학에서 중요한 분야 중 하나이며, 특히 저수량 빈도분석(low flow frequency analysis)의 결과는 저수(貯水)용량의 설계, 물 수급계획, 오염원의 배치 및 관개와 생태계의 보존을 위한 수량과 수질의 관리에 중요하게 사용된다. 그러므로 본 연구에서는 저수량 빈도분석을 위한 점 빈도분석을 수행하였으며, 특히 빈도분석에 있어서의 불확실성을 탐색하기 위하여 Bayesian 방법을 적용하고 그 결과를 기존에 사용되던 불확실성 탐색방법과 비교하였다. 본 논문의Ⅰ편에서는 Bayesian 방법 중 사전분포(prior distribution)와 우도함수(likelihood function)의 복잡성에 상관없이 계산이 가능한 Bayesian MCMC(Bayesian Markov Chain Monte Carlo) 방법과 Metropolis-Hastings 알고리즘을 사용하기 위한 여러 과정의 이론적 배경과 Bayesian 방법에서 가장 중요한 요소인 사전분포를 구축하고 이를 비교 및 평가하였다. 고려된 사전분포는 자료에 기반하지 않은 사전분포와 자료에 기반한 사전분포로써 두 사전분포를 이용하여 Metropolis-Hastings 알고리즘을 수행하고 그 결과를 비교하여 저수량 빈도분석에 합리적인 사전분포를 선정하였다. 또한 알고리즘의 수행과정에서 필요한 제안분포(proposal distribution)를 적용하여 그에 따른 알고리즘의 효율성을 채택률(acceptance rate)을 산정하여 검증해 보았다. 사전분포의 분석 결과, 자료에 기반한 사전분포가 자료에 기반하지 않은 사전분포보다 정확성 및 불확실성의 표현에 있어서 우수한 결과를 제시하는 것을 확인할 수 있었고, 채택률을 이용한 알고리즘의 효용성 역시 기존 연구자들이 제시하였던 만족스러운 범위를 가지는 것을 알 수 있었다. 최종적으로 선정된 사전분포는 본 연구의 II편에서 Bayesian MCMC방법의 사전분포로 이용되었으며, 그 결과를 기존 불확실성의 추정방법의 하나인 2차 근사식을 이용한 최우추정(maximum likelihood estimation)방법의 결과와 비교하였다.
저수분석(low flow analysis)은 수자원공학에서 중요한 분야 중 하나이며, 특히 저수량 빈도분석(low flow frequency analysis)의 결과는 저수(貯水)용량의 설계, 물 수급계획, 오염원의 배치 및 관개와 생태계의 보존을 위한 수량과 수질의 관리에 중요하게 사용된다. 그러므로 본 연구에서는 저수량 빈도분석을 위한 점 빈도분석을 수행하였으며, 특히 빈도분석에 있어서의 불확실성을 탐색하기 위하여 Bayesian 방법을 적용하고 그 결과를 기존에 사용되던 불확실성 탐색방법과 비교하였다. 본 논문의Ⅰ편에서는 Bayesian 방법 중 사전분포(prior distribution)와 우도함수(likelihood function)의 복잡성에 상관없이 계산이 가능한 Bayesian MCMC(Bayesian Markov Chain Monte Carlo) 방법과 Metropolis-Hastings 알고리즘을 사용하기 위한 여러 과정의 이론적 배경과 Bayesian 방법에서 가장 중요한 요소인 사전분포를 구축하고 이를 비교 및 평가하였다. 고려된 사전분포는 자료에 기반하지 않은 사전분포와 자료에 기반한 사전분포로써 두 사전분포를 이용하여 Metropolis-Hastings 알고리즘을 수행하고 그 결과를 비교하여 저수량 빈도분석에 합리적인 사전분포를 선정하였다. 또한 알고리즘의 수행과정에서 필요한 제안분포(proposal distribution)를 적용하여 그에 따른 알고리즘의 효율성을 채택률(acceptance rate)을 산정하여 검증해 보았다. 사전분포의 분석 결과, 자료에 기반한 사전분포가 자료에 기반하지 않은 사전분포보다 정확성 및 불확실성의 표현에 있어서 우수한 결과를 제시하는 것을 확인할 수 있었고, 채택률을 이용한 알고리즘의 효용성 역시 기존 연구자들이 제시하였던 만족스러운 범위를 가지는 것을 알 수 있었다. 최종적으로 선정된 사전분포는 본 연구의 II편에서 Bayesian MCMC방법의 사전분포로 이용되었으며, 그 결과를 기존 불확실성의 추정방법의 하나인 2차 근사식을 이용한 최우추정(maximum likelihood estimation)방법의 결과와 비교하였다.
The low flow analysis is an important part in water resources engineering. Also, the results of low flow frequency analysis can be used for design of reservoir storage, water supply planning and design, waste-load allocation, and maintenance of quantity and quality of water for irrigation and wild l...
The low flow analysis is an important part in water resources engineering. Also, the results of low flow frequency analysis can be used for design of reservoir storage, water supply planning and design, waste-load allocation, and maintenance of quantity and quality of water for irrigation and wild life conservation. Especially, for identification of the uncertainty in frequency analysis, the Bayesian approach is applied and compared with conventional methodologies in at-site low flow frequency analysis. In the first manuscript, the theoretical background for the Bayesian MCMC (Bayesian Markov Chain Monte Carlo) method and Metropolis-Hasting algorithm are studied. Two types of the prior distribution, a non-data- based and a data-based prior distributions are developed and compared to perform the Bayesian MCMC method. It can be suggested that the results of a data-based prior distribution is more effective than those of a non-data-based prior distribution. The acceptance rate of the algorithm is computed to assess the effectiveness of the developed algorithm. In the second manuscript, the Bayesian MCMC method using a data-based prior distribution and MLE(Maximum Likelihood Estimation) using a quadratic approximation are performed for the at-site low flow frequency analysis.
The low flow analysis is an important part in water resources engineering. Also, the results of low flow frequency analysis can be used for design of reservoir storage, water supply planning and design, waste-load allocation, and maintenance of quantity and quality of water for irrigation and wild life conservation. Especially, for identification of the uncertainty in frequency analysis, the Bayesian approach is applied and compared with conventional methodologies in at-site low flow frequency analysis. In the first manuscript, the theoretical background for the Bayesian MCMC (Bayesian Markov Chain Monte Carlo) method and Metropolis-Hasting algorithm are studied. Two types of the prior distribution, a non-data- based and a data-based prior distributions are developed and compared to perform the Bayesian MCMC method. It can be suggested that the results of a data-based prior distribution is more effective than those of a non-data-based prior distribution. The acceptance rate of the algorithm is computed to assess the effectiveness of the developed algorithm. In the second manuscript, the Bayesian MCMC method using a data-based prior distribution and MLE(Maximum Likelihood Estimation) using a quadratic approximation are performed for the at-site low flow frequency analysis.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
Bayesian 방법을 이용한 모수의 추정은 모수를 미지의 상수로 간주하는 것이 아니라 미지의 난수(random number)로 간주하게 됨으로써 추정의 관심이 되는 모수의 불확실성의 정도를 확률 모형을 이용하여 표현할 수 있게 된다. 결국 Bayesian 방법을 이용한 모수의 추정은 자료로부터 얻은 모수에 대한 정보와 모수에 대한 과거의 경험 또는 주관을 사전분포로 표현함으로써 보다 정확한 모수의 불확실성에 대한 탐색에 그 목적이 있다고 할 수 있다.
그러나 위에서 제시한 저수분석의 중요성에도 불구하고 Bayesian 방법을 사용하여 저수량 빈도분석을 수행하기 위한 일련의 과정들은 연구사례가 상대적으로 적다. 그러므로 본 연구에서는 최근 활발히 사용되고 있는 Metropolis-Hastings 알고리즘(Metorpolis et al.)을 적용한 Bayesian Markov Chain Monte Carlo (Bayesian MCMC)방법을 사용하여 저수량 빈도분석을 수행하고 그 결과를 MLE 이차 근사식을 이용한 결과와 비교하여 두 방법 간의 장단점을 비교하는 연구를 수행하였다. 이를 위하여 연구의 Ⅰ편인 본 논문에서는 연구의 수행을 위해 필요한 이론적 배경을 서술하고 Bayesian 방법을 적용하는데 있어서 중요한 사전분포를 구축하는 연구를 수행하였다.
그러므로, Bayesian MCMC방법을 이용하여 저수량 점 빈도분석을 수행하고자 하는 경우, 자료에 기반하지 않은 무정보적 사전분포보다는 자료에 기반한 사전분포를 사용하는 것이 Bayesian MCMC를 수행하는 데 있어서 합리적일 수 있다는 결론을 얻을 수 있었으며, 본연구의 Ⅱ편에서는 자료에 기반한 사전분포를 이용한 Bayesian MCMC 방법과 MLE 2차 근사방법의 추정결과를 비교함으로써 저수량 빈도분석에 있어서 불확실성을 보다 정확하게 분석하고자 하는 연구를 수행하였다.
본 연구에서는 자료에 기반한 사전분포를 구축하기 위하여 에르고딕(ergodic)가정을 이용하여 낙동강 유역의 13개 지점의 7Q자료를 이용하여 진동에서의 자료에 기반한 사전분포를 구축하였다. 에르고딕 가정이란 임의 공간에서의 앙상블(ensemble) 평균(또는 공간 평균)과 시간 평균이 같게 된다는 가정으로서 이 가정을 이용하면 Fig.
본 연구의 최종적인 목표는 Bayesian MCMC방법과 MLE 방법을 적용하여 저수량 빈도분석을 각각 수행하고 그 결과를 비교 평가함으로써 저수량 빈도분석을 수행하는 데 있어서 두 방법 간의 장점 및 단점을 분석하는 것이며, 이에 대한 결과는 본 연구의 Ⅱ편을 통하여 언급하였다. 두 가지 방법은 모두 선정된 확률밀도함수를 이용하여 얻어진 우도함수를 필요로 하는 데, 본 연구에서는 2모수 Weibull 분포로부터 얻어진 우도함수를 두 가지 방법에 모두 동일하게 사용하였다.
불확실성을 고려한 점 빈도분석의 수행 연구의 Ⅰ편에 해당되는 본 연구에서는 Bayesian MCMC 방법과 MLE 2차 근사방법을 이용하여 저수량 점 빈도분석에서 추정될 수 있는 불확실성의 표현을 위한 여러 가지 이론적 배경을 서술하였다. 또한 Bayesian MCMC 방법을 적용하는 데 있어서 가장 중요한 요소인 사전분포를 선정함에 있어서 자료에 기반하지 않은 사전분포와 에르고딕 가정을 이용한 자료에 기반한 사전분포를 구축하고, 두 가지 사전분포를 통계적 실험을 통하여 비교함으로써 자료에 기반한 사전분포가 평균값의 추정과 불확실성 측면에서 보다 나은 결과를 돌출함을 확인하였다.
)을 적용한 Bayesian Markov Chain Monte Carlo (Bayesian MCMC)방법을 사용하여 저수량 빈도분석을 수행하고 그 결과를 MLE 이차 근사식을 이용한 결과와 비교하여 두 방법 간의 장단점을 비교하는 연구를 수행하였다. 이를 위하여 연구의 Ⅰ편인 본 논문에서는 연구의 수행을 위해 필요한 이론적 배경을 서술하고 Bayesian 방법을 적용하는데 있어서 중요한 사전분포를 구축하는 연구를 수행하였다.
위에서 언급한 바와 같이 저수량 점 빈도분석을 수행하기 위해서는 가장 먼저 확률밀도함수를 선정해야 한다. 저수량 빈도분석을 위한 대상유역의 선정, 자료의 선정 및 특성 등은 본 연구와 병행되어 수행된 동 권의 Ⅱ편 연구인 저수량 빈도분석의 응용 부분에서 상세히 언급하였으므로, 본 연구에서는 적용 대상 유역인 낙동강 유역에서 Bayesian MCMC방법을 적용하기 위한 확률밀도함수의 선정, 사전분포의 유도, 제안분포의 효율성 검토에 연구의 초점을 맞추어 진행하였다.
그러나 이와 같은 에르고딕 가정이 수문학적 범주에서 만족되려면 진동지점을 포함한 14개 지점의 유량 특성이 균일해야 된다는 가정이 만족되어야 한다. 즉 14개 지점으로 대변되는 낙동강유역이 수문학적으로 동질한 유역(hydro- logical homogeneous region)인지를 평가해 볼 필요가 있는 데, 본 연구에서는 Matlab에서 제공하는 K-means 알고리즘을 이용한 군집분석(cluster analysis) 툴 박스와 14개 지점의 36년간 저수기 유량(7, 8, 9월 유량 제외)만을 이용하여 동질성을 판별해 보았다. 그림 2는 군집분석의 결과를 나타낸 것으로 14개 지점이 하나의 동질한 유역으로 묶여졌을 때, 실루엣(silhouette)값이 모두 0.
제안 방법
본 연구에서는 자료에 기반하지 않은 사전분포와 자료에 기반한 사전분포를 각각 Eq. (15)에 적용하고 Metropolis-Hastings 알고리즘을 이용하여 두 가지 사전분포를 이용한 추정결과를 비교함으로써 자료에 기반한 사전분포의 저수량 빈도분석에의 이용 가능성을 분석하였다.
(2004)이 제안한 Normal, Log-normal, Exponential, 균일분포가 사용될 수 있으나, 본 연구에서는 각각의 모수에 대하여 다음과 같은 균일분포만을 적용하고 두 균일분포가 서로 통계적으로 독립적이란 가정 하에 최종적으로 π(α, β)를 유도하였다.
낙동강 유역의 진동지점에서 얻어진 36년간의 유량 자료를 자연유량으로 환산하고 7일 지속기간 최소유량(7Q)을 각 년마다 계산하여 36개의 7Q 자료를 산정한 후 PPCC(Probability-Plot Correlation Coefficient) 시험방법을 이용하여 선정된 분포의 적정성을 확인하였다. PPCC 시험방법은 Filliben(1975)에 의해 제안된 방법으로써 정렬된 자료와 그에 따라 추정된 분위수의 상관계수(#)를 산정하여 분포의 적정성을 검토하는 방법이다.
위의 과정을 통하여 우도함수, 2가지 종류의 사전분포, 제안분포가 모두 구축되었으므로 Metropolis-Hasting 알고리즘을 사용한 Bayesian MCMC 방법에 의해 추정하고자 하는 모수의 추정이 가능하다. 본 연구에서는 알고리즘의 최대 반복횟수를 100,000번으로 설정하였으며, 최초 샘플링된 1,000개의 추정치는 모형의 안정성을 위하여 평균계산 시 제외하였으며(Burn-in=1,000), Burn-in 값은 모의된 모수가 변동하지 않는 구간을 주관적으로 선정하여 산정하였다. 그림 4는 Bayesian MCMC방법에 의해 추정된 99,000개의 2모수 Weibull 분포의 형상모수 α와 축척모수 β를 나타낸 것이다.
그러므로 일반적으로 Bayesian 방법을 적용하는 경우에 계산을 간편하게 하기 위하여 공액사전분포를 사용하는 등 과거의 경험을 합리적으로 나타내지 못하는 사전분포를 선정하여 사용하는 것은 최종 결과가 현실을 제대로 반영하지 못 할 요소가 많으므로 가능하면 자료에 기반한 사전분포를 구축하여 사용하는 것이 합리적이라는 결론을 얻을 수 있었다. 본 연구의 Ⅱ편에 서는 Ⅰ편에서 제시한 이론들과 선정된 사전분포를 사용하여 낙동강 유역에서의 저수량 점 빈도분석을 수행하였다. 또한 Ⅰ편에서 상세히 서술하지 못한 저수량 자료에 대한 한계성 부분과 적용방법을 추가적으로 설명하였다.
본 절에서는 본 연구의 최종 목표인 Bayesian MCMC의 결과와 MLE 2차 근사방법을 사용한 결과를 비교함으로써 두 방법 간의 장, 단점을 분석하기 위한 사전 준비단계로서 위에서 제안된 두 가지의 사전분포 중 우수한 사전분포를 선정하였다. 우수한 사전분포를 선정은 사전에 알고 있는 참값(true parmeter)로부터 필요한 자료를 생성한 후, 이 자료를 다시 각각의 사전분포를 이용한 Bayesian MCMC방법에 적용하여 최종결과를 비교하는 통계적 실험을 통해 수행될 수 있다.
이변량 정규분포를 사용하면 채택확률을 산정하는 식에서 q(θj|θj+1) = q(|θj+1|θj)가 되어 채택확률의 산정이 사후 분포에만 관련되므로 알고리즘의 효율성이 좋은 것으로 Chip and Greenberg(1995)가 제안한 바 있으며 본 연구에서도 이들의 결론에 의해 이변량 정규분포를 사용하였고, 채택률을 산정하여 제안분포의 적정성을 확인하였다.
즉, 에르고딕 가정 하에 공간적으로 흩어져 있는 13개의 α 추정치와 β 추정치를 진동지점에서의 과거 추정치 자료로 이용한 셈이며, α 추정치는 지수분포로 β 추정치는 2모수 Weibull 분포를 이용하여 나타내었다.
필요한 사전분포는 형상모수 α와 축척모수 β에 대하여 구축되어져야 하므로, 먼저 진동지점을 제외한 13개 지점의 7Q 유량을 2모수 Weibull 분포에 적합시킨 후, 13개의 α 추정치와 β 추정치를 각각 모수 λ를 가지는 지수분포와 형상모수 b, 축척모수 a를 가지는 2모수 Weibull 분포를 이용하여 다시 적합시켰다.
대상 데이터
4203을 참값(true parameter)로 사용하였다. 이 값을 이용하여 2모수 Weibull 분포로부터 100개의 모의자료를 생성하였으며, 이용된 36개 자료에 대한 통계치와 모의된 100개의 자료에 대한 통계치를 비교하면 Table 3과 같다. 이 표로부터 모의된 자료가 실측자료의 통계치와 유사하게 모의된 것을 확인할 수 있으며, 모의된 100개의 자료를 이용함에 있어서 큰 문제가 없음을 확인하였으며 모의자료의 통계치는 자료의 길이가 100인 100개의 앙상블을 모의한 후 이들의 통계 치들을 산술평균하여 나타낸 것이다.
진행된 연구는 확률분포의 모수를 추정하는데 있어서 발생하는 불확실성만을 대상으로 하였다. 그러나 향후 연구로써 1% 유의수준만을 만족시켰던 2모수 Weibull 분포보다 더욱 적절한 분포를 고려하여 연구를 수행하고 결과를 비교함으로써 분포의 선정에 따라 발생되는 빈도분석에 있어서의 불확실성도 함께 고려할 수 있으리라 판단된다.
데이터처리
모의된 100개의 자료를 이용하고 같은 우도함수, 같은 제안분포, 두 가지 종류의 사전분포인 Prior Ⅰ과 Prior Ⅱ를 사용하여 Metropolis-Hastings 알고리즘을 수행하였으며, 2.5 %, 평균, 97.5 %에 해당되는 각각의 모수의 추정결과들을 Table 4에 나타내었다.
본 연구에서는 이와 같은 통계적 실험을 위하여 진동지점의 36개 7Q값에 대해 최우추정법을 이용하여 추정된 α=2.8371과 β=34.4203을 참값(true parameter)로 사용하였다.
이론/모형
Chip and Greenberg(1995)는 Metropolos-Hastings 알고리즘을 수행하기 위한 5가지의 적절한 사전분포를 제안한 바 있는데, 본 연구에서는 5개의 제안분포 중 Eq. (22)와 같이 이변량 정규분포(bivariate normal distribution)를 사용한 확률보행 (random walk) 형태의 제안분포를 사용하였다.
본 연구의 최종적인 목표는 Bayesian MCMC방법과 MLE 방법을 적용하여 저수량 빈도분석을 각각 수행하고 그 결과를 비교 평가함으로써 저수량 빈도분석을 수행하는 데 있어서 두 방법 간의 장점 및 단점을 분석하는 것이며, 이에 대한 결과는 본 연구의 Ⅱ편을 통하여 언급하였다. 두 가지 방법은 모두 선정된 확률밀도함수를 이용하여 얻어진 우도함수를 필요로 하는 데, 본 연구에서는 2모수 Weibull 분포로부터 얻어진 우도함수를 두 가지 방법에 모두 동일하게 사용하였다. 2모수 Weibull 분포함수를 이용한 우도함수를 나타내면 다음과 같다.
본 연구에서 사용되는 확률밀도함수는 Nathan and McMahon(1990), Önöz and Bayazit(2001)이 저수량 빈도분석을 위해 사용한 바 있는 2모수 Weibull 분포로서 확률밀도함수와 확률분포함수(cumulative distribution function)는 각각 다음의 식으로 나타낼 수 있다.
위의 과정을 통하여 우도함수, 2가지 종류의 사전분포, 제안분포가 모두 구축되었으므로 Metropolis-Hasting 알고리즘을 사용한 Bayesian MCMC 방법에 의해 추정하고자 하는 모수의 추정이 가능하다. 본 연구에서는 알고리즘의 최대 반복횟수를 100,000번으로 설정하였으며, 최초 샘플링된 1,000개의 추정치는 모형의 안정성을 위하여 평균계산 시 제외하였으며(Burn-in=1,000), Burn-in 값은 모의된 모수가 변동하지 않는 구간을 주관적으로 선정하여 산정하였다.
성능/효과
그러므로 Eq. (2)로부터 사후분포는 우도함수와 사전분포의 곱에 비례하게 됨을 알 수 있다. 분석하고자 하는 자료를 나타낼 수 있는 확률밀도함수가 결정되면 이로부터 우도함수를 유도할 수 있고, 적절한 사전분포를 부여함으로써 사후분포로부터 확률밀도함수의 모수를 추출하고 모수의 불확실성을 탐색할 수 있다.
즉, 에르고딕 가정 하에 공간적으로 흩어져 있는 13개의 α 추정치와 β 추정치를 진동지점에서의 과거 추정치 자료로 이용한 셈이며, α 추정치는 지수분포로 β 추정치는 2모수 Weibull 분포를 이용하여 나타내었다. 각각의 추정 결과를 확률도시(probability plot)를 이용하여 적합성을 검정해 본 결과 각각의 분포에 합리적으로 일치하는 결과 (Fig. 3)를 확인 할 수 있었으며, 정량적인 검정을 위하여 유의수준 0.5 %에서의 Kolmogorov-Smirnov 검정을 수행한 결과 두 분포 모두 합리적인 분포로 검정되었다 (Table 2). 최종적으로 추정된 λ와 형상모수 b, 축척모수 a의 값은 Table 2와 같다.
또한 Bayesian MCMC 방법을 적용하는 데 있어서 가장 중요한 요소인 사전분포를 선정함에 있어서 자료에 기반하지 않은 사전분포와 에르고딕 가정을 이용한 자료에 기반한 사전분포를 구축하고, 두 가지 사전분포를 통계적 실험을 통하여 비교함으로써 자료에 기반한 사전분포가 평균값의 추정과 불확실성 측면에서 보다 나은 결과를 돌출함을 확인하였다. 그러므로 일반적으로 Bayesian 방법을 적용하는 경우에 계산을 간편하게 하기 위하여 공액사전분포를 사용하는 등 과거의 경험을 합리적으로 나타내지 못하는 사전분포를 선정하여 사용하는 것은 최종 결과가 현실을 제대로 반영하지 못 할 요소가 많으므로 가능하면 자료에 기반한 사전분포를 구축하여 사용하는 것이 합리적이라는 결론을 얻을 수 있었다. 본 연구의 Ⅱ편에 서는 Ⅰ편에서 제시한 이론들과 선정된 사전분포를 사용하여 낙동강 유역에서의 저수량 점 빈도분석을 수행하였다.
즉 14개 지점으로 대변되는 낙동강유역이 수문학적으로 동질한 유역(hydro- logical homogeneous region)인지를 평가해 볼 필요가 있는 데, 본 연구에서는 Matlab에서 제공하는 K-means 알고리즘을 이용한 군집분석(cluster analysis) 툴 박스와 14개 지점의 36년간 저수기 유량(7, 8, 9월 유량 제외)만을 이용하여 동질성을 판별해 보았다. 그림 2는 군집분석의 결과를 나타낸 것으로 14개 지점이 하나의 동질한 유역으로 묶여졌을 때, 실루엣(silhouette)값이 모두 0.6을 초과하는 값으로 산정되어 지는 것을 확인할 수 있었으며 이로부터 13개 지점의 유량특성이 동질하다는 것을 확인할 수 있었다.
불확실성을 고려한 점 빈도분석의 수행 연구의 Ⅰ편에 해당되는 본 연구에서는 Bayesian MCMC 방법과 MLE 2차 근사방법을 이용하여 저수량 점 빈도분석에서 추정될 수 있는 불확실성의 표현을 위한 여러 가지 이론적 배경을 서술하였다. 또한 Bayesian MCMC 방법을 적용하는 데 있어서 가장 중요한 요소인 사전분포를 선정함에 있어서 자료에 기반하지 않은 사전분포와 에르고딕 가정을 이용한 자료에 기반한 사전분포를 구축하고, 두 가지 사전분포를 통계적 실험을 통하여 비교함으로써 자료에 기반한 사전분포가 평균값의 추정과 불확실성 측면에서 보다 나은 결과를 돌출함을 확인하였다. 그러므로 일반적으로 Bayesian 방법을 적용하는 경우에 계산을 간편하게 하기 위하여 공액사전분포를 사용하는 등 과거의 경험을 합리적으로 나타내지 못하는 사전분포를 선정하여 사용하는 것은 최종 결과가 현실을 제대로 반영하지 못 할 요소가 많으므로 가능하면 자료에 기반한 사전분포를 구축하여 사용하는 것이 합리적이라는 결론을 얻을 수 있었다.
또한 불확실성을 표현할 수 있는 97.5 %와 2.5 %의 차이는 α가 Prior Ⅰ, Prior Ⅱ의 경우 각각 1.1061, 0.6613 이고 β가 각각 10.882와 4.1224 로써 Prior Ⅱ를 사용한 경우 불확실성 측면에서 많은 감소가 있었음을 알 수 있다.
위의 알고리즘을 이용하여 추정된 모수들은 최종적으로 몬테카를로 적분을 통하여 추정된 모수들의 평균과 같은 통계적 특성치를 근사적으로 얻을 수 있으며, 기존 통계학에서 사용되는 신뢰구간(confidence interval)에 해당되는 신용구간(credible interval)도 얻을 수 있고 이를 이용하여 추정된 모수의 불확실성을 표현할 수 있다. 반복하여 추출된 모수의 개수, n과 유의수준 (significance level), α에서의 Bayesian MCMC 방법에 의한 신용구간, 100(1-α)%는 다음 Eq.
이 값을 이용하여 2모수 Weibull 분포로부터 100개의 모의자료를 생성하였으며, 이용된 36개 자료에 대한 통계치와 모의된 100개의 자료에 대한 통계치를 비교하면 Table 3과 같다. 이 표로부터 모의된 자료가 실측자료의 통계치와 유사하게 모의된 것을 확인할 수 있으며, 모의된 100개의 자료를 이용함에 있어서 큰 문제가 없음을 확인하였으며 모의자료의 통계치는 자료의 길이가 100인 100개의 앙상블을 모의한 후 이들의 통계 치들을 산술평균하여 나타낸 것이다.
05에서의 한계상관계수 값의 사이에 존재하는 것을 알 수 있다. 즉, 제안된 확률분포인 2모수 Weibull 분포는 유의수준 0.01에서 적정하다고 검정할 수 있었다.
1224 로써 Prior Ⅱ를 사용한 경우 불확실성 측면에서 많은 감소가 있었음을 알 수 있다. 추정된 모수의 2.5 %, 평균값, 97.5 %에 해당되는 모수를 이용하여 2모수 Weibull 확률밀도함수를 나타내면 Fig. 5와 같고 이 그림으로부터도 Prior Ⅱ가 Prior Ⅰ보다 우수하다는 결론을 얻을 수 있었다.
후속연구
진행된 연구는 확률분포의 모수를 추정하는데 있어서 발생하는 불확실성만을 대상으로 하였다. 그러나 향후 연구로써 1% 유의수준만을 만족시켰던 2모수 Weibull 분포보다 더욱 적절한 분포를 고려하여 연구를 수행하고 결과를 비교함으로써 분포의 선정에 따라 발생되는 빈도분석에 있어서의 불확실성도 함께 고려할 수 있으리라 판단된다.
본 절에서는 본 연구의 최종 목표인 Bayesian MCMC의 결과와 MLE 2차 근사방법을 사용한 결과를 비교함으로써 두 방법 간의 장, 단점을 분석하기 위한 사전 준비단계로서 위에서 제안된 두 가지의 사전분포 중 우수한 사전분포를 선정하였다. 우수한 사전분포를 선정은 사전에 알고 있는 참값(true parmeter)로부터 필요한 자료를 생성한 후, 이 자료를 다시 각각의 사전분포를 이용한 Bayesian MCMC방법에 적용하여 최종결과를 비교하는 통계적 실험을 통해 수행될 수 있다. 본 연구에서는 이와 같은 통계적 실험을 위하여 진동지점의 36개 7Q값에 대해 최우추정법을 이용하여 추정된 α=2.
질의응답
핵심어
질문
논문에서 추출한 답변
저수량을 나타내기 위하여 가장 흔히 사용되는 것은?
저수분석(low flow analysis)은 수공구조물의 설계, 하천환경의 보전 및 생활 · 공업 · 농업용수의 안전한 취수를 위한 최소 유량의 보장, 오염원의 배치 등 수량과 수질의 관리에 중요하게 사용된다. 년 평균 유량, 절대 최소 유량 등 저수량을 표현하기 위한 많은 지표들이 존재하지만 특정한 년 최소 유량의 시계열 자료를 이용한 빈도분석의 결과가 저수량을 나타내기 위하여 가장 흔히 사용되어 진다. 저수량 분석을 수행하기 위해서 국내에서는 주로 갈수량에 해당되는 355위 유량(Q355)을 이용한 이 값의 10년 평균값(평균 갈수량) 또는 10년 빈도분석 값(기준 갈수량)을 산정하여 사용하고 있으며, 미국 및 영국 등의 국가에서는 7일 지속기간 10년 빈도 유량 (7Q10)을 주로 사용하고 있다.
수자원장기 종합계획, 댐 건설 장기계획 등의 국내 주요 중장기 계획은 빈도분석의 확정적인(deterministic) 값만을 이용하여 수립되고 있으며, 빈도분석결과의 불확실성을 반영한 확률적인(probabilistic) 값이 이용되는 계획은 찾아보기 힘든데 그 이유는?
그러나 수자원장기 종합계획, 댐 건설 장기계획 등의 국내 주요 중장기 계획은 빈도분석의 확정적인(deterministic) 값만을 이용하여 수립되고 있으며, 빈도분석결과의 불확실성을 반영한 확률적인(probabilistic) 값이 이용되는 계획은 찾아보기 힘들다. 이는 불확실성에 대한 인식 부족과 함께 불확실성에 대한 계산방법이 현실을 제대로 반영하지 못함으로써 빈도분석 결과의 정확성에 대한 신뢰도가 낮은 것에 기인한다고 할 수 있다.
저수분석은 어디에 사용되는가?
저수분석(low flow analysis)은 수공구조물의 설계, 하천환경의 보전 및 생활 · 공업 · 농업용수의 안전한 취수를 위한 최소 유량의 보장, 오염원의 배치 등 수량과 수질의 관리에 중요하게 사용된다. 년 평균 유량, 절대 최소 유량 등 저수량을 표현하기 위한 많은 지표들이 존재하지만 특정한 년 최소 유량의 시계열 자료를 이용한 빈도분석의 결과가 저수량을 나타내기 위하여 가장 흔히 사용되어 진다.
참고문헌 (35)
김상욱 (2007). Low flow frequency analysis using Bayesian approach. 박사학위논문, 서울대학교
Bickel, P.J., and Doksum, K.A. (1977). Mathematical Statistics: Basic Ideas and Selected Topics. Holden-Day, Inc., San Francisco, CA
Chip, S., and Greenberg, E. (1995). 'Understanding the Metropolis-Hastings algorithm.' Journal of the American Statistical Association, Vol. 49, No. 4, pp. 327-335
Chowdhury, J.U., and Stedinger, J.R. (1991). 'Confidence interval for design flood with estimated skew coefficient.' Journal of Hydraulic Engineering, Vol. 117, No. 7, pp. 811-931
Coles, S.G., and Powell, E.A. (1996). 'Bayesian methods in extreme value modeling: A review and new developments.' International Statistical Review, Vol. 64, No. 1, pp. 119-136
Gamerman, D. (1997). Markov Chain Monte Carlo-Stochastic Simulation for Bayesian Inference. Chapman & Hall, London, UK
Gary, D.T. (1987). 'A comparison of methods for estimating low flow characteristics of streams.' Water Resources Bulletin, Vol. 23, No. 6, pp. 1077-1083
Gelman, A., Carlin, J.B., Stern, H.S., and Rubin, D.B. (2004). Bayesian Data Analysis, Second Edition. Chapman & Hall/CRC, New York, NY
Gumbel, E.J. (1958). Statistics of Extremes. Columbia University Press, New York, NY.
Kavetski, D., Kuczera, G., and Fanks, S.W. (2006). 'Bayesian analysis of input uncertainty in hydrological modeling: 1. Theory.' Water Resources Research, Vol. 42, W03407
Kingston, G.B., Lambert, M.F., and Maier, H.R. (2005). 'Bayesian training of artificial neural networks used for water resources modeling.' Water Resources Research, Vol. 41, W12409, DOI: 10.1029/2005WR004152
Kuczera, G. (1999). 'Comprehensive at-site flood frequency analysis using Monte Carlo Bayesian inference.' Water Resources Research, Vol. 35, No. 5, pp. 1551-1557
Kuczera, G., and Parent E. (1998). 'Monte Carlo assessment of parameter uncertainty in conceptual catchment models: The Metropolis algorithm.' Journal of Hydrology, Vol. 211, pp. 69-85
Lee, K.S., and Kim, S.U. (2007). 'Identification of uncertainty in low flow frequency analysis using Bayesian MCMC method.' Hydrological Processes, In press(on-line published)
Madsen, H., and Rojsberg, H.D. (1997). 'Generalized least squares and empirical Bayes estimation in regional partial duration series index flood modeling.' Water Resources Research, Vol. 33, No. 4, pp. 771-781
Meeker, W.Q., and Escobar, L.A. (1998). Statistical Methods for Reliablility Data. John Wiley and Sons, New York, NY
Metropolis, N., Rosenbluth, A.W., Teller A.H., and Teller E. (1953). 'Equations of state calculations by fast computing machines.' Journal of Chemical Physics, Vol. 21, pp. 1087-1092
Reis Jr., D.S., and Stedinger, J.R. (2005). 'Bayesian MCMC flood frequency analysis with historical information.' Journal of Hydrology, Vol. 313, pp. 97-116
Reis Jr., D.S., Stedinger, J.R., and Martins, E.S. (2005). 'Bayesian generalized least squares regression with application to log Pearson type III regional skew estimation.' Water Resources Research, Vol. 41, W10419
Roberts, G.O., Gelman, A., and Gilks, W.R. (1994). Weak Convergence and Optimal Scaling of Random Walk Metropolis-Hastings Algorithms. Technical Report, University of Cambridge
Seidou, O., Ouarda, T.B.M.J., Barbet, M., Bruneau, P., and Bobee, B. (2006). 'A parametric Bayesian combination of local and regional information in flood frequency analysis.' Water Resources Research, Vol. 42, W11408, DOI: 10.1029/2005 WR004397
Stedinger, J.R., Vogel, R.M., and Foufoula-Georgiou, E. (1993). Frequency Analysis of Extreme Events In Handbook of Hydrology, Maidment, D.(eds). McGraw-Hill, New York, Chapter 18
Thiemann, M., Trosset, M., Gupta, H.V., and Sorooshian, S. (2001). 'Bayesian recursive parameter estimation for hydrologic models.' Water Resources Research, Vol. 37, No. 10, pp. 2521-2535
Vicens, G.J., Rodriguez-Iturbe, I., and Schaake Jr, J.C. (1975). 'A Bayesian framework for the use of regional information in hydrology.' Water ResourcesResearch, Vol. 11, No. 3, pp. 405-414
Vrugt, J.A., Gupta, H.V., Bouten, W., and Sorooshian, S. (2003). 'Shuffled complex evolution Metropolis algorithm for optimization and uncertainty assessment of hydrologic model parameters.' Water Resources Research, Vol. 39, No. 8, SWC 1-16
Wood, E.F., and Rodriguez-Iturbe, I. (1975a). 'Bayesian inference and decision making for extreme hydrologic events.' Water Resources Research, Vol. 11, No. 4, pp. 533-542
Wood, E.F., and Rodriguez-Iturbe, I. (1975b). A Bayesian approach to analyze uncertainty among flood frequency models. Water Resources Research, Vol. 11, No. 6, pp. 839-843
Zhang, B., and Govindaraju, R.S. (2000). 'Prediction of watershed runoff using Bayesian concepts and modular neural networks.' Water Resources Research, Vol. 3, pp. 753-762
※ AI-Helper는 부적절한 답변을 할 수 있습니다.