본 연구에서는 자료의 구조를 이용하는 통계방법인 EDA 기법을 적용하여 자료를 정량화 하고, 이를 이용하여 빈도해석을 실시하였다. 모멘트법을 이용하는 전통적 방법이 극치값에 민감하게 반응하는 통계치를 주지만, EDA 기법은 변동이 적은 안정적인 통계치를 주는 장점이 있다. 빈도해석에 EDA 기법를 적용하는 경우에는 자료의 왜곡도를 반영하기 위해 원자료의 정규화 변환 및 역변환 과정을 거쳐야 한다. 즉, 원자료를 정규화 변환하고, EDA 기법을 적용하여 변환된 자료의 통계치를 추정하며, 이를 다시 역변환하여 원자료의 통계치를 결정해야 한다. 이렇게 결정된 통계치는 주어진 확률밀도함수를 이용한 빈도해석에 적용된다. 본 연구에서는 서울 및 포항지점의 연최대치 1시간 강우자료를 대상으로 분석을 수행하였다. 그 결과 EDA 기법을 적용하는 경우 극치값에 덜 민감한 안정적인 확률강우량의 산정이 가능한 것으로 확인되었다. 이러한 방법론은 특히 기후변화 등의 원인으로 강수자체의 경년변동이 매우 큰 지점의 빈도해석에 유용하게 사용될 수 있을 것이다.
본 연구에서는 자료의 구조를 이용하는 통계방법인 EDA 기법을 적용하여 자료를 정량화 하고, 이를 이용하여 빈도해석을 실시하였다. 모멘트법을 이용하는 전통적 방법이 극치값에 민감하게 반응하는 통계치를 주지만, EDA 기법은 변동이 적은 안정적인 통계치를 주는 장점이 있다. 빈도해석에 EDA 기법를 적용하는 경우에는 자료의 왜곡도를 반영하기 위해 원자료의 정규화 변환 및 역변환 과정을 거쳐야 한다. 즉, 원자료를 정규화 변환하고, EDA 기법을 적용하여 변환된 자료의 통계치를 추정하며, 이를 다시 역변환하여 원자료의 통계치를 결정해야 한다. 이렇게 결정된 통계치는 주어진 확률밀도함수를 이용한 빈도해석에 적용된다. 본 연구에서는 서울 및 포항지점의 연최대치 1시간 강우자료를 대상으로 분석을 수행하였다. 그 결과 EDA 기법을 적용하는 경우 극치값에 덜 민감한 안정적인 확률강우량의 산정이 가능한 것으로 확인되었다. 이러한 방법론은 특히 기후변화 등의 원인으로 강수자체의 경년변동이 매우 큰 지점의 빈도해석에 유용하게 사용될 수 있을 것이다.
This study quantified the data by applying the EDA techniques considering the data structure, and the results were then used for the frequency analysis. Although traditional methods based on the method of moments provide very sensitive statistics to the extreme values, the EDA techniques have an adv...
This study quantified the data by applying the EDA techniques considering the data structure, and the results were then used for the frequency analysis. Although traditional methods based on the method of moments provide very sensitive statistics to the extreme values, the EDA techniques have an advantage of providing very stable statistics with their small variation. For the application of the EDA techniques to the frequency analysis, it is necessary to normalization transform and inverse-transform to conserve the skewness of the raw data. That is, it is necessary to transform the raw data to make the data follow the normal distribution, to estimate the statistics by applying the EDA techniques, and then finally to inverse-transform the statistics of transformed data. These statistics decided are then applied for the frequency analysis with a given probability density function. This study analyzed the annual maxima one hour rainfall data at Seoul and Pohang stations. As a result, it was found that more stable rainfall quantiles, which were also less sensitive to extreme values, could be estimated by applying the EDA techniques. This methodology may be effectively used for the frequency analysis of rainfall at stations with especially high annual variations of rainfall due to climate change, etc.
This study quantified the data by applying the EDA techniques considering the data structure, and the results were then used for the frequency analysis. Although traditional methods based on the method of moments provide very sensitive statistics to the extreme values, the EDA techniques have an advantage of providing very stable statistics with their small variation. For the application of the EDA techniques to the frequency analysis, it is necessary to normalization transform and inverse-transform to conserve the skewness of the raw data. That is, it is necessary to transform the raw data to make the data follow the normal distribution, to estimate the statistics by applying the EDA techniques, and then finally to inverse-transform the statistics of transformed data. These statistics decided are then applied for the frequency analysis with a given probability density function. This study analyzed the annual maxima one hour rainfall data at Seoul and Pohang stations. As a result, it was found that more stable rainfall quantiles, which were also less sensitive to extreme values, could be estimated by applying the EDA techniques. This methodology may be effectively used for the frequency analysis of rainfall at stations with especially high annual variations of rainfall due to climate change, etc.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
자료 자체가 아닌 자료의 구조를 고려함으로서 이상치에 대한 영향이 크게 완화될 가능성이 크다. 본 연구에서는 먼저 EDA에 대한 특성을 자세히 살펴보고, 아울러 이를 확률강우량의 추정에 적용하는데 필요한 방법론을 제시해 보고자 한다.
본 연구에서는 이상치의 포함여부에 따라 큰 변동폭을 보일 수밖에 없는 전통적 확률강우량 산정방법의 문제점을 보완하기 위한 방안으로 탐색적 자료분석(exploratory data analysis: EDA) 기법의 적용성을 검토하고자 한다. EDA 기법에서 사용하는 자료의 특성화는 자료의 구조에 대한 것으로 전통적 방법이 모멘트법에 근거하여 자료자체의 크기를 고려하는 것과 대비된다.
본 연구에서는 이상치의 포함여부에 따라 큰 변동폭을 보일 수밖에 없는 전통적 확률강우량 산정방법의 문제점을 보완하기 위한 방안으로 탐색적 자료분석(exploratory data analysis: EDA) 기법의 적용성을 검토하였다. EDA 기법에서 사용하는 자료의 특성화는 자료의 구조에 대한 것으로 전통적인 방법이 모멘트법에 근거하여 자료자체의 크기를 고려하는 것과 대비된다.
제안 방법
변환된 자료에 EDA 기법을 적용하여 추정한 통계치의 역 변환 값은 확률밀도함수의 매개변수 추정에 이용된다. 본 연구에서는 2변수 Gamma 분포를 이용하였다. 추정된 2변수 Gamma 분포의 확률밀도함수는 그림 8과 같다.
즉, 자료가 정규분포를 따르도록 변환하고, 변환된 자료에 대하여 EDA 기법을 적용하며, 마지막으로 그 결과를 다시 역변환하여 확률강우량의 추정에 이용하는 것이다. 본 연구에서는 자료 변환기법으로 Box and Cox(1964)에 의해 제안된 변환기법을 사용하여 자료의 정규화를 시도하였다. 다음 식은 Box-Cox 변환을 정의한 것이다.
본 장에서는 매년 신규 강우자료의 추가에 따라 발생하는 확률강우량의 변동을 기존의 모멘트법에 근거한 경우와 본 연구에서 제시하는 EDA 기법을 적용하는 경우로 나누어 비교하였다. 일단 4장에서의 결과처럼 기존의 빈도해석 방법과 EDA 기법을 적용하는 경우 유사한 확률강우량이 추정된다는 것은 파악할 수 있었다.
이 구간에 대해서는 추가로 변환계수 λ를 0.01로 더 세분하고 각각의 경우에 대해 추정된 표준편차와 왜곡도의 역변환 값이 원자료의 표준편차와 왜곡도를 얼마나 잘 재현하는지를 파악하였다.
표 4에 나타난 통계치를 가지고 빈도해석한 결과는 그림 6 및 표 5와 같다. 즉, 모멘트법 및 EDA 기법을 적용하여 추정한 통계치를 이용하여 2변수 Gamma 분포의 확률밀도 함수를 결정하고 이를 바탕으로 확률강우량을 추정하여 비교한 것이다. 전체적으로 EDA 기법을 적용하여 산정된 확률강우량이 전통적 방법보다 확률강우량이 작게 산정되었음을 확인할 수 있었다.
(2003)의 연구에서 제시된 바와 같이 분석을 위한 최소 자료길이는 30년으로 하였다. 즉, 서울 및 포항두 지점 모두 1961~1990년까지의 자료를 이용하여 빈도해석을 실시한 후, 1년씩 자료를 추가해 가며 신규자료의 영향을 판단하였다. 먼저 서울 및 포항지점의 연최대치 1시간 강우자료에 대한 전통적 빈도해석 결과는 각각 그림 9(a), (b)와 같다.
이러한 문제를 극복하기 위해서는 정규분포를 따르지 않는 수문자료를 적절히 변환하여 정규분포를 따르도록 할 필요가 있다. 즉, 자료가 정규분포를 따르도록 변환하고, 변환된 자료에 대하여 EDA 기법을 적용하며, 마지막으로 그 결과를 다시 역변환하여 확률강우량의 추정에 이용하는 것이다. 본 연구에서는 자료 변환기법으로 Box and Cox(1964)에 의해 제안된 변환기법을 사용하여 자료의 정규화를 시도하였다.
대상 데이터
본 연구에서 서울 및 포항 2개 지점의 강우관측소를 대상으로 하였다. 먼저, 서울지점은 1961~2005년까지 45개년의 자료를 사용하였다. 그림 3(a)는 서울지점의 1시간 최대강우량의 변화를 나타낸 것이다.
EDA 기법에서 사용하는 자료의 특성화는 자료의 구조에 대한 것으로 전통적인 방법이 모멘트법에 근거하여 자료자체의 크기를 고려하는 것과 대비된다. 본 연구는 서울 및 포항지점에 적용하였으며, 그 결과를 정리하면 다음과 같다.
본 연구에서 서울 및 포항 2개 지점의 강우관측소를 대상으로 하였다. 먼저, 서울지점은 1961~2005년까지 45개년의 자료를 사용하였다.
데이터처리
본 연구에서는 변환계수 λ를 0.1단위로 변화시켜 가며 정규분포에 대한 적합도 검정(x2-test, K-S test, PPCC test)을 수행하였다.
이론/모형
변환된 자료에 EDA 기법을 적용하여 추정한 통계치의 역 변환 값은 확률밀도함수의 매개변수 추정에 이용된다. 본 연구에서는 2변수 Gamma 분포를 이용하였다.
성능/효과
1. 원자료에 EDA 기법을 바로 적용했을 경우 추정된 확률강우량은 전통적 방법에 비하여 상당히 작게 산정된다. 이는 원자료가 오른쪽으로 왜곡된 분포형을 나타내기 때문이며, 따라서 재현기간이 큰 확률강우량이 과소 추정될 여지가 크다.
2. 신규자료의 추가에 따른 확률강우량의 변동은 EDA 기법을 적용함으로서 크게 완화할 수 있었다. 이는 EDA 기법이 개개 관측자료가 아닌 자료의 구조를 고려함으로서 생기는 저항성 때문인 것으로 판단된다.
표 6에 나타난 것과 같이 전통적 방법과 최종적으로 역변환된 통계치가 거의 비슷함을 알 수 있다. EDA 기법은 원자료에 EDA 기법을 적용한 경우와 달리, 변환-역변환 과정을 거치면서 특히 왜곡도가 원자료의 특성을 매우 잘 나타내는 것으로 확인되었다.
이러한 문제점은 자료가 정규분포형을 따르도록 변환한 후 EDA 기법을 적용하고, 추정된 통계치를 역변환 함으로서 극복할 수 있었다. 결과적으로, 자료변환 및 EDA 기법의 적용을 통해 유도된 빈도해석 결과는 전통적 빈도해석 결과와 매우 유사한 것을 파악할 수 있었다.
그 결과 변환계수 λ가 1.12일 때 원자료의 왜곡도와 표준편차를 가장 잘 반영하는 것으로 확인되었다.
이는 원자료가 오른쪽으로 왜곡된 분포형을 나타내기 때문이며, 따라서 재현기간이 큰 확률강우량이 과소 추정될 여지가 크다. 이러한 문제점은 자료가 정규분포형을 따르도록 변환한 후 EDA 기법을 적용하고, 추정된 통계치를 역변환 함으로서 극복할 수 있었다. 결과적으로, 자료변환 및 EDA 기법의 적용을 통해 유도된 빈도해석 결과는 전통적 빈도해석 결과와 매우 유사한 것을 파악할 수 있었다.
표 1과 2는 서울지점 연최대치 자료에 대한 기본 통계 특성을 지속시간별로 정리한 것이다. 적정 확률분포형을 찾기 위한 적합도 검정을 수행한 결과, 서울지점의 경우 1시간 지속기간의 경우는 2변수 Gamma 분포가, 24시간 지속 기간인 경우에는 2변수 Gamma 분포 및 3변수 Gamma 분포가 검정, 검정, PPCC 검정을 모두 통과하는 것으로 확인되었다. 포항지점의 경우는 1시간 지속기간의 경우는 2변수 대수정규분포, 3변수 대수정규분포, 2변수 Gamma 분포 그리고 GEV 분포가, 24시간 지속기간인 경우에는 2변수 Gamma 분포와 GEV 분포가 검정, K-S 검정, PPCC 검정을 통과하는 것으로 확인되었다.
즉, 모멘트법 및 EDA 기법을 적용하여 추정한 통계치를 이용하여 2변수 Gamma 분포의 확률밀도 함수를 결정하고 이를 바탕으로 확률강우량을 추정하여 비교한 것이다. 전체적으로 EDA 기법을 적용하여 산정된 확률강우량이 전통적 방법보다 확률강우량이 작게 산정되었음을 확인할 수 있었다. 이는 특히 EDA 기법을 적용한 경우의 분산 및 왜곡도가 모멘트법을 적용한 경우보다 작게 산정되기 때문이다.
표 4는 서울지점의 연최대치 1시간 및 24시간 강우자료에 대해 모멘트법으로 산정된 통계치와 EDA 기법을 적용하여 산정된 통계치를 비교한 것이다. 전체적으로 EDA 기법을 적용한 경우가 모멘트법을 적용한 경우에 비해 평균은 약간 작게, 표준편차와 왜곡도는 아주 작게 추정되어 있음을 확인할 수 있었다. 이는 기본적으로 원 자료가 대칭을 이루지 못하고 있음을 의미한다.
이러한 결과는 물론 그림 11에 나타난 것과 같이 자료의 통계치가 다르게 추정되었기 때문이다. 전통적인 모멘트법에 근거한 통계치의 경우는 신규자료가 추가됨에 따라 크게 변하는 모습을 보여주지만 EDA 기법을 적용한 경우에 있어서는 상대적으로 안정된 값을 나타내는 것을 확인할 수 있었다. 특히 왜곡도의 경우에 아주 뚜렷한 차이를 확인할 수 있었다.
확률강우량의 신뢰구간 또한 유사한 경향임을 확인할 수 있었다. 전통적인 방법의 빈도해석 결과에서는 극치규모의 강우사상이 추가되는 경우 확률강우량의 신뢰구간 역시 크게 넓어지는 경향을 보이지만, EDA 기법을 적용할 경우에는 그 변화의 폭이 훨씬 적을 뿐만 아니라 자료 기간의 증가에 따라 신뢰구간이 축소되어 가는 안정적인 경향을 뚜렷하게 보여주고 있다. 이러한 결과는 물론 EDA 기법의 특성인 저항성에서 그 원인을 찾을 수 있다.
0 mm/hr의 영향이다. 즉, 평균치보다 월등히 큰 값의 추가로 인해 확률강우량이 크게 변동할 수 있음을 나타내는 결과로 해석할 수 있다.
적정 확률분포형을 찾기 위한 적합도 검정을 수행한 결과, 서울지점의 경우 1시간 지속기간의 경우는 2변수 Gamma 분포가, 24시간 지속 기간인 경우에는 2변수 Gamma 분포 및 3변수 Gamma 분포가 검정, 검정, PPCC 검정을 모두 통과하는 것으로 확인되었다. 포항지점의 경우는 1시간 지속기간의 경우는 2변수 대수정규분포, 3변수 대수정규분포, 2변수 Gamma 분포 그리고 GEV 분포가, 24시간 지속기간인 경우에는 2변수 Gamma 분포와 GEV 분포가 검정, K-S 검정, PPCC 검정을 통과하는 것으로 확인되었다.
질의응답
핵심어
질문
논문에서 추출한 답변
EDA 기법의 장점은?
본 연구에서는 자료의 구조를 이용하는 통계방법인 EDA 기법을 적용하여 자료를 정량화 하고, 이를 이용하여 빈도해석을 실시하였다. 모멘트법을 이용하는 전통적 방법이 극치값에 민감하게 반응하는 통계치를 주지만, EDA 기법은 변동이 적은 안정적인 통계치를 주는 장점이 있다. 빈도해석에 EDA 기법를 적용하는 경우에는 자료의 왜곡도를 반영하기 위해 원자료의 정규화 변환 및 역변환 과정을 거쳐야 한다.
강원도 동쪽 지역의 유역종합치수계획 및 하천정비기본계획의 기준설정에 혼란이 빚어지는 이유는?
이러한 문제점은 근본적으로 현재의 빈도해석 방법이 이상치 정도의 큰 값에 과민하게 반응하기 때문이다. Ahn et al.
EDA의 주요 특징은?
EDA의 주요 특징으로는 저항성(resistance), 잔차(residuals), 재표현(re-expression), 현시성(revelation) 등 네 가지를 들 수 있다(백운붕과 허명회, 1987; 허명회와 이태림, 1993). 먼저, 저항성이란 자료의 부분적 변동에 너무 민감하게 반응하지 않는 것을 의미한다.
참고문헌 (19)
국립방재연구소(2002) 2002 태풍루사 피해 현장조사 보고서. 행정자치부, 국립방재연구소.
박상덕(2002) 태풍 루사로 인한 홍수특성과 대책, 한국수자원학회논문집, 한국수자원학회, 제35권 제6호, pp. 36-47.
한국건설기술연구원(2000) 수자원계획의 최적화 연구(IV) : 기후변화에 따른 수자원 계획의 영향 평가. 건설교통부, 한국수자원공사, pp. 344-347.
한화진, 안소은, 최은진, 한기주, 이정택, 김해동, 손요한, 박용하, 조광우, 윤정호, 이은애, 김승만(2005) 기후변화 영향평가 및 적응시스템 구축 I. 한국환경정책·평가연구원, pp. 219.
허명회, 이태림(1993) 탐색적 자료분석. 한국방송통신대학교 출판부.
Ahn, J., Kim, T., Yoo, C., and Yoon, Y. (2003) On the variation of frequency-based rainfall amounts : a case study for evaluating recent extreme rainfall in korea, Stochastic Environmental Research and Risk Assessment, Vol. 17, pp. 217-227.
Box, G. and Cox, D. (1964) An analysis of transformations (with discussion), Journal of the Royal Statistical Society (B), Vol. 26, pp. 211-252.
Coles, S., Pericchi, L.R., and Sisson, S. (2003) A fully probabilistic approach to extreme rainfall modeling, Journal of Hydrology, Vol. 273, pp. 35-50.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.