공간통계자료는 비록 공간상 모든 위치에 그 값이 존재하나, 실제 우리는 모든 지점에서 공간자료를 수집하지 못한다. 따라서 몇 개의 대표 지점에서 자료를 수집한 후 이를 미관측 지역까지 확장하여 사용하게 되는데, 이때 공간보간 기법이 적용된다. 본 논문에서는 다양한 분야에서 매우 중요하게 사용되는 강우자료에 대해 공간보간을 실시하고 그 정확성을 검증하였다. 기상청에서 운영하는 총 373 개의 강우관측소의 2004 년도 연 총강우량에 대해 공간보간을 실시하였으며, 그로부터 이론적 베리오그램으로 가우시안 함수를 사용한 일반 크리깅이 가장 높은 정확성을 보인 것으로 확인되었다. 다른 보간기법에 비해 크리깅 기법은 비교적 정확성이 높은 것으로 분석되었으며, 결과에 있어서는 예측값의 분포 범위가 좁은 일반화의 특성을 갖는 것으로 나타났다. 지역경향면 분석(local trend surface analysis), IDW, RBF의 경우 강우자료에 대한 예측값의 범위가 크리깅에 비해 매우 넓게 분포하는 것으로 나타났으며, 공간적으로는 인접한 지역의 예측값이 크리깅에 비해 급변하는 것으로 분석되었다.
공간통계자료는 비록 공간상 모든 위치에 그 값이 존재하나, 실제 우리는 모든 지점에서 공간자료를 수집하지 못한다. 따라서 몇 개의 대표 지점에서 자료를 수집한 후 이를 미관측 지역까지 확장하여 사용하게 되는데, 이때 공간보간 기법이 적용된다. 본 논문에서는 다양한 분야에서 매우 중요하게 사용되는 강우자료에 대해 공간보간을 실시하고 그 정확성을 검증하였다. 기상청에서 운영하는 총 373 개의 강우관측소의 2004 년도 연 총강우량에 대해 공간보간을 실시하였으며, 그로부터 이론적 베리오그램으로 가우시안 함수를 사용한 일반 크리깅이 가장 높은 정확성을 보인 것으로 확인되었다. 다른 보간기법에 비해 크리깅 기법은 비교적 정확성이 높은 것으로 분석되었으며, 결과에 있어서는 예측값의 분포 범위가 좁은 일반화의 특성을 갖는 것으로 나타났다. 지역경향면 분석(local trend surface analysis), IDW, RBF의 경우 강우자료에 대한 예측값의 범위가 크리깅에 비해 매우 넓게 분포하는 것으로 나타났으며, 공간적으로는 인접한 지역의 예측값이 크리깅에 비해 급변하는 것으로 분석되었다.
Geostatistical data are obtained only at selected sites even though they are potentially available at any location In a continuous surface. Therefore it is necessary to estimate the unknown values at unsampled locations based on observations. In this study we compared the accuracy of 5 spatial inter...
Geostatistical data are obtained only at selected sites even though they are potentially available at any location In a continuous surface. Therefore it is necessary to estimate the unknown values at unsampled locations based on observations. In this study we compared the accuracy of 5 spatial interpolation methods: local trend surface, IDW, RBF, ordinary kriging, universal kriging. These interpolation methods were applied to annual rainfall data. As the results of validation tests, universal kriging with gaussian variogram model showed the best accuracy in comparison with other interpolation methods. In the case of kriging, the predicted values were more accurate and within a more narrow range than other methods. In contrast with kriging, local trend surface analysis, IDW and RBF showed the wide range of predicted values and abrupt changes between neighbors.
Geostatistical data are obtained only at selected sites even though they are potentially available at any location In a continuous surface. Therefore it is necessary to estimate the unknown values at unsampled locations based on observations. In this study we compared the accuracy of 5 spatial interpolation methods: local trend surface, IDW, RBF, ordinary kriging, universal kriging. These interpolation methods were applied to annual rainfall data. As the results of validation tests, universal kriging with gaussian variogram model showed the best accuracy in comparison with other interpolation methods. In the case of kriging, the predicted values were more accurate and within a more narrow range than other methods. In contrast with kriging, local trend surface analysis, IDW and RBF showed the wide range of predicted values and abrupt changes between neighbors.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
그러나 산술 평균법은 유역 내의 강우관측소의 정보를 단순히 산술평균하는 방법으로 대상유역및 호우의 물리적 특성을 전혀 반영하지 않아 타 기법에 비해 강우를 과소 또는 과대 평가하는 경향이 있으며, 티센 기법의 경우 관측소의 지배면적에 민감하게 반응하고 등우선법은 일반적으로 유역경계선상에서 등우선이 걸치는 경우 경계 처리가 임의적일 수밖에 없는 단점을 갖는다(최용규, 2001). 따라서 미관측 지점의 강우량을 계산하기 위해 합리적인 방법이 요구되며, 본 논문에서는 이를 위하여 공간분석 분야에서 활발하게 사용되고 있는 공간보간 기법을 평가하였다.
그러나 지금까지 환경 분야에서 적용된 공간분석 기법에 대한 연구는 공간보간에 사용될 기법들에 대한 명확한 이해에 기초하지 않고 단순히 공간보간 기능을 제공하는 프로그램의 기본 설정을 이용하여 미관측지점의 값을 예측하는 미흡한 모습을 보여주었다. 따라서 본 논문에서는 공간보간 기법에 대한 면밀한 검토를 수행하고 이를 바탕으로 실제 공간데이터에 대한 적용을 살펴보도록 한다. 구체적인 공간데이터로는 강우 데이터를 사용하였다.
따라서 몇 개의 대표 지점에서 자료를 수집한 후 미관측 지역까지 확장한 후 사용 하게 되는데, 이때 공간보간 기법이 이용 된다. 본 논문에서는 다양한 분야에서 매우 중요한 자료로 사용되는 강우자료에 대해 공간보간을 실시하고 그 정확성을 검증하였다. 기상청에서 운영하는 총 373개의 강우관측소의 2004 년도 연강우량에 대해 공간보간을 실시하였으며, 그로부터 이론적 베리오그램으로 가우시안 함수를 사용한 일반 크리깅이 가장 높은 정확성을 보인 것으로 확인되었다.
가설 설정
단순 크리깅은 공간적 확률과정이 2차 정상성(stationarity)을 만족하며, 평균값은 우리가 이미 알고 있다고 가정한다. 여기서 2차 정상성은 평균이 위치에 무관하게 상수로 일정하다는 것과 공분산이 자료의 위치에 의존하지 않고 단지 주어진 자료 사이의 거리에 따라 변화하는 함수임을 의미한다.
정규 크리깅은 모집단의 평균을 사전에알 수 없지만, 그 값은 고정되어 있다는 것으로 가정한다. 단순 크리깅은 추정식이 편향되어 있어 추정식의 평균이 모집 단의 평균과 일치하는 않는 문제점이 있다(최종근, 2002).
제안 방법
RBF는 적용하는 Φ함수(식 6)에 따라 "completely regularized spline'과 'spline with tension, 함수로 구분하여 평가하였다. 이때 사용되는 관측지점 수는 각각 8, 10, 12, 15, 20으로 구분하여 관측지점수 변화에 따른 정확성 변동을 살펴보았다.
<표 3>과 같이 각 공간보간 기법에 포함된 파라미터를 변화하여 보간을 실시한후 보간 과정에 사용되지 않은 40 개의 강우관측소의 자료를 이용하여 각 기법의 정확성을 검증 하였다. 정확성 검증 결과는<표 4>와 같다.
이때 거리에 따른 가중치는 지수함수에 의해부여하였으며, 관측지점의 수를 8, 10, 12, 15, 20으로 변환하여 관측지점의 변화에 따른 예측치의 정확성을 평가하였다. 강우관측지점이 연구 대상지역에 비교적 균일하게 분포하고 있다고 판단하여 관측지점 선정 시 탐색거리에 제한을 설정하지 않고 주어진 관측지점의 수를 모두 포함하여 공간보간을 실시하였으며, 가중치 변화 파라미터는 교차검증 과정에서 RMS 에러가 최소가 되는 값을 사용하여 별도로 지정하지 않았다.
거리에 따라 가중치의 변화정도를 나타내는 p 값(식 5)과 관측점 수를 각각 1, 1.5, 2 및 8, 10, 12, 15, 20으로 구분하여총 15 개(%5)의 방법을 적용하였다. 관측 지점 탐색 반경은 지역추세모델에서처럼 제한을 두지 않았다.
2차식의 다중회귀모델을 적용하였다. 이때 거리에 따른 가중치는 지수함수에 의해부여하였으며, 관측지점의 수를 8, 10, 12, 15, 20으로 변환하여 관측지점의 변화에 따른 예측치의 정확성을 평가하였다. 강우관측지점이 연구 대상지역에 비교적 균일하게 분포하고 있다고 판단하여 관측지점 선정 시 탐색거리에 제한을 설정하지 않고 주어진 관측지점의 수를 모두 포함하여 공간보간을 실시하였으며, 가중치 변화 파라미터는 교차검증 과정에서 RMS 에러가 최소가 되는 값을 사용하여 별도로 지정하지 않았다.
이론적 베리오그램 산정을 위해 구형, 지수형, 가우스형 베리오그램 모델을 각각 적용하였다. 이때 분리거리(lag size)를 각각 20 km, 25 km, 30 km, 35 km로 구분하여 분리거리 크기에 따른 예측 정확도를 살펴보았다. 각 분리거리별 래그 개수는 분리거리 크기와 개수의 곱이 연구범위내 강우관측소가 서로 떨어진 최대 거리인 400 km를 넘지 않으면서 최대거리의 반인 200 km를 초과하는 범위에서 선정하였다(Johnston et al.
이럴 경우 해당 자료는 2차 정상성을 더 이상 만족하지 않 으며, 공간적 추세를 무시하고 크리깅을 기법을 적용할 경우 예측값이 잘못될 가능성이 커지게 된다. 이러한 문제점을 극복하기 위하여 일반 크리깅에서는 평균이 갖는 공간적 추세를 제거한 잔차를 이용하여 베리오그램을 추정한 후 이를 이용하여 미관측 지점의 값을 예측하게 된다.
이에 따라 분리 거리가 20 km인 경우 래그 개수를 15 개, 25 km인 경우 12 개, 30 km인 경우 10 개, 35 km인 경우 8 개를 사용하였다. 크리깅에 사용되는 관측지점 수는 20 곳이 되도록 하며, 탐색반경은 분리거리 크기X분리 거리 개수로 지정하여 반베리오그램 값을 계산하였다. 일반 크리깅 기법을 사용하기 위해서는 먼저 유역전체에 걸친 강우사상의 추세를 제거할 필요가 있으며, 이를 위하여 위치(X, y)에 의한 2차식을 적용하여 유역 전반에 걸친 경향을 제거한 후 일반 크리깅을 적용하였다.
대상 데이터
본 연구에서는 기상청에서 운영하는 강우관측소 중 내륙에 위치한 총 413 개를 이용하여 공간보간을 실시하였다. 413개의 관측소 중 10%에 해당하는 40 개의 관측소는 공간보간의 정확성 검정에 사용하였으며, 실제 공간보간 과정에는 총 373개의 관측소가 사용되었다. 사용된 강우관측소의 위치 분포는 [그림 2]와 같다.
공간 보간 대상이 되는 강우자료로는 2004 년도 연 총강우량을 사용하였으며, 사용된 강우자료의 통계값은와 같다.
따라서 본 논문에서는 공간보간 기법에 대한 면밀한 검토를 수행하고 이를 바탕으로 실제 공간데이터에 대한 적용을 살펴보도록 한다. 구체적인 공간데이터로는 강우 데이터를 사용하였다. 본 논문에서 강우 자료를 공간보간의 대상 데이터로 선정한 이유는 강우 자료가 수문, 수질, 대기, 생태 등 다양한 분야에서 매우 중요한 인자로 사용되기 때문이다.
본 연구에서는 기상청에서 운영하는 강우관측소 중 내륙에 위치한 총 413 개를 이용하여 공간보간을 실시하였다. 413개의 관측소 중 10%에 해당하는 40 개의 관측소는 공간보간의 정확성 검정에 사용하였으며, 실제 공간보간 과정에는 총 373개의 관측소가 사용되었다.
[그림 2]에서 왼쪽 그림은 미관측 지점의 연 총강우량을 예측하는데 사용된 강우관측소를,나타내며, 오른쪽은 예측 정확성을 검정하기 위해 사용된 강우관측소를 나타낸다. 예측 정확성을 검증하기 위해 사용된 강우관즉소는 기상청에서 운용하고 있는 413개의 강우관측소 중 40 개를 무작위로 선정하여 구성하였다. 공간 보간 대상이 되는 강우자료로는 2004 년도 연 총강우량을 사용하였으며, 사용된 강우자료의 통계값은<표 2>와 같다.
이론/모형
2차식의 다중회귀모델을 적용하였다. 이때 거리에 따른 가중치는 지수함수에 의해부여하였으며, 관측지점의 수를 8, 10, 12, 15, 20으로 변환하여 관측지점의 변화에 따른 예측치의 정확성을 평가하였다.
앞에서 살펴본 공간보간 기법 중 지역 경향면 분석, IDW, RBF, 정규 크리깅, 일반 크리깅 기법을 적용하였다. 단순 크리깅의 경우 평균값을 알고 있다는 가정이 강우자료에 적용하기에 현실성이 결여되어 적용 기법에서 제외하였다.
지역경향면 분석은 지수함수를 비롯한 다양한 형태의 함수를 이용하여 예측지점과 관측지점 사이의 인접 정도에 따라 서로 다른 가중치를 부여할 수 있다. 이렇게 관측지점별 가중치를 산정한 후 회귀식을 구성하는 계수는 가중최소자승법 (WLS; Weighted Least Squares) 방법을 이용하여 찾아내게 된다.
이론적 베리오그램 산정을 위해 구형, 지수형, 가우스형 베리오그램 모델을 각각 적용하였다. 이때 분리거리(lag size)를 각각 20 km, 25 km, 30 km, 35 km로 구분하여 분리거리 크기에 따른 예측 정확도를 살펴보았다.
이로부터 평향되어 있지 않기 위해서는 가중치의 총합이 1이 되어야 한다는 제약조건이 유도되며 이 제약조건 하에서 오차분산이 최소가 되도록 가중치를 구하고 이를 이용하여 미지의 값을 예측하게 된다. 제약조건 하에서 최소 • 최대를 구하는 문제는 라그랑제 인자법 (Lagrange parameter method)에 의하여 계산될 수 있다.
성능/효과
7의 RMS 에러로그 정확성이 급격하게 변동하는 것으로 나타났다. IDW의 경우 샘플수보다는 거리에 따른 가중치 파라미터 p(식 5)가 어떤 값을 갖는가하는 점이 정확성에 큰 영향을 미치는 것으로 나타났으며, 그 값이 작을 수로 정확성이 향상되어 본 연구에서는 1인 값을 부여할 때 가장 좋은 결과를 나타내는 것으로 분석되었다. RBF의 경우에는 샘플수에 비하여 적용 기법에큰 영향을 받는 것으로 분석되었으며, φ함수(식 6)로 spline with tension 함수보다 completely regularized spline 함수를 사용하는 것이 좋은 예측 결과를 보여주는 것으로 나타났다.
IDW의 경우 샘플수보다는 거리에 따른 가중치 파라미터 p(식 5)가 어떤 값을 갖는가하는 점이 정확성에 큰 영향을 미치는 것으로 나타났으며, 그 값이 작을 수로 정확성이 향상되어 본 연구에서는 1인 값을 부여할 때 가장 좋은 결과를 나타내는 것으로 분석되었다. RBF의 경우에는 샘플수에 비하여 적용 기법에큰 영향을 받는 것으로 분석되었으며, φ함수(식 6)로 spline with tension 함수보다 completely regularized spline 함수를 사용하는 것이 좋은 예측 결과를 보여주는 것으로 나타났다.
본 논문에서는 다양한 분야에서 매우 중요한 자료로 사용되는 강우자료에 대해 공간보간을 실시하고 그 정확성을 검증하였다. 기상청에서 운영하는 총 373개의 강우관측소의 2004 년도 연강우량에 대해 공간보간을 실시하였으며, 그로부터 이론적 베리오그램으로 가우시안 함수를 사용한 일반 크리깅이 가장 높은 정확성을 보인 것으로 확인되었다. 다른 보간기법에 비해 크리깅 기법이 비교적 정확성이 높은 것으로 분석되었으며, 공간보간 결과에 있어서는 예측값의 분포 범위가 좁은 일반화의 특성을 갖는 것으로 분석되었다.
기상청에서 운영하는 총 373개의 강우관측소의 2004 년도 연강우량에 대해 공간보간을 실시하였으며, 그로부터 이론적 베리오그램으로 가우시안 함수를 사용한 일반 크리깅이 가장 높은 정확성을 보인 것으로 확인되었다. 다른 보간기법에 비해 크리깅 기법이 비교적 정확성이 높은 것으로 분석되었으며, 공간보간 결과에 있어서는 예측값의 분포 범위가 좁은 일반화의 특성을 갖는 것으로 분석되었다. 지역경향면 분석, IDW, RBF의 경우 강우자료에 대한 예측값의 범위가 크 리깅에 비해 매우 넓게 분포하는 것으로 나타났으며, 공간적으로는 인접 지역 사이의 예측값이 크리깅에 비해 급변하는 것으로 분석되었다.
이에 반하여 분리거리의 변화는 크리깅에 있어 예측 정확성에 큰 영향을 미치지 않는 것으로 분석되었다. 따라서 강우자료에 대해 크 리깅 기법을 적용할 경우 분리거리에 대한 정의보다 베리오그램 함수 선정에 더욱 신중을 기해야 할 것으로 판단된다. 지역경향면 분석의 경우 샘플수에 매우큰 영향을 받는 것으로 분석되어 8개의 샘플을 사용했을 경우 검증 결과 611의 RMS 에러를 보인 것에 반하여 20 개의 샘플을 사용할 경우 244.
따라서 크리깅 기법이 다른 공간보간 기법에 비하여 예측 결과를 일반화하고 있음을 확인할 수 있다. 또한 크리깅 기법 안에서는 일반화 정도를 살펴보면 정규 크리깅이 일반 크리깅에 비하여 더욱 예측값의 범위가 좁혀져 있는 것으로 분석되었다.
따라서 크리깅 기법이 다른 공간보간 기법에 비하여 예측 결과를 일반화하고 있음을 확인할 수 있다. 또한 크리깅 기법 안에서는 일반화 정도를 살펴보면 정규 크리깅이 일반 크리깅에 비하여 더욱 예측값의 범위가 좁혀져 있는 것으로 분석되었다.
[그림 3]에서 각 보간기법의 결과를 살펴보면 지역경향면 분석, IDW, RBF는 인근 지역 사이의 예측값이 비교적 급변하는 것으로 나타났으며, 정규 크리깅과 일반 크리깅에서는 인접 지역 사이의 예측값 변화 정도가 비교적 완만한 것으로 분석되었다. 이 결과를 예측값의 최소, 최대치를 통하여 살펴보면 지역경향면 분석, IDW, RBF의 경우 예측값의 최소값이 900 mm 이하, 최대값이 2300 mm 이상인 것에 반하여 정규 크리깅과 일반 크 리깅의 경우 최소값이 1000 mm, 최대값이 2000 mm 사이에 분포하는 것으로 나타났다(<표 5>).
전체적으로 살펴볼 경우 크리깅 기법이 여타 다른 공간보간 기법에 비하여 월등히 좋은 결과를 보여주었으며, 이 중 분리거리가 35 km, 베리오그램 함수로 가우스 함수를 사용한 일반 크리깅 기법이 가장 정확한 보간을 수행한 것으로 나타났다(<표 4>), 정규 크리깅과 일반 크리깅을 비교할 경우 대체로 일반 크리깅이 미세 하나 좋을 결과를 보여주었다. 일반 크리깅이 정규 크리깅에 비하여 좋은 결과를 보인 이유는 정규 크리깅이 2차 정상성 가정에 의하여 모집단의 평균이 공간적 위치에 관계없이 일정하다고 전제하나, 실제 강우자료가 그러한 특성을 갖지 않기 때문인 것으로 판단된다.
다른 보간기법에 비해 크리깅 기법이 비교적 정확성이 높은 것으로 분석되었으며, 공간보간 결과에 있어서는 예측값의 분포 범위가 좁은 일반화의 특성을 갖는 것으로 분석되었다. 지역경향면 분석, IDW, RBF의 경우 강우자료에 대한 예측값의 범위가 크 리깅에 비해 매우 넓게 분포하는 것으로 나타났으며, 공간적으로는 인접 지역 사이의 예측값이 크리깅에 비해 급변하는 것으로 분석되었다.
따라서 강우자료에 대해 크 리깅 기법을 적용할 경우 분리거리에 대한 정의보다 베리오그램 함수 선정에 더욱 신중을 기해야 할 것으로 판단된다. 지역경향면 분석의 경우 샘플수에 매우큰 영향을 받는 것으로 분석되어 8개의 샘플을 사용했을 경우 검증 결과 611의 RMS 에러를 보인 것에 반하여 20 개의 샘플을 사용할 경우 244.7의 RMS 에러로그 정확성이 급격하게 변동하는 것으로 나타났다. IDW의 경우 샘플수보다는 거리에 따른 가중치 파라미터 p(식 5)가 어떤 값을 갖는가하는 점이 정확성에 큰 영향을 미치는 것으로 나타났으며, 그 값이 작을 수로 정확성이 향상되어 본 연구에서는 1인 값을 부여할 때 가장 좋은 결과를 나타내는 것으로 분석되었다.
[그림 3]은 각 보간기법의 예측 결과를 50m 간격의 등우선을 이용하여 나타낸 것으로 모든 결과에서 남해안 일대 및 강원도 동해안 지역 특히, 지리산 부근에서 높은 강우량이 예측된 것을 확인할 수 있다. [그림 3]에서 각 보간기법의 결과를 살펴보면 지역경향면 분석, IDW, RBF는 인근 지역 사이의 예측값이 비교적 급변하는 것으로 나타났으며, 정규 크리깅과 일반 크리깅에서는 인접 지역 사이의 예측값 변화 정도가 비교적 완만한 것으로 분석되었다. 이 결과를 예측값의 최소, 최대치를 통하여 살펴보면 지역경향면 분석, IDW, RBF의 경우 예측값의 최소값이 900 mm 이하, 최대값이 2300 mm 이상인 것에 반하여 정규 크리깅과 일반 크 리깅의 경우 최소값이 1000 mm, 최대값이 2000 mm 사이에 분포하는 것으로 나타났다(<표 5>).
후속연구
예를 들어, 본 논문에서는 연강우량에 대해서만 공간보간을 실시하였으나, 강우 자료는 관측시점의 길이에 따라 월자료, 일자료, 시자료 등 매우 다양한 형태로 수집될 수 있다. 따라서 강우자료의 시공간적 분포특성에 대한 정확한 이해를 위해서는 향후 본 논문에서 사용한 연강우량뿐만 아니라 월별, 일별, 시간별 강우자료에 대한 공간보간 분석이 필요할 것이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.