지구통계학적인 공간분석의 대표적인 방법인 크리깅(kriging)을 적용하기 위해서는 두 관측점 사이의 거리에 기반한 상관성을 나타내는 공간상관함수의 추정이 우선적으로 이루어져야 한다. 본 연구에서는 다양한 크리깅에 적용할 수 있는 대표적인 상관함수인 semi-variogram, homeogram, covariance function에 대하여 국가지오이드 모델을 기반으로 추정하였다. 경위도 각각 2°의 대상지역 내 통합기준점의 지오이드고를 이용하였으며, 선형모델을 이용하여 공간적인 편향성을 제거하였다. 전체 100개의 샘플 포인트에 대해서 중복되지 않은 두 점 간의 거리를 기준으로 구간을 나누고, 각 함수에 대한 경험적인 값을 계산하였다. 공간상관함수의 경험적인 값은 각각 두 개의 모델에 최소제곱조정 방법으로 피팅한 결과 semi-variogram의 wave 모델적합도가 가장 높았으며, homeogram과 covariance function은 exponential 모델이 상대적으로 좋은 피팅 결과를 보였다. 본 연구에서 결정한 공간상관함수는 추후 다양한 크리깅 방법을 통해 임의 지점에서의 예측값에 대한 정확도 검증과 이에 대한 평균제곱예측오차(Mean Squared Prediction Error, MSPE)를 계산함으로써 각 함수의 활용성에 대한 추가적인 연구가 수행되어야 한다.
지구통계학적인 공간분석의 대표적인 방법인 크리깅(kriging)을 적용하기 위해서는 두 관측점 사이의 거리에 기반한 상관성을 나타내는 공간상관함수의 추정이 우선적으로 이루어져야 한다. 본 연구에서는 다양한 크리깅에 적용할 수 있는 대표적인 상관함수인 semi-variogram, homeogram, covariance function에 대하여 국가지오이드 모델을 기반으로 추정하였다. 경위도 각각 2°의 대상지역 내 통합기준점의 지오이드고를 이용하였으며, 선형모델을 이용하여 공간적인 편향성을 제거하였다. 전체 100개의 샘플 포인트에 대해서 중복되지 않은 두 점 간의 거리를 기준으로 구간을 나누고, 각 함수에 대한 경험적인 값을 계산하였다. 공간상관함수의 경험적인 값은 각각 두 개의 모델에 최소제곱조정 방법으로 피팅한 결과 semi-variogram의 wave 모델 적합도가 가장 높았으며, homeogram과 covariance function은 exponential 모델이 상대적으로 좋은 피팅 결과를 보였다. 본 연구에서 결정한 공간상관함수는 추후 다양한 크리깅 방법을 통해 임의 지점에서의 예측값에 대한 정확도 검증과 이에 대한 평균제곱예측오차(Mean Squared Prediction Error, MSPE)를 계산함으로써 각 함수의 활용성에 대한 추가적인 연구가 수행되어야 한다.
In order to apply Kriging methods for geostatistics of spatial data, an estimation of spatial coherency functions is required priorly based on the spatial distance between measurement points. In the study, the typical coherency functions, such as semi-variogram, homeogram, and covariance function, w...
In order to apply Kriging methods for geostatistics of spatial data, an estimation of spatial coherency functions is required priorly based on the spatial distance between measurement points. In the study, the typical coherency functions, such as semi-variogram, homeogram, and covariance function, were estimated using the national geoid model. The test area consisting of 2°×2° and the Unified Control Points (UCPs) within the area were chosen as sampling measurements of the geoid. Based on the distance between the control points, a total of 100 sampling points were grouped into distinct pairs and assigned into a bin. Empirical values, which were calculated with each of the spatial coherency functions, resulted out as a wave model of a semi-variogram for the best quality of fit. Both of homeogram and covariance functions were better fitted into the exponential model. In the future, the methods of various Kriging and the functions of estimated spatial coherency need to be studied to verify the prediction accuracy and to calculate the Mean Squared Prediction Error (MSPE).
In order to apply Kriging methods for geostatistics of spatial data, an estimation of spatial coherency functions is required priorly based on the spatial distance between measurement points. In the study, the typical coherency functions, such as semi-variogram, homeogram, and covariance function, were estimated using the national geoid model. The test area consisting of 2°×2° and the Unified Control Points (UCPs) within the area were chosen as sampling measurements of the geoid. Based on the distance between the control points, a total of 100 sampling points were grouped into distinct pairs and assigned into a bin. Empirical values, which were calculated with each of the spatial coherency functions, resulted out as a wave model of a semi-variogram for the best quality of fit. Both of homeogram and covariance functions were better fitted into the exponential model. In the future, the methods of various Kriging and the functions of estimated spatial coherency need to be studied to verify the prediction accuracy and to calculate the Mean Squared Prediction Error (MSPE).
Homeogram의 경우 평균값을 고려하지 않고 공간상관함수를 추정하기 때문에 특정 위치에서의 지오이드 값에 과도한 영향을 받을 가능성이 있다. 따라서 본 연구에서는 경험적 homeogram 계산을 위해 각 구간에서의 homeogram을 스케일링하여 상대비율에 기반한 homeogram 계산 방법을 제안하였다. 그러나 최종적으로 결정된 공간 프로세스의 추정값 및 평균제곱예측오차는 선형적으로 변하지 않으므로(Bae and Schaffrin, 2015), 공간상관함수의 모델 적합도를 판정하기 위해서는 이에 대한 추가적인 분석이 필요하다.
이러한 공간적인 상관성을 측정하기 위한 다양한 방법이 제시되었는데, 그 중에서 semi-variogram, homeogram, covariance function 등이 대표적이며, 이를 다양한 크리깅 방식에 통합적으로 적용하기 위한 연구도 많이 수행되었다(Schaffrin, 2000, 2013). 본 논문에서는 크리깅 적용을 위해 필요한 관측값 사이의 공간적인 상관성을 나타내기 위해 대표적인 세 가지 공간상관함수를 추정하였으며, 모델별 적합도에 대한 분석을 수행하였다.
가설 설정
9cm 수준이다. 그러나 일부 산악지역의 경우 큰 차이를 보이는 경우가 있으므로 지오이드 오차를 대략 10 cm 수준으로 가정하는 것이 바람직 할 것으로 판단되어 본 연구에서는 관측오차의 분산을 로 가정하였다.
제안 방법
공간적인 편향성을 제거하기 위해 대상 지역의 지오이드를 선형접합하여 경향성을 제거하고, 잔차 지오이드를 이용하여 공간상관함수를 추정하는데 이용하였다. 경험적인 값을 계산하기 위해 본 연구에서 선정한 100개의 샘플 포인트를 이용하여 두 점 사이의 공간적인 거리에 따라 약 16 km 간격으로 13개 구간을 나누어 모델별 경험값을 계산하였다. 각 함수별로 특성에 잘 부합하는 두 개의 모델을 선택하여 적용하였으며, 각 함수별 직접적인 비교를 위해 wave 모델을 공통적으로 사용하였다.
본 연구에 사용한 국가지오이드 모델 KNGeoid13은 다양한 데이터(항공/지상/선상 중력 자료, GPS/levling 자료 등)를 기반으로 최소제곱 콜로케이션 방법으로 추정되었다. 공간상관함수 추정을 위해서 산악지역과 평지를 포함하고 있는 경위도 각 2°에 해당하는 영역을 선택함으로써 다양한 분포의 지오이드고에 기반한 공간상관함수 추정이 가능하도록 하였다(Fig. 1).
9 cm이며, 이를 기반으로 공간상관함수의 관측오차를 10 cm로 설정하였다. 공간적인 편향성을 제거하기 위해 대상 지역의 지오이드를 선형접합하여 경향성을 제거하고, 잔차 지오이드를 이용하여 공간상관함수를 추정하는데 이용하였다. 경험적인 값을 계산하기 위해 본 연구에서 선정한 100개의 샘플 포인트를 이용하여 두 점 사이의 공간적인 거리에 따라 약 16 km 간격으로 13개 구간을 나누어 모델별 경험값을 계산하였다.
따라서 이 문제를 해결하기 위해서는 별도의 가중값 부여 방법을 고안할 필요가 있으며, 각 구간에서 반영 횟수가 다르기 때문에 가중값을 부여하는 것이 매우 복잡하다. 따라서 본 연구에서는 원래의 샘플링 포인트(즉, h=0) 값을 각 구간에서 출현 횟수에 따라 스케일링 하였다. 예를 들어, 어떤 구간에서 점 A가 p 회, 점 B가 q 회 나타났다고 하면, 스케일링 된 homeogram은 Eq.
본 연구에서는 공간데이터로부터 추정한 다양한 공간상관함수에 대한 비교, 분석을 수행하였다. 국토지리정보원에서는 2011년부터 육지·해양 통합지오이드 모델 개발 연구를 시작하였으며, 2013년에는 지리산, 속리산 등 산악지역의 정확도를 개선한 KNGeoid13 모델을 개발하였다.
랜덤프로세스에 기반한 공간 데이터의 분석 및 예측을 위해서 많이 활용되고 있는 크리깅을 적용하기 위해서는 관측된 데이터를 기반으로 공간적인 상관성을 나타내는 공간상관함수를 추정할 필요가 있다. 본 연구에서는 다양한 크리깅방법에 공통적으로 적용할 수 있는 공간상관함수를 결정하고 비교하였으며, 대상 모델은 semi-variogram, homeogram, covariance function이다. 통합기준점에서의 GPS/leveling 자료와 정표고 자료를 이용하여 계산한 지오이드와 국가지오이드 모델을 비교한 지오이드 관측오차는 약 ±2.
경향성을 제거한 잔차 지오이드를 이용하여 경험적인 공간상관함수를 추정하기 위한 방법은 Table 1에 요약되어 있다(Cressie, 1993). 본 연구에서는 세 종류의 공간상관함수를 추정하였으며, 각각을 결정하기 위해서는 Fig. 3의 히스토그램과 같이 구간을 나눈 후, 각 구간 내에서 하나의 경험적인 값을 결정한다.
각각의 공간상관함수 모델을 이용하여 경험적으로 계산된 값을 Table 2에 제시한 모델함수에 피팅함으로써 경험적인 공간상관함수를 추정하게 된다. 함수 모델은 다양한 형태가 제시되어 있으나, 본 연구에서는 각 공간상관함수별 특성에 가장 적합한 두 개의 함수만을 적용하여 비교 분석하였다.
대상 데이터
Fig. 2에서 보는 것처럼 본 연구에서 사용하는 영역 내 통합기준점 중 균일한 공간적인 분포를 가지도록 100개의 좌표를 선정하여 공간상관함수의 경험적인 값을 생성하는데 사용하였다. 전체 100개의 통합기준점에서 GPS/leveing 자료와 KNGeoid13 모델의 지오이드고 차이는 평균제곱근오차(RMSE) 기준으로 약 ±2.
데이터처리
공간상관함수의 파라메터 추정을 위해서는 최소제곱 방법을 적용했으며, 가중값은 거리의 제곱에 반비례하도록 설정하였다. Lag 거리(h)가 0인 경우는 함수 피팅을 위해 관측오차의 분산값인 을 적용하였으며 0.
이론/모형
경험적인 값을 계산하기 위해 본 연구에서 선정한 100개의 샘플 포인트를 이용하여 두 점 사이의 공간적인 거리에 따라 약 16 km 간격으로 13개 구간을 나누어 모델별 경험값을 계산하였다. 각 함수별로 특성에 잘 부합하는 두 개의 모델을 선택하여 적용하였으며, 각 함수별 직접적인 비교를 위해 wave 모델을 공통적으로 사용하였다. Lag 거리의 역수를 가중값으로하여 최소제곱조정한 결과 semi-variogram의 wave 모델의 적합도가 가장 우수한 것으로 나타났다.
31 cm의 정밀도를 나타낸다(NGII, 2016). 본 연구에 사용한 국가지오이드 모델 KNGeoid13은 다양한 데이터(항공/지상/선상 중력 자료, GPS/levling 자료 등)를 기반으로 최소제곱 콜로케이션 방법으로 추정되었다. 공간상관함수 추정을 위해서 산악지역과 평지를 포함하고 있는 경위도 각 2°에 해당하는 영역을 선택함으로써 다양한 분포의 지오이드고에 기반한 공간상관함수 추정이 가능하도록 하였다(Fig.
성능/효과
각 함수별로 특성에 잘 부합하는 두 개의 모델을 선택하여 적용하였으며, 각 함수별 직접적인 비교를 위해 wave 모델을 공통적으로 사용하였다. Lag 거리의 역수를 가중값으로하여 최소제곱조정한 결과 semi-variogram의 wave 모델의 적합도가 가장 우수한 것으로 나타났다. 또한 homeogram과 covariance function의 경우 wave 모델 보다는 exponential 모델에 유사한 것으로 판단된다.
Lag 거리의 역수를 가중값으로하여 최소제곱조정한 결과 semi-variogram의 wave 모델의 적합도가 가장 우수한 것으로 나타났다. 또한 homeogram과 covariance function의 경우 wave 모델 보다는 exponential 모델에 유사한 것으로 판단된다. Homeogram의 경우 평균값을 고려하지 않고 공간상관함수를 추정하기 때문에 특정 위치에서의 지오이드 값에 과도한 영향을 받을 가능성이 있다.
본 연구에서는 다양한 크리깅방법에 공통적으로 적용할 수 있는 공간상관함수를 결정하고 비교하였으며, 대상 모델은 semi-variogram, homeogram, covariance function이다. 통합기준점에서의 GPS/leveling 자료와 정표고 자료를 이용하여 계산한 지오이드와 국가지오이드 모델을 비교한 지오이드 관측오차는 약 ±2.9 cm이며, 이를 기반으로 공간상관함수의 관측오차를 10 cm로 설정하였다. 공간적인 편향성을 제거하기 위해 대상 지역의 지오이드를 선형접합하여 경향성을 제거하고, 잔차 지오이드를 이용하여 공간상관함수를 추정하는데 이용하였다.
후속연구
Table 3에서 보는 것처럼 공간상관함수에 따라서 최적 모델이 다르며, 특히 동일한 wave 모델을 적용했을 때 semi-variogram의 모델 적합도가 가장 좋은 것으로 나타났다. 그러나 모델 적합도는 사용한 지오이드에 기반하여 계산한 경험값에 의존하므로, 다른 영역에서도 일관된 경향을 보이는지에 대해서는 추가적인 분석이 필요하다. 또한 공간상관함수에 대한 모델 적합도가 높다고 하더라도 크리깅 방식에 따라 평균제곱오차의 특성이 동일하지 않을 수 있으므로, 향후 연구에서는 이에 대한 분석이 필요하다.
따라서 본 연구에서는 경험적 homeogram 계산을 위해 각 구간에서의 homeogram을 스케일링하여 상대비율에 기반한 homeogram 계산 방법을 제안하였다. 그러나 최종적으로 결정된 공간 프로세스의 추정값 및 평균제곱예측오차는 선형적으로 변하지 않으므로(Bae and Schaffrin, 2015), 공간상관함수의 모델 적합도를 판정하기 위해서는 이에 대한 추가적인 분석이 필요하다.
그러나 모델 적합도는 사용한 지오이드에 기반하여 계산한 경험값에 의존하므로, 다른 영역에서도 일관된 경향을 보이는지에 대해서는 추가적인 분석이 필요하다. 또한 공간상관함수에 대한 모델 적합도가 높다고 하더라도 크리깅 방식에 따라 평균제곱오차의 특성이 동일하지 않을 수 있으므로, 향후 연구에서는 이에 대한 분석이 필요하다.
랜덤프로세스에 기반한 공간 데이터의 분석 및 예측을 위해서 많이 활용되고 있는 크리깅을 적용하기 위해서는 관측된 데이터를 기반으로 공간적인 상관성을 나타내는 공간상관함수를 추정할 필요가 있다. 본 연구에서는 다양한 크리깅방법에 공통적으로 적용할 수 있는 공간상관함수를 결정하고 비교하였으며, 대상 모델은 semi-variogram, homeogram, covariance function이다.
참고문헌 (8)
Bae, T.S. and Schaffrin, B. (2015), On various Kriging predictors for geoid densification: a comparison, SIAM Conference on Mathematical and Computational Issues in the Geosciences, SIAM, 29 June - 2 July, Stanford University, California, USA.
Cressie, N. (1993), Statistics for Spatial Data (2nd), Wiley, New York, N.Y.
Jekeli, C. (2001), Inertial Navigation Systems with Geodetic Applications, Walter de Gruyter, Berlin, New York.
Jekeli, C. (2003), Fourier Geodesy, Department of Civil and Environmental Engineering and Geodetic Science, The Ohio State University, Columbus, Ohio.
NGII (2016), Current geoid models of Korea, National Geographic Information Institute, Suwon, Korea, http://ngii.go.kr/geoid/intro/geoid_condition.do (last date accessed: 15 January 2016). (in Korean)
Schaffrin, B. (1993), Biased Kriging on The Sphere?, In: Soares, A. (ed.), Geostatistics Troia '92, Springer Netherlands, Vol. 1, pp. 121-131.
Schaffrin, B. (2000), Establishing equivalent systems for universal Kriging, 9 th International Workshop on Matrices and Statistics, December 9-13, Hyderabad, India.
Schaffrin, B. (2013), Towards unified computational schemes for various forms of Kriging, 2013 Spatial Statistics Conference, Columbus, Ohio.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.