본 논문에서는 다양한 형태로 존재하는 통계정보를 일정한 모양과 크기를 갖는 격자로 표현하기 위해 필요한 데이터 변환 방법론에 대하여 제시한다. 격자는 기존 통계지도 서비스에서 활용하고 있는 통계공간단위인 행정구역과 집계구와 비교하였을 때 모양과 크기가 일정하여 통계정보를 객관적으로 파악할 수 있게 하며, 지도 축척 변화에 유연하게 적용될 수 있는 특징이 있다. 한편, 기존 통계지도 서비스에서는 면 보간법을 활용하여 통계공간단위로 변환하고 있는데, 이것을 다양한 형태로 존재하는 통계정보에 적용시키기 위해서는 추가적인 프로세스가 필요하다. 이에 따라, 본 논문에서는 다양한 형태로 존재하는 통계정보의 격자 변환을 위해 1)지오코딩을 통한 공간데이터로의 변환, 2)공간 관계 정의를 통한 위치정보 변환, 3)데이터 척도를 고려한 속성정보 변환을 수행하는 방법론을 정리하였다. 제시한 방법론은 서울시 A지역의 인구 밀도 통계정보를 격자로 변환하기 위해 적용하였다. 특히, 동일한 통계정보를 표현하는 참조데이터가 서로 다르더라도 유사한 격자 표현이 가능해야 함을 검증하기 위해 공간 자기상관성을 통해 분석하였다. 그 결과, 집계구와 건물을 통해 표현되는 인구 밀도를 각각 격자로 변환하였을 때, 두 데이터 모두 유사한 격자 분포를 표현함을 파악할 수 있었다. 이러한 결과를 통해 본 연구에서 제안하는 방법론은 일관된 결과를 표현할 수 있음을 확인하였다.
본 논문에서는 다양한 형태로 존재하는 통계정보를 일정한 모양과 크기를 갖는 격자로 표현하기 위해 필요한 데이터 변환 방법론에 대하여 제시한다. 격자는 기존 통계지도 서비스에서 활용하고 있는 통계공간단위인 행정구역과 집계구와 비교하였을 때 모양과 크기가 일정하여 통계정보를 객관적으로 파악할 수 있게 하며, 지도 축척 변화에 유연하게 적용될 수 있는 특징이 있다. 한편, 기존 통계지도 서비스에서는 면 보간법을 활용하여 통계공간단위로 변환하고 있는데, 이것을 다양한 형태로 존재하는 통계정보에 적용시키기 위해서는 추가적인 프로세스가 필요하다. 이에 따라, 본 논문에서는 다양한 형태로 존재하는 통계정보의 격자 변환을 위해 1)지오코딩을 통한 공간데이터로의 변환, 2)공간 관계 정의를 통한 위치정보 변환, 3)데이터 척도를 고려한 속성정보 변환을 수행하는 방법론을 정리하였다. 제시한 방법론은 서울시 A지역의 인구 밀도 통계정보를 격자로 변환하기 위해 적용하였다. 특히, 동일한 통계정보를 표현하는 참조데이터가 서로 다르더라도 유사한 격자 표현이 가능해야 함을 검증하기 위해 공간 자기상관성을 통해 분석하였다. 그 결과, 집계구와 건물을 통해 표현되는 인구 밀도를 각각 격자로 변환하였을 때, 두 데이터 모두 유사한 격자 분포를 표현함을 파악할 수 있었다. 이러한 결과를 통해 본 연구에서 제안하는 방법론은 일관된 결과를 표현할 수 있음을 확인하였다.
The purpose of this paper is to propose a data transformation method for visualizing the statistical information based on the grid system which has regular shape and size. Grid is better solution than administrator boundary or census block to check the distribution of the statistical information and...
The purpose of this paper is to propose a data transformation method for visualizing the statistical information based on the grid system which has regular shape and size. Grid is better solution than administrator boundary or census block to check the distribution of the statistical information and be able to use as a spatial unit on the map flexibly. On the other hand, we need the additional process to convert the various statistical information to grid if we use the current method which is areal interpolation. Therefore, this paper proposes the 3 steps to convert the various statistical information to grid. 1)Geocoding the statistical information, 2)Converting the spatial information through the defining the spatial relationship, 3)Attribute transformation considering the data scale measurement. This method applies to the population density of Seoul to convert to the grid. Especially, spatial autocorrelation is performed to check the consistency of grid display if the reference data is different for same statistic information. As a result, both distribution of grid are similar to each other when the population density data which is represented by census block and building is converted to grid. Through the result of implementation, it is demonstrated to be able to perform the consistent data conversion based on the proposed method.
The purpose of this paper is to propose a data transformation method for visualizing the statistical information based on the grid system which has regular shape and size. Grid is better solution than administrator boundary or census block to check the distribution of the statistical information and be able to use as a spatial unit on the map flexibly. On the other hand, we need the additional process to convert the various statistical information to grid if we use the current method which is areal interpolation. Therefore, this paper proposes the 3 steps to convert the various statistical information to grid. 1)Geocoding the statistical information, 2)Converting the spatial information through the defining the spatial relationship, 3)Attribute transformation considering the data scale measurement. This method applies to the population density of Seoul to convert to the grid. Especially, spatial autocorrelation is performed to check the consistency of grid display if the reference data is different for same statistic information. As a result, both distribution of grid are similar to each other when the population density data which is represented by census block and building is converted to grid. Through the result of implementation, it is demonstrated to be able to perform the consistent data conversion based on the proposed method.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 다양한 형태로 존재하는 통계정보를 격자로 표현하기 위해 필요한 데이터 변환 방법론을 체계적으로 제시를 하였다. 제시한 방법론을 검증하기 위해 서울시 A지역의 인구 밀도를 여러 가지 크기의 격자로 변환하였으며, 격자 변환 시 간접참조 데이터는 2가지 종류를 활용하여 참조데이터의 종류가 다르더라도 통계정보를 표현할 수 있는 올바른 참조 데이터를 사용한다면 격자 변환 시 최종 결과가 유사하게 변환됨을 공간 자기상관성을 기준으로 확인하였다.
격자는 행정구역이나 집계구와는 다르게 데이터의 수집단위로는 활용되고 있지 않기 때문에 격자를 기반으로 통계정보를 표현하기 위해서는 원천데이터의 격자 변환이 필요하다. 이에 따라, 본 연구에서는 다양한 형태로 존재하는 통계정보를 지도상에 통계공간단위를 기반으로 표현하기 위한 체계적인 데이터 변환 방법을 제시한다. 이와 같은 연구를 위한 연구 수행과정은 다음과 같다.
제안 방법
이에 따라, 다양한 형태로 존재하는 통계정보에 일반적으로 적용될 수 있는 방법론으로는 한계가 있다. 따라서 다양한 형태로 존재하는 통계정보를 통계공간단위로 표현하기 위해서는 일정한 모양과 크기를 갖는 격자로 변환할 수 있는 일반적인 방법론이 필요하며, 본 연구에서는 이러한 방법론을 기존에 존재하는 이론들을 기반으로 통계정보에 적용하기 위해 보완되어야 하는 추가 프로세스를 포함하여 제시한다.
본 부분에서는 서울시 A지역의 인구 밀도에 대하여 제시한 방법론을 적용하여 격자로 변환한다. 또한 인구 밀도를 표현하는 원본데이터가 상이하더라도 격자로 변환되었을 때에는 유사한 데이터를 표현할 수 있어야 하므로 이를 확인하기 위해 집계구와 건물데이터를 참조데이터로 정의하여 격자 변환 시 데이터 표현에 차이가 있는지를 분석하도록 한다.
기존 통계지도 서비스에서 활용하는 통계공간단위인 행정구역, 집계구 등은 통계정보를 일정하게 표현하지 못하는 한계점을 갖는 것으로 다양한 선행연구들을 통해 파악되었다. 또한, 기존 통계공간단위로 활용되고 있는 행정경계 또는 집계구의 한계점을 보완할 수 있는 통계공간단위로 격자가 많이 활용되고 있음을 확인하였으며, 이에 본 연구에서는 격자를 기반으로 다양한 통계정보의 통계공간단위로의 변환에 대하여 체계적인 방법론을 제시하도록 한다. 또한, 현재 수집된 통계정보를 통계공간단위로 표현하기 위해 가장 많이 활용되는 방법론인 면 보간법은 통계정보가 공간단위로 존재한다는 가정 하에 적용될 수 있는 방법론이며, 통계정보의 데이터 척도 측면에서 보았을 때 비율척도에 속하는 통계정보를 변환하기에 적합한 방법론이다.
4장에서는 제시된 방법론을 적용하여 서울시 A지역에 대한 인구 밀도 통계를 격자로 변환하도록 한다. 방법론을 적용하여 올바른 데이터 변환을 확인하기 위한 한가지 방법으로 원본 데이터가 갖는 공간 자기상관성을 그대로 유지하고 있는지를 확인하여 데이터 변환의 결과를 검증하도록 한다.
총 인구 수 데이터는 비공간 데이터로 존재하기 때문에 격자 변환을 위해서는 간접 참조데이터에 총 인구 수를 지오코딩하여 공간데이터로 변환하여야 한다. 본 실험에서는 총 인구 수를 표현할 수 있는 간접 참조데이터로 집계구와 건물을 각각 정의하여 격자로 변환한 뒤에 결과를 비교하도록 한다. Figure 4와 5는 각각 집계구와 건물에 서울시 A지역의 총 인구 수를 지오코딩하여 표현한 것의 일부분이다.
본 연구에서는 다양한 형태로 존재하는 통계정보를 격자로 변환하기 위해 Figure 1과 같은 프로세스 기반의 데이터 변환 방법론을 제안한다.
3장에서는 다양한 형태로 존재할 수 있는 통계정보의 격자변환을 위한 체계적인 방법론을 제시한다. 제안하는 방법론은 1) 비공간데이터로 존재하는 통계정보의 공간데이터 변환을 위한 지오코딩 단계, 위치정보 변환을 위한 2)공간관계(Spatial Relation ship) 정의 단계, 3)데이터 척도(Data Scale Measurement)를 고려한 속성정보 변환 단계로 세분화하여 제시된다. 4장에서는 제시된 방법론을 적용하여 서울시 A지역에 대한 인구 밀도 통계를 격자로 변환하도록 한다.
지오코딩 수행 이후 집계구, 건물을 기반으로 표현되는 총 인구수와 격자와의 공간관계를 파악하여 어느 격자 객체에 총 인구 수 정보를 변환할 지를 파악한다. 이 때, 총 인구 수 정보를 표현하고 있는 집계구와 건물은 면으로 표현됨에 따라 하나의 집계구, 건물 객체가 다수의 격자 객체에 공간적인 영향을 끼칠 수 있으며, 이러한 경우에는 격자를 기준으로 집계구, 건물 객체를 분할하여 두 객체사이의 관계가 포함 관계가 될 수 있게 한다.
한편, 동일한 통계정보를 서로 다른 참조데이터로 정의한 뒤 격자로 변환 할 경우에도 동일한 데이터 분포 표현을 할 수 있는지 검증하기 위해 추가적인 실험을 수행하였다.
대상 데이터
본 부분에서는 서울시 A지역의 인구 밀도에 대하여 제시한 방법론을 적용하여 격자로 변환한다. 또한 인구 밀도를 표현하는 원본데이터가 상이하더라도 격자로 변환되었을 때에는 유사한 데이터를 표현할 수 있어야 하므로 이를 확인하기 위해 집계구와 건물데이터를 참조데이터로 정의하여 격자 변환 시 데이터 표현에 차이가 있는지를 분석하도록 한다.
입력데이터는 서울시 A지역에 대한 총 인구수 정보와 다양한 크기의 격자 변환 결과를 확인하기 위해 4가지 종류(50m, 100m, 200m, 400m)의 격자를 사용하였으며, 총 인구수 정보의 경우 2014년 국토지리원의 국토조사 발전계획 수립 및 플랫폼 기반구축 사업의 일환으로 수집된 주민등록인구 정보를 활용하였다. 주민등록인구 정보는 개인정보가 모두 제거된 상태로 활용되었다[13].
이론/모형
공간관계 정의 단계의 목적은 통계정보와 격자간의 공간관계를 데이터 변환 될 수 있는 관계로 정의하여 통계정보가 어느 격자 객체로 변환 될 지를 정의하는 단계이다. 데이터 변환을 위한 통계정보와 격자와의 공간 관계는 벡터로 표현되는 두 객체 사이의 공간관계를 정의한 국제표준인 DE-9IM (Dimensionally Extended Nine-Intersection Model)을 참고할 수 있다[1]. DE-9IM에서는 기하유형에 따른 다양한 공간관계를 정의하고 있는데, 통계정보가 격자로 올바르게 변환되기 위해서는 Figure 2와 같이 격자가 통계정보를 포함(Contains)하도록 공간관계가 정의 되어야한다.
성능/효과
실험 결과, 집계구로 표현되는 데이터를 격자로 변환하여 표현한 것과 건물로 표현되는 데이터를 격자로 변환하여 표현하는 경우 모두 원본데이터의 분포와 격자 데이터의 분포가 유의수준 내에서 밀집으로 동일한 군집패턴을 보이는 것으로 나타났다. 또한 격자의 크기에 따라 표현되는 인구 밀도에 대한 평균과 표준편차도 큰 차이가 나타나지 않는 것으로 확인됨에 따라 격자의 크기가 달라짐에도 불구하고 격자가 표현하는 인구 밀도는 유사한 통계 값과 분포로 표현된다는 것을 확인하였다.
한편, 간접 데이터에 따른 데이터 변환 결과를 비교하기 위해 집계구와 건물의 원본을 통한 총 인구수분포와 격자로 변환했을 때의 인구 밀도의 분포를 모란지수를 통해 정량적인 수치로 Table 2와 같이 도출해 내었다. 실험 결과, 집계구로 표현되는 데이터를 격자로 변환하여 표현한 것과 건물로 표현되는 데이터를 격자로 변환하여 표현하는 경우 모두 원본데이터의 분포와 격자 데이터의 분포가 유의수준 내에서 밀집으로 동일한 군집패턴을 보이는 것으로 나타났다. 또한 격자의 크기에 따라 표현되는 인구 밀도에 대한 평균과 표준편차도 큰 차이가 나타나지 않는 것으로 확인됨에 따라 격자의 크기가 달라짐에도 불구하고 격자가 표현하는 인구 밀도는 유사한 통계 값과 분포로 표현된다는 것을 확인하였다.
이에 따라, 참조 데이터의 종류가 다르더라도 인구밀도를 표현하는 올바른 참조 데이터를 활용하며, 본 연구에서 제안하는 체계적인 격자변환을 수행한다면 격자 변환의 결과물은 유사하다는 것을 확인할 수 있었다.
본 연구에서는 다양한 형태로 존재하는 통계정보를 격자로 표현하기 위해 필요한 데이터 변환 방법론을 체계적으로 제시를 하였다. 제시한 방법론을 검증하기 위해 서울시 A지역의 인구 밀도를 여러 가지 크기의 격자로 변환하였으며, 격자 변환 시 간접참조 데이터는 2가지 종류를 활용하여 참조데이터의 종류가 다르더라도 통계정보를 표현할 수 있는 올바른 참조 데이터를 사용한다면 격자 변환 시 최종 결과가 유사하게 변환됨을 공간 자기상관성을 기준으로 확인하였다.
후속연구
본 연구에서는 정사각형 모양의 격자를 기반으로 한 데이터 변환 방법에 대한 연구 실험을 진행하였는데, 격자 체계라는 것은 다양한 모양이 될 수 있기 때문에 향후 연구에서는 이러한 점을 고려하여 다른 형태의 격자에도 제안된 방법론을 적용하는 연구가 필요하다. 또한 데이터 변환을 통해 생성된 격자가 유용하게 활용되기 위해서는 데이터 표현, 분석 등에 필요한 적정 격자 크기에 대한 연구도 필요하며, 이를 위해 여러 데이터를 비교 분석하여 정량적인 결과 도출 할 필요가 있다.
본 연구에서 제시하고 있는 격자로의 데이터 변환 방법은 지속적으로 논의되는 통계공간단위로서 격자가 더 적극적으로 활용 될 수 있도록 할 것이다. 향후에는 이러한 데이터 변환 방법을 기반으로 고도화된 격자 변환을 위해 다양한 연구가 필요할 것이다.
향후에는 이러한 데이터 변환 방법을 기반으로 고도화된 격자 변환을 위해 다양한 연구가 필요할 것이다. 본 연구에서는 정사각형 모양의 격자를 기반으로 한 데이터 변환 방법에 대한 연구 실험을 진행하였는데, 격자 체계라는 것은 다양한 모양이 될 수 있기 때문에 향후 연구에서는 이러한 점을 고려하여 다른 형태의 격자에도 제안된 방법론을 적용하는 연구가 필요하다. 또한 데이터 변환을 통해 생성된 격자가 유용하게 활용되기 위해서는 데이터 표현, 분석 등에 필요한 적정 격자 크기에 대한 연구도 필요하며, 이를 위해 여러 데이터를 비교 분석하여 정량적인 결과 도출 할 필요가 있다.
본 연구에서 제시하고 있는 격자로의 데이터 변환 방법은 지속적으로 논의되는 통계공간단위로서 격자가 더 적극적으로 활용 될 수 있도록 할 것이다. 향후에는 이러한 데이터 변환 방법을 기반으로 고도화된 격자 변환을 위해 다양한 연구가 필요할 것이다. 본 연구에서는 정사각형 모양의 격자를 기반으로 한 데이터 변환 방법에 대한 연구 실험을 진행하였는데, 격자 체계라는 것은 다양한 모양이 될 수 있기 때문에 향후 연구에서는 이러한 점을 고려하여 다른 형태의 격자에도 제안된 방법론을 적용하는 연구가 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
통계지도는 무엇인가?
최근에는 통계와 공간정보 분야 간 융합 및 활용 사례가 증가하고 있으며, 특히 UN-GGIM의 경우 통계 및 공간정보 통합전문가 위원회(United nations expert group on the integration of statistical and geospatial information)를통해 세계 각국의 다양한 통계 및 공간정보 융합 사례를 소개하고 있다. 대표적으로 현재 가장 많이 활용되고 있는 사례는 통계정보를 지도위에 표현하여 시각적으로 통계정보를 파악할 수 있게 하는 ‘통계지도’이다.
대표적인 통계 공간단위의 행정구역, 집계구, 격자의 한계점은?
통계지도 서비스를 위해 사용되는 대표적인 통계 공간단위는 행정구역, 집계구, 격자 등이 있으며, 현재 행정구역이나 집계구가 가장 많이 활용되고 있다. 그러나 행정구역이나 집계구의 경우 모양과 크기가 불규칙하며, 시간의 변화에 따라 경계가 조정되어 통계 공간단위의 모양과 크기가 바뀔 수 있고, 집계구의 경우 지도의 축척과는 무관하게 고정된 모양과 크기를 갖기 때문에 축척에 따른 유기적인 통계공간단위를 제공하지 못하는 한계점이 있다. 따라서 이러한 한계점을 극복할 수 있는 적절한 통계공간단위에 대해 많은 의견들이 제시되고 있으며, 그 중 일정한 모양과 크기를 갖는 ‘격자’를 통해 통계정보를 표현하는 방안이 가장 주목받고 있다.
통계지도 서비스를 위해 사용되는 대표적인 통계 공간단위는 무엇이 있는가?
그러나 통계정보의 종류에 따라서는 원천데이터를 그대로 맵핑하여 통계지도 서비스를 할 경우에는 개인정보나 보안이 요구되는 정보들을 그대로 노출 할 수도 있기 때문에 이를 보완하기 위해 일정한 기준으로 통계정보를 집계하여 표현하며, 집계를 위해 활용되는 단위를 통계공간단위(Spatial Unit)라 한다. 통계지도 서비스를 위해 사용되는 대표적인 통계 공간단위는 행정구역, 집계구, 격자 등이 있으며, 현재 행정구역이나 집계구가 가장 많이 활용되고 있다. 그러나 행정구역이나 집계구의 경우 모양과 크기가 불규칙하며, 시간의 변화에 따라 경계가 조정되어 통계 공간단위의 모양과 크기가 바뀔 수 있고, 집계구의 경우 지도의 축척과는 무관하게 고정된 모양과 크기를 갖기 때문에 축척에 따른 유기적인 통계공간단위를 제공하지 못하는 한계점이 있다.
참고문헌 (16)
Kim, K. 2011, Effects of the Modifiable Areal Unit Problem (MAUP) on a Spatial Interaction Model, Journal of the Association of Korean Geographers, 46(2):197-211.
Sudsom, N; Techato, K; Thammapalo, S; Monprapussorn, S. 2012, Grid and Census: a Geographic Sampling Strategy for Studying Dengue Vector Breeding Sites in Urban Area, Paper presented at the 33 rd Asian Conference on Remote Sensing, Pattaya, November 26-30.
Shin, M. Y; Yun, J. I; Suh, A. S. 1999, Estimation of Daily Maximum/Minimum Temperature Distribution over the Korean Peninsula by Using Spatial Statistical Technique, Journal of the Korean Society of Remote Sensing, 15(1):9-20.
Song, M. Y; Jung, K. S; Lee, G. H; Kim, Y. S; Shin, Y. A. 2014, DAD Analysis of Yongdam Dam Watershed Using the Cell-Based Automatic Rainfall Field Tracking Method, Journal of the Korean Association of Geographic Information Studies, 17(3):68-81.
Kim, J. Y; Park, I. S; Park, C. Y; Park, S. K. 2010, Effects of Grid Size on Noise Prediction Results of Road Traffic Noise Map, Korean Society for Noise and Vibration Engineering, 20(2):199-204.
Um, D. Y; Lee, B. S. 2012, Analysis of the Effect on the Location Evaluation of Golf Course according to the Unit Grid Size applied in Slope Analysis (In flank of Environment), Korea Society of Surveying, Geodesy, Photogrammetry, and Cartography, 30(5):467-475.
Lee, S; Kim K. 2007, Representing the Population Density Distribution of Seoul Using Dasymetric Mapping Techniques in a GIS Environment, Journal of the Korean Cartographic Association, 7(2):53-67.
Reibel, M; Agrawal, A. 2007, Areal interpolation of population counts using pre-classified land cover data, Population Research and Policy Review, 26(5-6):619-633.
Sridharan, H; Qiu, F. 2013, A spatially disaggregated areal interpolation model using light detection and ranging-derived building volumes, Geographical Analysis, 45(3):238-258.
Lee, J. 2009, GIS-based geocoding methods for area-based addresses and 3D addresses in urban areas, Environment and Planning B: Planning and Design, 36:86-106.
Lee, H. Y; Noh, S. C. 2013, Advanced Statistical Analysis : Theory and Practice 2nd Edition, Moon Woo (in Korean).
National Geographic Information Institute. 2014, Development Plan of National Territorial Statistic Monitoring and Construction of Platform Project, Korea.
Lee, G. 2011, A review of Object and Field Perspective on Modifiable Areal Unit Problem, Journal of the Korean Cartographic Association, 11(1):25-32.
Swift, A; Liu, L; Uber, J. 2008, Reducing MAUP bias of correlation statistics between water quality and GI illness, Computer, Environment and Urban Systems, 32:134-148.
Zhang, N; Zhang, H. 2011, Scale Variance Analysis Coupled with Moran's I Scalogram to Identify Hierarchy and Characteristic Scale, International Journal of Geographical Information Science, 25(9):1525-1543.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.