$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 공간이웃정보를 고려한 공간회귀분석
A study on the spatial neighborhood in spatial regression analysis 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.28 no.3, 2017년, pp.505 - 513  

김수정 (한국한의학연구원)

초록
AI-Helper 아이콘AI-Helper

최근, 더욱 상세하고 정확한 추정 결과를 위해 소지역추정(small area estimation; SAE)의 연구가 많이 진행되고 있다. 그 중 공간회귀모형 (spatial regression model)을 이용한 방법이 주를 이루고 있는데 이를 사용하기 위해서는 공간이웃 (spatial neighbor)의 정의가 필요하다. 본 연구에서는 공간이웃을 정의하는 방법으로 도로네 삼각망 (Delaunay triangulation; DT)을 소개하고 k-최근접 (k-nearest neighbor; KNN)과 비교하여 분석한다. 두 가지 공간이웃을 정의하는 방법중에서 어떤 방법으로 이웃을 정의하는 것이 효율적인지 알아보기 위해 시뮬레이션을 실시하였고, 지가 (land price)데이터를 이용하여 실 데이터를 분석하였다.

Abstract AI-Helper 아이콘AI-Helper

Recently, numerous small area estimation studies have been conducted to obtain more detailed and accurate estimation results. Most of these studies have employed spatial regression models, which require a clear definition of spatial neighborhoods. In this study, we introduce the Delaunay triangulati...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • h1>1. 서론
  • (1) 정방영역으로 크기를 지정하여 각각 x좌표, y좌표 ([0,1]×[0,1], [0,2]×[0,2], [0,3.5]×[0,3.
  • h1>1. 서론
  • h1>1. 서론
  • 이 방법은 행을 표준화 할 경우 주변지역의 값이 한 지점에 평균적으로 얼마나 영향을 미치는지 계량화 할 수 있는 장점이 있다 (Lee, 2015). 단위 지역 단위의 인접성을 기초로 하여 두 지역 단위가 인접하면 1, 인접하지 않으면 0으로 설정하여, 행의 합계를 1로 표준화하여 공간이웃가중치를 계산한다. 요소 Cij (i, j = 1, 2, · · · , n)에서 공간이웃행렬 C가 이웃 행렬의 행합으로 표준화한 WW의 요소 wij는 식 (2.
  • 도로네 삼각망의 특징은 경계가 인접해 있는지에 관계없이 이웃관계가 정의되며, 지역이 밀집되어 있는 지역은 더욱 밀집되어 네트워크가 형성되는 특징을 가지고 있다. 도로네 삼각망은 보로노이 다이어그램 (Voronoi diagram)의 쌍대도형이며, 점간의 자연스러운 인접관계를 나타내는 것으로 알려져 있다. 그러나, 단순히 지역의 분포 패턴에 따라 멀리 떨어져 있는 두 점을 인접하다고 간주해 버리는 위험성이 있다.
  • (1) 정방영역으로 크기를 지정하여 각각 x좌표, y좌표 ([0,1]×[0,1], [0,2]×[0,2], [0,3.5]×[0,3.
  • 공간이웃을 정의하는 방법은 몇 가지가 있다. 두 지역의 중심점의 유클리드 거리 (Euclidean distance)로 이웃관계를 정의하는 방법, 최근접 k지역을 이웃으로 정의하는 방법, 도로네 삼각망을 이용한 방법, 일정 반경 이내를 포함하는 지역에 대해서 공간이웃을 정의하는 방법 등이 있다. 본 연구에서는 시뮬레이션과 실 데이터 분석에서 도로네 삼각망방법과 최근접 방법을 이용하여 비교하였다.
  • 그 중 k−최근접은 거리 측도를 이용시 많이 쓰여진 방법 중 하나이다 (Lee 등, 2015). 최근 공간분석을 통해 상권의 최적입지, 마켓팅, 프렌차이즈 관리 등 여러 분야에서 활용되고 있는데 단순 거리로 공간상에 부포하고 있는 객체들을 측정하는데는 한계가 있다 (Jung, 2009). 공간데이터 사이의 공통적인 연관성을 찾는 공간데이터미이닝에서도 주로 기하연산에 기반을 두고 한정된 클러스터링 방법을 많이 다루었는데 (Son 등, 1998), 최근 공간 클러스터링 (spatial clustering)방법으로 임의의 분포에서 클러스터 발견, 이상치의 효율적인 처리 등 기존 방법에서 몇 가지 단점이 보안 된 도로네 삼각망을 이용한 공간 클러스터링이 많이 이용되고 있다 (Yang과 Cui, 2010).
  • 3절에서는 두 가지의 공간이웃의 정의방법을 달리하여 어떤 방법으로 이웃을 정의하는 것이 효율적인지 알아보기 위하여 시뮬레이션을 실시하였다. 시뮬레이션의 예측성능은 공간회귀모형인 공간자기회귀 (spatial auto-regression; SAR)모형을 이용하여 잔차제곱합 (residual sum of squares; RSS)을 기준으로 도로네 삼각망과 k−최근접의 두 가지 공간이웃 정의방법을 비교한다. 4절에서는 일본의 지가데이터를 이용하여 실 데이터로 공간이웃의 정의 방법을 비교하고, 5절에서는 본 연구에서 수행한 결과에 대해 결론을 내리고 연구의 한계점과 향후 연구방향을 제시한다.
  • h1>1. 서론
  • h1>1. 서론
  • h1>1. 서론
  • 시뮬레이션의 예측성능은 공간회귀모형인 공간자기회귀 (spatial auto-regression; SAR)모형을 이용하여 잔차제곱합 (residual sum of squares; RSS)을 기준으로 도로네 삼각망과 k−최근접의 두 가지 공간이웃 정의방법을 비교한다.
  • h1>1. 서론
  • 공간가중치행렬에는 ① 이웃행렬을 그대로 이용한 방법 (WB), ② 이웃행렬의 행합으로 표준화 하는 방법 (WW), ③ 이웃행렬의 전 요소의 합으로 표준화하는 방법 (WC), ④ 거리행렬을 이용해 표준화하는 방법 (WS) 등이 있다. 여기서는 행 표준화 (row-standardization) 방법이라고도 불리는 이웃행렬의 행합으로 표준화하는 방법 (WW)을 이용해서 공간가중치행렬을 계산하였다. 이 방법은 행을 표준화 할 경우 주변지역의 값이 한 지점에 평균적으로 얼마나 영향을 미치는지 계량화 할 수 있는 장점이 있다 (Lee, 2015).
  • 2)와 같다. 여기에서 N은 대상지역의 수, xi와 xj는 각각 지역 i, j에서 얻어진 어떤 특성값, #는 모든 지역의 특성값들에 대한 평균을 나타내다. Moran’s I는 -1과 1사이의 값을 가지고 |I|가 1에 가까울수록 높은 공간적 상관 관계를 가진다 (Moran, 1948).
  • h1>1. 서론
  • 일반적으로 상관관계 (correlation coefficient)라고 하면 두 변수 사이의 관련성을 의미하지만, 공간자기상관 (spatial autocorrelation)은 하나의 변수와 여러 관측값들 사이에서의 관계를 의미한다. 즉, 가까이 위치하는 데이터 속성과 멀리 위치하는 속성을 비교하여 비슷한 여부에 대한 관련성을 나타내는 계수이다.
  • (1) 정방영역으로 크기를 지정하여 각각 x좌표, y좌표 ([0,1]×[0,1], [0,2]×[0,2], [0,3.5]×[0,3.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
공간이웃이란 어떤 상태인가? 어떤 지역이 다른 지역의 주변지역과 이웃하고 있는 상태를 공간이웃이라고 한다. 공간이웃을 정의하는 방법은 몇 가지가 있다.
공간회귀분석은 어떤 단계로 분석이 이루어지는가? 공간회귀분석은 공간이웃의 정의, 공간이웃 가중치의 정의, 공간자기상관의 확인, 공간회귀모형의 적용 등의 단계로 분석이 이루어진다.
공간이웃의 정의하는 방법에는 무엇이 있는가? 공간이웃을 정의하는 방법은 몇 가지가 있다. 두 지역의 중심점의 유클리드 거리 (Euclidean distance)로 이웃관계를 정의하는 방법, 최근접 k지역을 이웃으로 정의하는 방법, 도로네 삼각망을 이용한 방법, 일정 반경 이내를 포함하는 지역에 대해서 공간이웃을 정의하는 방법 등이 있다. 본 연구에서는 시뮬레이션과 실 데이터 분석에서 도로네 삼각망방법과 최근접 방법을 이용하여 비교하였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. Anselin, L. (2001). Spatial externalities, spatial multipliers and spatial econometrics, Regional Economics Applications Laboratory, Illinois. 

  2. Han, J. H. and Lee, M. J. (2016). Cancer cluster detection using scan statistic. Journal of the Korean Data & Information Science Society, 27, 1193-1201. 

  3. Hwang, H. J. and Shin, K. I. (2009). A small area estimation for monthly wage using mean squared percentage error. Korean Journal of Applied Statistics, 22, 403-414. 

  4. Hur, Y. (2007). A study on the estimation of house price in regard of spatial effects. House Studies Review, 15, 5-23. 

  5. Jung, D. Y. and Son, Y. G. (2009). A analysis on the spatial features of the neighborhood trade area using positive spatial autocorrelation method. Journal of the Korean Society for GeoSpatial Information System, 17, 141-147. 

  6. Kim, J. S., Hwang, H. J. and Shin, K. I. (2008). Comparison of spatial small area estimators based on neighborhood information systems. Korean Journal of Applied Statistics, 21, 855-866. 

  7. Kim, S. J., Choi, S. B., Kang, C. W. and Cho, J. S. (2010). A comparative study on spatial lattice data analysis. Communications for Statistical Applications and Methods, 17, 193-204. 

  8. Lee, K. O. (2000). On application of small area estimation to the unemployment statistics of si-gun-gu. The Korean Journal of Applied Statistics, 13, 275-286. 

  9. Lee, K. S. and Sine, K. I. (2008). Comparison of neighborhood information systems for lattice data. The Korean Journal of Applied Statistics, 21, 387-397. 

  10. Lee, W. J. and Park, C. Y. (2015). Prediction of apartment prices per unit in Daegu-Gyeongbuk areas by spatial regression models. Journal of the Korean Data & Information Science Society, 26, 561-568. 

  11. Moran, P. A. P. (1948). The interpretation of statistical maps. Journal of the Royal Statistical Society, Series B, 10, 243-251. 

  12. Panczak, R., Held L., Moser, A., Jones, P. A., Ruhli, F. J. and Staub, K. (2016). Finding big shots: small-area mapping and spatial modelling of obesity among Swiss male conscripts. BMC Obesity, 3, 1-12. 

  13. Son, E. J., Kang, I. S., Kim, T. W. and Li, K. J. (1998). A spatial data mining method by clustering analysis. Korea Information Science Society, 25, 161-163. 

  14. Wheeler, D. C. (2007). A comparison of spatial clustering and cluster detection techniques for childhood leukemia incidence in Ohio, 1996-2003. International Journal of Health Geographics, 6, 13. 

  15. Yang, X. and Cui, W. (2010). A novel spatial clustering algorithm based on Delaunay Triangulation. Journal of Software Engineering & Applications, 3, 141-149. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로