$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

CNN 모형을 이용한 서울 아파트 가격 예측과 그 요인
Prediction and factors of Seoul apartment price using convolutional neural networks 원문보기

응용통계연구 = The Korean journal of applied statistics, v.33 no.5, 2020년, pp.603 - 614  

이현재 (성균관대학교 통계학과) ,  손동희 (성균관대학교 통계학과) ,  김수진 (성균관대학교 통계학과) ,  오세인 (성균관대학교 스포츠과학과) ,  김재직 (성균관대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

본 연구는 이미지 데이터에 대한 예측 모형으로 뛰어난 성능을 보여온 convolutional neural networks (CNN) 모형을 이용하여 서울 아파트 가격의 예측과 서울 각 지역 아파트들의 가격결정요인들을 연구한다. 이를 위해 강, 녹지, 고도와 같은 자연환경요인, 버스정류장, 지하철역, 상권, 학교 등과 같은 기반시설요소, 일자리수, 범죄율 등의 사회경제요소들을 설명변수로 고려하고, CNN 모형이 이미지 데이터에 좋은 성능을 보여온 것을 기반으로 이 설명변수들의 값들을 CNN 모형 입력층으로써 이미지 채널의 픽셀값과 같은 역할을 하도록 변환하여 아파트 가격의 예측과 가격결정요인에 대한 해석을 시도한다. 덧붙여 본 연구에서 사용된 CNN 모형은 자연환경요인과 기반시설요인 변수들을 각 아파트를 중심으로 하는 각 입력층의 채널에 이진의 이미지로 표현함으로써 각 아파트의 공간적인 특성을 고려할 수 있다.

Abstract AI-Helper 아이콘AI-Helper

This study focuses on the prediction and factors of apartment prices in Seoul using a convolutional neural networks (CNN) model that has shown excellent performance as a predictive model of image data. To do this, we consider natural environmental factors, infrastructure factors, and social economic...

주제어

표/그림 (10)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 또한, 기본적으로 입력변수들의 출력변수에 대한 해석 및 예측에서의 중요도를 측정하기 힘든 신경망 모형을 사용하였기 때문에 각 지역들의 가격결정요인들을 명확하게 밝히는 것은 쉬운 일이 아니었다. 그럼에도 본 연구에서는 서울 각 지역들에 대해 아파트 매매가를 결정하는 요인들을 알아보기 위해 여러 입력변수들의 조합을 고려한 모형들의 잔차들의 변화를 살펴보았고, 이를 통해 가격결정 요인들에 대한 해석을 시도하였다. 그러나 신경망 모형 그 자체는 모든 입력변수들의 비선형 변환들이 여러 개의 층을 통해 연결되어 있기 때문에 모형들의 잔차의 변화가 단지 특정 변수의 추가 또는 삭제만으로 명확하게 설명되기 어려운 한계가 있다.
  • 본 연구는 서울 시내의 개별 아파트들이 아닌 각 아파트 단지들을 분석 대상으로 하고 그 아파트들의 가격 예측과 가격 결정 요인 분석을 목적으로 한다. 개별 아파트가 아닌 아파트 단지를 분석 대상으로 정한 이유는 같은 아파트 단지 내의 아파트들은 같은 환경요인 및 기반 시설과 사회경제적 지표들을 가지고 있다고 가정할 수 있기 때문이다.
  • 본 연구는 이미지 데이터에 대한 예측 모형으로 뛰어난 성능을 보여온 CNN 모형을 이용하여 서울 아파트 가격의 예측과 서울 지역 아파트들의 가격결정 요인들을 전차의 변화를 통해 조사하는데 집중하였다. 이를 위해 자연환경요소, 기반시설요소, 사회경제요소들을 입력변수로 고려하였고, CNN 모형이 이미지데이터에 좋은 성능을 보여온 것에 착안하여 이 입력변수들의 값들을 CNN 모형 입력층으로써 이미지 채널의 픽셀값과 같은 역할을 하도록 변환하여 예측모형을 만드는 시도를 하였다.
  • 본 연구에서는 1년 동안 발생된 매매가에 대해 분석을 진행하였다. 특정 아파트 단지 내에서도 선호하는 동과 층수에 따라 가격이 천차만별일 수 있고, 단지내 아파트 면적별 구성에 의해서도 가격이 달라질 수 있기 때문에 이러한 요소들도 고려하고 더 긴 기간에 대해 자료를 수집한다면 본 연구에서 제안한 모형이 좀 더 향상될 수 있을 것으로 기대한다.
  • 오늘날 딥러닝(deep learning) 모형들은 인공지능 분야의 핵심기술로 떠오르고 있고, 이미지(image) 또는 자연어 처리 등에서 독보적인 성능을 보유하며 널리 활용되고있다. 본 연구에서는 딥러닝 모형의 하나로 이미지 데이터에 대한 예측모형으로 널리 활용되고 있는 convolutional neural networks (CNN) 모형을 이용하여 서울 아파트 가격을 예측하고 그들의 가격결정요인들을 분석하고자 한다.
  • 본 연구에서는 아파트 가격의 예측및 요인을 찾기 위해 이미지 데이터에 대한 예측 및 분류 문제에서 뛰어난 성능을 보여온 CNN 모형을 사용하여 분석을 진행한다. 이러한 이미지 데이터를 이용한 예측 문제에 있어 랜덤포레스트(random forests)와 서포트벡터회귀(support vector regression) 모형 등도 고려될 수 있으나, 이러한 모형들은 CNN 모형의 풀링(pooling) 과정과 같이 입력변수의 차원을 줄이지 않는다면 문제가 있을 수 있다.
  • 아파트의 가격은 그 아파트가 가지는 다양한 요인들에 의해 결정되어지는데 지금까지의 연구는 거시경제학적인 지표에 기반하여 설명하려는 경향이 있었고, 개별 아파트의 가격 결정 요인에 대한 분석이라기보다는 한국, 수도권, 또는 서울 전체 아파트 가격 변동과 예측에 집중하였다. 이에 본 연구에서는 아파트의 위치에 기반한 주변자연환경 및 기반시설 요소와 사회경제적 요소들을 고려하여 개별 아파트들의 가격을 예측하고 각 지역 아파트들의 주요한 가격 결정 요인들을 탐색하고자 한다. 특히 아파트 주변환경과 기반시설 요소들의 공간적 특성을 고려하기 위해 각 아파트를 중심으로 그러한 요소들의 위치를 나타내는 이미지 데이터(image data)를 입력변수로 이용한다.

가설 설정

  • 이를 통해 해당 아파트 단지 주변 750m 반경의 환경/기반시설요소들이 고려될 수 있다. 본 연구에서는 아파트를 중심으로 750m를 아파트 거주자들이 도보로 접근할 수 있는 최대 거리로 간주하였고, 이 거리 내의 시설 및 환경들은 거주자가 상대적으로 쉽게 이용 가능하기 때문에 아파트 가격을 결정하는데 있어 중요한 정보들이 그 거리 내에 대부분 존재한다고 가정한다. 본 연구에서는 서울시내 전체를 100m 간격의 격자로 나누었기 때문에 반경 750m의 정보는 15 × 15 행렬로 표현되었다.
본문요약 정보가 도움이 되었나요?

참고문헌 (10)

  1. Abadi, M., Agarwal, A., and Barham, P., et al. (2015). TensorFlow: Large-scale machine learning on heterogeneous systems. Available from: https://tensorflow.org 

  2. Choi, C. S. (2010). A study on the existence of price bubbles in Korean housing market, Journal of the Korea Real Estate Society, 32, 177-199. 

  3. Hasan, M., Ullah, S., Khan, M. J., and Khurshid, K. (2019). Comparative analysis of SVM, ANN and CNN for classifying vegetation species using hyperspectral thermal infrared data, The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, XLII-2/W13. 

  4. Lim, S. S. (2014). A study on the forecasting models using housing price index, Journal of the Korean Data & Information Science Society, 25, 65-76. 

  5. Pebesma, E. J. and Bivand, R. S. (2005). Classes and methods for spatial data in R, R News, 5. Available from: https://cran.r-project.org/doc/Rnews/. 

  6. Wickham, H. (2017). tidyverse: Easily install and load the 'Tidyverse'. R package version 1.2.1. https://CRAN.R-project.org/packagetidyverse. 

  7. Yoo, C., Han, D., Im, J., and Bechtel, B. (2019). Comparison between convolutional neural networks and random forest for local climate zone classification in mega urban areas using Landsat images, ISPRS Journal of Photogrammetry and Remote Sensing, 157, 155-170. 

  8. Yoo, J.-S., Lim, K.-C., and Kie, S.-D. (2007). The empirical analysis of the bubble in housing price and land price, Journal of Industrial Economics and Business, 20, 2245-2264. 

  9. Yu, L., Jiao, C., Xin, H., Wang, Y., and Wang, K. (2018). Prediction on housing price based on deep learning, International Journal of Computer and Information Engineering, 12, 90-99. 

  10. Zhang, F., Du, B., and Zhang, L. (2017). A multi-task convolutional neural network for mega-city analysis using very high resolution satellite imagery and geospatial data. arXiv preprint arXiv:1702.07985. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로