[국내논문]능형회귀분석을 활용한 부동산 헤도닉 가격모형의 정확성 및 해석력 향상에 관한 연구 - 서울시 구로구 아파트를 대상으로 - Using Ridge Regression to Improve the Accuracy and Interpretation of the Hedonic Pricing Model : Focusing on apartments in Guro-gu, Seoul원문보기
헤도닉 가격 모형은 부동산 가격에 영향을 미치는 여러 요소를 모델링하는데 활용되는 대표적 방법이다. 부동산 가격은 전용면적, 방의 개수, 주차공간과 같은 내재적 속성 뿐 아니라 주변 선호/비선호시설의 존재여부에 따라 영향을 받는다. 주변 입지시설의 경우, 그 영향을 파악하기 위해서는 해당 부동산과의 인접거리를 설명변수로 사용하게 된다. 그러나 다수의 입지시설이 인접해 있는 경우에는 설명 변수 간 다중공선성이 발생하는 문제가 존재한다. 본 연구에서는 분산팽창지수 및 능형회귀분석을 이용해 다중공선성을 파악하고 유의한 설명변수를 선별하는데에 활용하였다. 이들 기법을 서울시 구로구 아파트들에 적용한 결과, 전철 차량 기지, 디지털 단지 및 위도에 해당하는 변수간의 다중공선성을 파악하였으며, 능형회귀분석을 통해 적합한 변수들을 체계적으로 선정할 수 있었다. 본 사례를 통해 상기 기법들이 더 정확하고 적정한 헤도닉 가격 모형을 구축하는데 중요한 보완적 기능을 해준다는 것을 알 수 있다.
헤도닉 가격 모형은 부동산 가격에 영향을 미치는 여러 요소를 모델링하는데 활용되는 대표적 방법이다. 부동산 가격은 전용면적, 방의 개수, 주차공간과 같은 내재적 속성 뿐 아니라 주변 선호/비선호시설의 존재여부에 따라 영향을 받는다. 주변 입지시설의 경우, 그 영향을 파악하기 위해서는 해당 부동산과의 인접거리를 설명변수로 사용하게 된다. 그러나 다수의 입지시설이 인접해 있는 경우에는 설명 변수 간 다중공선성이 발생하는 문제가 존재한다. 본 연구에서는 분산팽창지수 및 능형회귀분석을 이용해 다중공선성을 파악하고 유의한 설명변수를 선별하는데에 활용하였다. 이들 기법을 서울시 구로구 아파트들에 적용한 결과, 전철 차량 기지, 디지털 단지 및 위도에 해당하는 변수간의 다중공선성을 파악하였으며, 능형회귀분석을 통해 적합한 변수들을 체계적으로 선정할 수 있었다. 본 사례를 통해 상기 기법들이 더 정확하고 적정한 헤도닉 가격 모형을 구축하는데 중요한 보완적 기능을 해준다는 것을 알 수 있다.
The Hedonic Pricing model is the predominant approach used today to model the effect of relevant factors on real estate prices. These factors include intrinsic elements of a property such as floor areas, number of rooms, and parking spaces. Also, The model also accounts for the impact of amenities o...
The Hedonic Pricing model is the predominant approach used today to model the effect of relevant factors on real estate prices. These factors include intrinsic elements of a property such as floor areas, number of rooms, and parking spaces. Also, The model also accounts for the impact of amenities or undesirable facilities of a property's value. In the latter case, euclidean distances are typically used as the parameter to represent the proximity and its impact on prices. However, in situations where multiple facilities exist, multi-colinearity may exist between these parameters, which can result in multi-regression models with erroneous coefficients. This research uses Variance Inflation Factors(VIF) and Ridge Regression to identify these errors and thus create more accurate and stable models. The techniques were applied to apartments in Guro-gu of Seoul, whose prices are impacted by subway stations as well as a public prison, a railway terminal and a digital complex. The VIF identified colinearity between variables representing the terminal and the digital complex as well as the latitudinal coordinates. The ridge regression showed the need to remove two of these variables. The case study demonstrated that the application of these techniques were critical in developing accurate and robust Hedonic Pricing models.
The Hedonic Pricing model is the predominant approach used today to model the effect of relevant factors on real estate prices. These factors include intrinsic elements of a property such as floor areas, number of rooms, and parking spaces. Also, The model also accounts for the impact of amenities or undesirable facilities of a property's value. In the latter case, euclidean distances are typically used as the parameter to represent the proximity and its impact on prices. However, in situations where multiple facilities exist, multi-colinearity may exist between these parameters, which can result in multi-regression models with erroneous coefficients. This research uses Variance Inflation Factors(VIF) and Ridge Regression to identify these errors and thus create more accurate and stable models. The techniques were applied to apartments in Guro-gu of Seoul, whose prices are impacted by subway stations as well as a public prison, a railway terminal and a digital complex. The VIF identified colinearity between variables representing the terminal and the digital complex as well as the latitudinal coordinates. The ridge regression showed the need to remove two of these variables. The case study demonstrated that the application of these techniques were critical in developing accurate and robust Hedonic Pricing models.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 이런 점을 개선하기 위한 방안으로 헤도닉 가격 모형과 함께 분산팽창지수(Variance Inflation Factor) 및 능형회귀(Ridge Regression)분석을 실시하였다. 분산팽창 지수는 선형 회귀 분석에서 나온 결과에 대해 다중공선성 여부를 파악하는데 유용한 통계적 산정 수단이다.
본 연구에서는 실제 사례에 헤도닉 가격 모형과 더불어 상기 두 가지 기법을 적용함으로서 입지분석 수행 시 결과에 대한 정확성과 해석력을 높이는 수단으로 활용될 수 있음을 입증하는 것을 목적으로 한다.
첫째, 국내에서 헤도닉 가격 모형을 활용한 주요 연구들을 고찰하였고 이들 연구의 한계를 파악하였다.
본 연구에서는 이 경우, VIF 및 능형회귀분석을 통해 문제가 되는 변수들을 선별하고 이를 보완할 수 있는 방법을 소개하였으며, 실제 사례를 통해 그 방안의 유효성을 입증하였다. 또한 이와 같은 추가 분석을 통해 선호 및 비선호 시설의 분석을 동일 모델에서 수행할 수 있다는 것을 보여줬다.
제안 방법
둘째, 헤도닉 가격 모형의 한계와 이를 보완하기 위해 분산 팽창지수와 능동회귀 기법의 이론적 고찰을 수행하였다.
본 연구는 주변 입지가 아파트 가격에 미치는 영향을 파악하는 것이 목적이므로 부동산 정책 등에 대한 영향 등을 배제하기 위해 단기간의 실거래가 가격으로만 분석하였다.
첫째, 주변 환경 시설의 영향 분석 시 인접 거리(Euclidean distance)에 따른 가격의 변화로 영향 정도를 파악한다. 그러나 다수의 비선호 및 선호시설이 존재할 경우에는 유사한 시설끼리 높은 상관성을 보이게 되는 문제가 있다.
VIF는 의존변수를 제외한 독립변수 간의 R-squared 값을 이용하는 것이다. 즉, 개별 독립변수를 나머지 독립변수를 가지고 회귀분석을 실시하여 정확도 척도인 R-squared를 구하고 이를 가지고 상관성 정도를 파악하는 것이다. R-squared 값이 크면 이는 설명력이 큰 것이므로, 특정 독립변수가 나머지 독립변수에 의해 설명이 잘된다는 것이며, 이는 상관성이 큰 것으로 해석된다.
2장의 기존 문헌고찰과 데이터 취득 여부에 따라 Table 2에서와 같이 변수들을 구축하였다. 가격에 영향을 미치는 변수는 내외부적 변수로 구분하였다. 여기서 내부적 변수는 연면적, 층수, 건축년도 등 아파트 자체가 가지고 있는 성질의 변수이며, 외부적 변수는 주변 환경적 특성으로서 아파트의 위치 좌표, 인접 시설과의 거리 등을 의미한다.
여기서는 λ를 0-100까지 설정하여 점직적으로 증가시키면서 회귀계수(β)를 관찰하여 개별 변수 값의 변화 및 부호전환 여부를 파악하였다.
대상 데이터
셋째, 실제 사례에 적용하기 위해 데이터를 수집하였다. 사례는 서울시의 구로구의 아파트 가격을 대상으로 하였다.
셋째, 실제 사례에 적용하기 위해 데이터를 수집하였다. 사례는 서울시의 구로구의 아파트 가격을 대상으로 하였다.
상기 국내에서 진행된 대다수의 연구는 헤도닉 가격 모형을 기초로 하고 있으며, 특정 시설의 영향을 파악하기 위해서 해당 부동산과 입지시설의 인접거리를 변수로 활용하고 있다. 또한 대부분 선호 또는 비선호 시설 한 개를 대상으로 분석을 실시하였다.
내부적 특성에 대한 자료는 부동산 포털사이트1)에서 단지 정보(세대수, 건설사, 주차대수 등)에 대한 자료를 이용하였고, 외부적 변수는 GIS 전문회사인 ‘Biz-GIS’2)에서 제공하는 온라인 GIS 툴을 이용하여 좌표 및 인접 시설까지의 거리에 대한 데이터를 얻었다(Fig. 2).
분석 대상은 2014년 1분기 서울시 구로구 184개의 아파트에 대한 개별 가구 1,039건으로 하였다. 구로구에는 대표적인 비선호시설인 서울 남부 구치소가 있으며, 동시에 선호시설인 전자단지가 입주해 있고, 가까운 지하철 역까지의 거리 등 입지시설의 영향을 파악하는데 좋은 대상이 되었다(Fig.
2). 마지막으로 종속변수인 아파트 가격은 국토교통부3)에서 고시하고 있는 아파트 실거래가 정보를 활용하였다.
데이터처리
앞서 소개한 바와 같이 본 연구에서는 우선 헤도닉 가격 모형 구축을 위해 다중회귀분석을 실시한 후 VIF를 이용해 다중공선성 여부를 파악하고 능형회귀분석을 통해 최종 변수들을 선별하였다.
성능/효과
넷째, 본 데이터를 대상으로 일반적인 헤도닉 가격 모형을 구축한 뒤, 다중공선성의 존재 여부 및 해결을 위해 능분산팽창지수를 산정하고 능형회귀 기법의 실시를 통해 각 시설이 미치는 영향 정도 뿐 아니라 실제 영향 거리를 파악할 수 있었다.
(2015)은 도시기반시설(변전소)이 공동주택가격에 미치는 영향분석을 위해 다중회귀분석을 수행하고, 인공신경망을 통해 다중회귀모델을 검증하였다. 그 결과 지역적으로 변전소가 주변 아파트 가격에 미치지 않는 경우도 있으며, 변전소와 최단거리에 있음에도 가장 최근 입주한 아파트인 경우 변전소의 영향이 없는 것으로 나타났다.
주변 입지시설은 모두 유효하게 나왔으며, 그 중 남부구치소(dis_prison)가 외곽에 위치해 있어 영향의 크기가 가장 작은 것을 알 수 있다. 두 번째 회귀모델의 R-squared와 Adjusted R-squared는 각각 0.846, 0.843으로 높은 설명력을 보이고 있으며 초기 회귀모델보다 향상된 것을 알 수 있다.
본 연구에서는 이 경우, VIF 및 능형회귀분석을 통해 문제가 되는 변수들을 선별하고 이를 보완할 수 있는 방법을 소개하였으며, 실제 사례를 통해 그 방안의 유효성을 입증하였다. 또한 이와 같은 추가 분석을 통해 선호 및 비선호 시설의 분석을 동일 모델에서 수행할 수 있다는 것을 보여줬다.
그 결과 비선호 시설인 소각장으로부터 3km 이상 떨어지면 소각장의 영향을 받지 않으며, 3km 범위 내에서도 거리가 멀어질수록 영향력이 약해지는 것으로 나타났다.
후속연구
Yang and Choei(2003)는 한강시민공원이 주변 아파트에 대한 영향력을 헤도닉 가격모형을 통해 추정하여 한강시민공원과의 거리가 가까울수록 가격이 상승하지만 강변북로가 가까이 위치하면 교통 소음 등에 의해 평당 가격이 하락하는 현상이 파악되어 이에 대한 후속 연구가 필요하다는 것으로 결론을 맺었다.
앞서 2.3.2절에서 소개한 바와 같이, 다중공선성을 줄이기 위해 독립변수의 제거 여부를 판단하기 위해서는 능형 회귀 분석을 추가로 수행해야 한다. 여기서는 λ를 0-100까지 설정하여 점직적으로 증가시키면서 회귀계수(β)를 관찰하여 개별 변수 값의 변화 및 부호전환 여부를 파악하였다.
본 연구에서 제시한 접근 방법과 모델은 NIMBY, PIMFY와 같은 문제에 직면한 공공 및 민간사업주체들에게 입지시설의 영향 정도를 정량화해 줌으로서, 균형 있고 객관적인 의사결정을 하는데 도움이 될 것으로 판단된다.
질의응답
핵심어
질문
논문에서 추출한 답변
헤도닉 가격 모형이란?
헤도닉 가격 모형은 부동산 가격에 영향을 미치는 여러 요소를 모델링하는데 활용되는 대표적 방법이다. 부동산 가격은 전용면적, 방의 개수, 주차공간과 같은 내재적 속성 뿐 아니라 주변 선호/비선호시설의 존재여부에 따라 영향을 받는다.
지자체 및 지역 주민들아 아파트 가격 변동 및 영향 요인들에 예의주시하는 이유는?
국내 부동산 중 아파트는 국민 60%이상의 주거지역으로 자리 잡았으며, 국민 개인의 자산 중 평균 67.8%를 차지하고 있어(Statistics Korea 2014), 경제적 안정과 삶의 주거 수준에 지대한 영향을 미치고 있다.
부동산 가격은 무엇에 영향을 받는가?
헤도닉 가격 모형은 부동산 가격에 영향을 미치는 여러 요소를 모델링하는데 활용되는 대표적 방법이다. 부동산 가격은 전용면적, 방의 개수, 주차공간과 같은 내재적 속성 뿐 아니라 주변 선호/비선호시설의 존재여부에 따라 영향을 받는다. 주변 입지시설의 경우, 그 영향을 파악하기 위해서는 해당 부동산과의 인접거리를 설명변수로 사용하게 된다.
참고문헌 (16)
Alan Agresti and Barbara Finlay., (2008). Statistical Methods for the Social Sciences, 4th ed, Pearson.
Biz-GIS., X-Ray Map for Web (Dec. 15. 2014).
Hoerl. E. and Kennard. R., (1970). "Ridge Regression: Biased Estimation for Nonorthogonal Problems" Technometrics, 12(1), pp. 55-67.
Hwang S. D., Jeong M. O and Lee S. Y., (2015). "A Study on the Analysis of Apartment Price affected by Urban Infrastructure System." Korean journal of Construction Engineering and Management, KICEM, 16(1), pp. 127-136.
Kim J. E. and Kim Y. S. (2014). "An Analysis of Profitability Study of Overseas Construction Projects using Multiple-Regression" Korean journal of Construction Engineering and Management, KICEM, 15(2), pp. 95-103.
Kim, M. H., (2010). "A study on the Effect of Environment-related Facilities on the Surrounding Housing Price : Focusing on Gangnam-Gu in Seoul" MS thesis, dankook University.
Marius Theriault, Francois Des Rosiers., (2013). Modeling Urban Dynamics., John Wiley & Sons.
MOLIT, Apartment Real Transaction Price (Dec. 15. 2014).
Moon, J. H., (2012). "A study on the Effect of Improvement in Accessibility to Capital Area on the Sale Price of Apartment : Focusing the Chuncheon City in Gangwon province", MS thesis, konkuk University.
Naver corp., Naver Real Estate (Dec. 15. 2014).
Park J. K., Cho Y. K. and Lee S. Y., (2014). "PSM based Price Estimating for Local Mixed-Use Apartment Development." Korean journal of Construction Engineering and Management, KICEM, 15(4), pp. 86-94.
Rosen. S., (1974). "Hedonic Prices and Implicit Markets: Product Differentiation in Pure Competition" Journal of Political Economy, The University of Chicago Press, 82(1), pp. 34-55.
Rudolf J. Freund, William J. Wilson, Ping Sa (2006). "Regression Analysis", Academic Press, Mathematics.
Shin, J. T., (2008). "Urban Non-preference Facilities Effect on Residential Real Estate Price : Focusing on Incineration Plant in Capital Area." Real Estate Focus, 4, pp. 22-34.
Yang O. H., Kim M. S., Hwang U. S and Kim Y. S., (2011) "The Analysis of Importance Ratio Factors of Sales Price for Apartment Building Construction Projects." Korean journal of Construction Engineering and Management, KICEM, 12(5), pp. 127-136.
Yang, S. D. and Choi. N. Y., (2003). "The Hedonic Impacts Accrued from the Han-ver Civic Park on the Surrounding Residential Areas : The Case of Tuk-Som River Park" journal of Korea Planners Association., 38(3), pp. 275-285.
이 논문을 인용한 문헌
저자의 다른 논문 :
활용도 분석정보
상세보기
다운로드
내보내기
활용도 Top5 논문
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다. 더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.