공공빅데이터를 활용한 1인당 주거면적 추정에 관한 연구 - 서울의 단독 및 다세대 주택을 중심으로 - A Study on Estimating Housing Area per capita using Public Big Data - Focusing on Detached houses and Flats in Seoul -원문보기
본 연구는 건축물대장, 주민등록대장 등 공공빅데이터의 활용성을 탐구하기 위해, 비교적 간단한 구조를 가진 맨큐-와일(MW)모형을 활용해 1인당 주거면적 추정을 시도하였다. 그 결과 공공빅데이터를 활용하여 정기조사 방식에 버금가는 모형을 수립할 수 있고, 기존 정기조사 방식으로는 어려웠던 기초자치단체별 모형수립도 가능함을 확인할 수 있었다. 공공빅데이터로부터 일반단독주택과 다세대주택 샘플을 판별하는 과정을 설계하여, 10세 연령대별 1인당 주거면적을 추정하고, 인구주택총조사, 주거실태조사 등 기존 정기조사 자료를 활용한 결과와 비교해 일치시킨 후, 서울시 25개 자치구별 1인당 주거면적을 도출하였다. 공공빅데이터는 지식영역을 확장시켜주는 장점이 있지만 본래의 작성의도와 다른 목적으로 생성된 자료를 활용한다는 점에서 근본적 한계는 존재한다. 또 개인정보 접근이라는 어려운 과정은 분석을 보다 신중히 진행해야 하는 부담을 주고, 비식별화를 거친 자료를 분석함에 따라 연구설계가 어려워지는 문제도 있다. 향후 공공빅데이터가 기존 통계조사를 보완하거나 대체할 수도 있도록 가공하는 방법 등에 대한 꾸준한 연구가 필요할 것으로 보인다.
본 연구는 건축물대장, 주민등록대장 등 공공빅데이터의 활용성을 탐구하기 위해, 비교적 간단한 구조를 가진 맨큐-와일(MW)모형을 활용해 1인당 주거면적 추정을 시도하였다. 그 결과 공공빅데이터를 활용하여 정기조사 방식에 버금가는 모형을 수립할 수 있고, 기존 정기조사 방식으로는 어려웠던 기초자치단체별 모형수립도 가능함을 확인할 수 있었다. 공공빅데이터로부터 일반단독주택과 다세대주택 샘플을 판별하는 과정을 설계하여, 10세 연령대별 1인당 주거면적을 추정하고, 인구주택총조사, 주거실태조사 등 기존 정기조사 자료를 활용한 결과와 비교해 일치시킨 후, 서울시 25개 자치구별 1인당 주거면적을 도출하였다. 공공빅데이터는 지식영역을 확장시켜주는 장점이 있지만 본래의 작성의도와 다른 목적으로 생성된 자료를 활용한다는 점에서 근본적 한계는 존재한다. 또 개인정보 접근이라는 어려운 과정은 분석을 보다 신중히 진행해야 하는 부담을 주고, 비식별화를 거친 자료를 분석함에 따라 연구설계가 어려워지는 문제도 있다. 향후 공공빅데이터가 기존 통계조사를 보완하거나 대체할 수도 있도록 가공하는 방법 등에 대한 꾸준한 연구가 필요할 것으로 보인다.
The purpose of this study is to estimate the housing area per capita for verifying if the public Big Data, of the building ledger and resident registration ledger, can be used as well as the National Census and Housing Survey. The Mankiw and Weil (MW) model was constructed by extracting samples of g...
The purpose of this study is to estimate the housing area per capita for verifying if the public Big Data, of the building ledger and resident registration ledger, can be used as well as the National Census and Housing Survey. The Mankiw and Weil (MW) model was constructed by extracting samples of general detached houses and flat houses from the public big data, and compared with the result from traditional survey method. Then, the MW models of 25 municipalities in Seoul was established. As a result, it can be confirmed that it is possible to establish MW models comparable to regular surveys using public big data, and to establish a model for each basic localities which was difficult to use as a regular survey method. Public Big Data has the advantage of expanding the knowledge frontier, but there are some limitations because it uses data generated for other original purposes. Also, the difficult process of accessing personal information is a burden to carry out analysis. It is expected that continuing research should be needed on how public Big Data would be processed to complement or replace traditional statistical surveys.
The purpose of this study is to estimate the housing area per capita for verifying if the public Big Data, of the building ledger and resident registration ledger, can be used as well as the National Census and Housing Survey. The Mankiw and Weil (MW) model was constructed by extracting samples of general detached houses and flat houses from the public big data, and compared with the result from traditional survey method. Then, the MW models of 25 municipalities in Seoul was established. As a result, it can be confirmed that it is possible to establish MW models comparable to regular surveys using public big data, and to establish a model for each basic localities which was difficult to use as a regular survey method. Public Big Data has the advantage of expanding the knowledge frontier, but there are some limitations because it uses data generated for other original purposes. Also, the difficult process of accessing personal information is a burden to carry out analysis. It is expected that continuing research should be needed on how public Big Data would be processed to complement or replace traditional statistical surveys.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
제공 받은 공공빅데이터 자료가 동호가 분리되지 않고 도로명주소 단위로 제공되었기 때문에 대규모 아파트단지는 처음부터 제외하고 분석해야 했으며, 연립주택도 단지로 구성되는 경우가 많아 일괄 제외해야 했다. 그럼에도 한정된 정보라는 불리함을 역이용해 간결하고 안정적인 알고리즘을 제시하고자 노력하였다. 또, 비식별화 등은 연구자 개인의 한계로, 자료접근이 자유로운 기관의 경우 비교적 쉽게 해결할 수 있을 것이다.
본 연구는 맨큐-와일 모형을 활용하여 1인당 주거면적을 추정함에 있어 건축물대장과 주민등록대장을 연계한 공공빅데이터가 기존 정기조사(인구주택총조사, 주거실태조사)에 못지않은 수준에 이르는지, 또 공공빅데이터를 활용할 경우 누릴 수 있는 장점이 있을지 확인하고자 하였다. 이를 위해 건축물대장과 주민등록대장을 연계하여 전수자료를 구축하였으며, 일반단독주택과 다세대주택 샘플을 일괄판별 추출하는 조건을 설정하여 MW모형을 구축하였다.
본 연구의 목적은 공공빅데이터인 건축물대장과 주민등록대장을 활용하여 MW모형 구축 일괄처리화 과정을 수립하고, 그 결과가 기존의 정기조사(인구주택총조사, 주거실태조사) 자료를 사용한 모형과 차별화된 효용성이 있는지 확인하는 것이다. 물론 전문적인 통계 보정이 이뤄지는 정기 조사보다 높은 신뢰도를 기대하기는 어렵다.
본 연구의 차별성은, 첫째로 이제까지 인구주택총조사, 주거실태조사와 같은 주기적인 전문 조사에 의존해 수립되어온 MW모형에 공공빅데이터를 접목할 수 있는지 확인하는 것이다. 국토개발연구원(1997),김경환(1999)이 MW모형에 한국가구패널을 사용한 이후, 주거실태조사(이창무·박지영, 2009; 김진유·박지윤, 2017), 가계동향조사(신미림·남진, 2011), 한국노동패널(황종규, 2016; 정보선 외, 2018), 가구소비실태조사(정의철·조성진, 2005; 조성진·조주현,2013), 인구주택총조사(전성애·형남원, 2012) 등의 자료를 활용해 왔다.
MW모형 수립을 위해 주소지별 연령별 가구원 수,주거면적의 관계를 분석한다. 주민등록대장과 건축물대장의 주소 체계는 동일하기 때문에 이들을 상호 연동하면 MW모형 구축에 필요한 연령별 가구원 수와 전체 주택면적 자료를 획득할 수 있다는 것이 본 연구의 착안점이다. 행정안전부가 관리하는 주민등록대장은 세대(가구)별 주소, 세대원의 정보(이름, 주민등록번호, 성별, 연령) 세대원 간의 관계 등을 기록하고 있다.
제안 방법
MW모형 수립을 위해 주소지별 연령별 가구원 수,주거면적의 관계를 분석한다. 주민등록대장과 건축물대장의 주소 체계는 동일하기 때문에 이들을 상호 연동하면 MW모형 구축에 필요한 연령별 가구원 수와 전체 주택면적 자료를 획득할 수 있다는 것이 본 연구의 착안점이다.
공공빅데이터를 활용하여 서울시 기초지자체, 즉 25개 자치구에 대한 일반단독주택, 다세대주택 MW 모형을 수립하였다. 일반단독주택은 가구원 수 8인 이하인 샘플을 대상으로 하였다.
분석대상 단독주택은 일반단독주택으로 한정하되,가구원 8인 이하로 구성된 1주택이면서 1개동 연면적400m2 이하로 구성된 샘플로 분류하였다. 다만 가구원 수 기준의 차이를 확인하기 위해 별도로 4인 이하의 경우도 분석하였다. 이런 제한은 1주택 샘플 중에서 다가구주택을 최대한 배제하기 위해 필요하다.
권기동 외(2015)는 교통안전 체험교육 정보시스템에 축적된 차량운행기록자료를 분석하여 23개 위험운전유형을 판단할 수 있는 알고리즘을 설계하고 위험판단기준(임계값)을 추출하였다. 동시에 주행실험을 통해 사람이 실제 위험하다고 느끼는 기준을 측정하고 상호비교하였다.
두 번째 차별성은, 공공빅데이터 활용에 의한 확장성을 탐구하는 것이다. 본 연구는 샘플을 풍부하게 확보할 수 있는 건축물대장, 주민등록대장을 사용하면서, 기존 연구에서 잘 다뤄지지 않았던 기초자치단체별 MW모형과 주택유형별 MW모형을 제시할 수 있었다. 기존 연구는 주로 전국과 광역시·도 분석을 수행했다(이주형 외, 2009).
본 연구는 아파트, 시설 등을 제외하고 일반단독주택과 다세대주택 모형만을 구축하였다. 주택의 분류는 건축법을 참고하였다.
본 연구는 맨큐-와일 모형을 활용하여 1인당 주거면적을 추정함에 있어 건축물대장과 주민등록대장을 연계한 공공빅데이터가 기존 정기조사(인구주택총조사, 주거실태조사)에 못지않은 수준에 이르는지, 또 공공빅데이터를 활용할 경우 누릴 수 있는 장점이 있을지 확인하고자 하였다. 이를 위해 건축물대장과 주민등록대장을 연계하여 전수자료를 구축하였으며, 일반단독주택과 다세대주택 샘플을 일괄판별 추출하는 조건을 설정하여 MW모형을 구축하였다. 추가적으로 인구주택총조사와 주거실태조사 자료를 처리하여 MW모형을 구축함으로써 상호비교하였다.
이를 위해 건축물대장과 주민등록대장을 연계하여 전수자료를 구축하였으며, 일반단독주택과 다세대주택 샘플을 일괄판별 추출하는 조건을 설정하여 MW모형을 구축하였다. 추가적으로 인구주택총조사와 주거실태조사 자료를 처리하여 MW모형을 구축함으로써 상호비교하였다. 이를 통해 작성한 모형수립 방법을 서울시 25개 자치구별로 적용하여 자치구별 MW모형을 수립하였다.
대상 데이터
공공빅데이터 자료의 총 샘플 수는 412,972개로 이에 포함된 총 주택 수는 3,030,760호이고, 주민등록인구는 8,889,388명이다. 서울시 열린데이터광장에 따르면, 실제 집계된 2016년 서울시 총 주택 수는 3,644,101호, 총 가구는 378만 가구이고, 주민등록 인구는 1,002만 명이다.
구득 자료는 주소가 비식별 처리되어(김경열·권헌영, 2014; 이성엽, 2018), 도로명주소에서 본번과 부번이 제거되었으며, 연령별가구원 수도 10세 단위로만 제공되었다.
본 연구가 사용한 건축물대장·주민등록대장 합성자료(이하 ‘공공빅데이터 자료’)는 자치구명, 도로명주소(본부번 삭제), 건축물 연면적, 주택가격, 주택 수,10세 단위 연령별 주민등록인구 수로 구성된다( 참조).
본 연구는 공공빅데이터인 건축물대장, 주민등록 대장을 활용하며, 통계청 인구주택총조사, 국토교통부 주거실태조사 자료를 비교분석한다. 건축물대장과 주민등록대장은 수시로 업데이트하는 대규모 행정자료라는 점에서 공공빅데이터에 해당한다고 판단하였다.
분석대상 단독주택은 일반단독주택으로 한정하되,가구원 8인 이하로 구성된 1주택이면서 1개동 연면적400m2 이하로 구성된 샘플로 분류하였다. 다만 가구원 수 기준의 차이를 확인하기 위해 별도로 4인 이하의 경우도 분석하였다.
주민등록대장은 개인정보보호를 위해 원자료를 직접 열람할 수 없었기 때문에 국토교통부 공간빅데이터사업단으로부터 가공된 자료를 제공받았다. 분석대상지인 서울의 건축물대장(주택)을 기준으로 주민등록정보 연계를 신청하였다. 구득 자료는 주소가 비식별 처리되어(김경열·권헌영, 2014; 이성엽, 2018), 도로명주소에서 본번과 부번이 제거되었으며, 연령별가구원 수도 10세 단위로만 제공되었다.
건축물대장과 주민등록대장은 수시로 업데이트하는 대규모 행정자료라는 점에서 공공빅데이터에 해당한다고 판단하였다. 시점은 2016년 전후, 대상은 서울의 일반단독주택 및 다세대주택이다. 주택의 종류를 한정한 이유는 공공빅데이터 취득 자료의 샘플 단위가 도로명주소로 되어있어 수백~수천 가구가 하나의 도로명주소로 되어있는 공동주택은 분석이 어려웠기 때문이다.
주택의 종류를 한정한 이유는 공공빅데이터 취득 자료의 샘플 단위가 도로명주소로 되어있어 수백~수천 가구가 하나의 도로명주소로 되어있는 공동주택은 분석이 어려웠기 때문이다. 인구주택총조사는 5년 단위로 제공되므로, 2015년 자료를 사용하였다. 이 조사는 2015년 등록센서스 전환 이후 매년 발표되지만, 원자료를 제공하는 통계청 MDIS시스템은 현재 2015년 자료까지만 업로드하고 있다.
공공빅데이터를 활용하여 서울시 기초지자체, 즉 25개 자치구에 대한 일반단독주택, 다세대주택 MW 모형을 수립하였다. 일반단독주택은 가구원 수 8인 이하인 샘플을 대상으로 하였다. 결과적으로 총 50개 모형(25개구×2개 주택유형)을 수립하였으며, 각 모형의 계수 총 500개 중 유의수준 0.
주거실태조사는 2016년 자료를 사용하고자 하였으나샘플 수 부족으로 비교분석이 어려워 2017년 자료를 사용하였다( 참조).
주민등록대장은 개인정보보호를 위해 원자료를 직접 열람할 수 없었기 때문에 국토교통부 공간빅데이터사업단으로부터 가공된 자료를 제공받았다. 분석대상지인 서울의 건축물대장(주택)을 기준으로 주민등록정보 연계를 신청하였다.
이론/모형
추가적으로 인구주택총조사와 주거실태조사 자료를 처리하여 MW모형을 구축함으로써 상호비교하였다. 이를 통해 작성한 모형수립 방법을 서울시 25개 자치구별로 적용하여 자치구별 MW모형을 수립하였다. 그 결과, 본연구는 다음과 같은 결론을 얻을 수 있었다.
본 연구는 아파트, 시설 등을 제외하고 일반단독주택과 다세대주택 모형만을 구축하였다. 주택의 분류는 건축법을 참고하였다. 건축법상 단독주택은 1주택에 1가구가 거주하는 일반단독주택 외에, 다가구주택, 즉 1개동 연면적 660m2 이하이면서 19가구 이하가 거주하는 주택(주택사용부가 3개 층 이하일 것)을포함한다.
성능/효과
25개 일반단독주택 MW모형들은 낮은 연령대의 1인당 주거면적이 높은 연령대보다 크게 나타나는 경향을 보인다. 이는 정기조사에 기반을 둔 모형 3이나 모형 4가 연령이 증가할수록 1인당 주거면적이 증가하는 결과를 보인 것과는 차이가 있는 것으로, 기초통계로 확인하였듯이 저 연령대의 주민등록대장 등재가 적었던 것이 한계점으로 작용한 것으로 생각된다.
결과적으로 총 50개 모형(25개구×2개 주택유형)을 수립하였으며, 각 모형의 계수 총 500개 중 유의수준 0.001에서 유의하지 못한 계수는 18개뿐이었다(, 참조).
둘째, 공공빅데이터는 기초지자체 단위의 모형 수립시 정기조사보다 유리한 장점이 있다. 공공빅데이터는 충분한 샘플 확보가 가능하였으며, 유의수준 0.001에서도 500개 계수 중 482개 계수가 유의한 결과를 보였다. 반면 정기조사는 샘플 수가 부족하여 기초자치단체 단위의 모형 수립이 불가능했다.
다세대주택의 경우, 공공빅데이터 MW모형인 모형 5가 인구주택총조사의 MW모형인 모형 6, 주거실태조사의 MW모형인 모형 7과 유사한 결과를 보였으며, 설명력도 모두 모형 5가 0.89로 모형 6의 0.80, 모형 7의 0.85보다 높았다. 여전히 젊은 층의 1인당 주거면적에 있어 모형 5가 모형 6, 모형 7보다는 큰 경향이 있으나 일반단독주택 MW 모형들인 모형1-모형 4에서의 차이보다는 적었다(<표 7> 참조).
둘째, 공공빅데이터는 기초지자체 단위의 모형 수립시 정기조사보다 유리한 장점이 있다. 공공빅데이터는 충분한 샘플 확보가 가능하였으며, 유의수준 0.
본 연구의 자료는 1개 도로명 주소에 주택이 2개 이상 존재하는 다세대주택, 아파트 등 공동주택은 개별호 단위까지 매칭할 수 없는 한계가 있다. 따라서 다세대주택과 공동주택의 건축물대장은 해당 도로명주소 내 건축물들의 전체 연면적과 주택 수(건축물대장 기준으로 다가구주택은 1주택으로 등재)만을 획득할 수 있었다. 연령별 주민등록인구도 개별 호 단위로 구분되지 못했다.
54보다 높다. 비록 기초통계량은 가구원 4인 이하인 샘플이 가구원 8인 이하인 샘플보다 정기조사 샘플과 유사해 보이지만, 모형 결과는 모형 2가 더 우수함을 확인할 수 있었으며, 고령자에 한해서는 모형 1도 참고할 수 있음을 알 수 있다.
첫째, 건축물대장과 주민등록대장을 도로명주소로 연결하고, 주택유형을 구분하는 일괄조건을 정함으로써, 정기조사 자료에 기반한 MW모형과 유사한 수준의 MW을 수립할 수 있다. 비록 일반단독주택(분류기준: 가구원 8인 또는 4인 이하, 1주택, 연면적 400m2이하)은 기존 정기조사 방식과 일부 차이를 보였지만 다세대주택(가구원 8인 이하, 2~19주택, 연면적660m2 이하)은 비교적 유사한 결과를 얻을 수 있었다.
특히 당 공공빅데이터는 정기조사에 비해 실제보다 젊은층이 적게 반영되어 있을 수 있다는 우려와 같이, 공공빅데이터의 MW모형인 모형 1(가구원 수 4인 이하), 모형 2(가구원 수 8인 이하) 모두 정기조사의 MW모형인 모형 3, 모형 4에 비해 젊은 층의 1인당 주거면적(계수)이 크게 추정되었다().
후속연구
물론 전문적인 통계 보정이 이뤄지는 정기 조사보다 높은 신뢰도를 기대하기는 어렵다. 그러나 기존 방식의 결과물에 비교해 수용 가능한 수준의 모형이 도출될 수 있다면,또 기존 방식으로는 불가능했던 자료의 일괄처리 수시 활용과 세밀한 분석이 가능하다면, 공공빅데이터의 활용성을 확대할 수 있는 기반을 마련할 수 있을 것이다.
본 연구는 비교적 간단한 알고리즘만으로 MW모형을 수립할 수 있었으며, 이를 일괄처리함으로써 지속적인 모니터링과 연구 확장도 기대할 수 있다. 또 현재 서울시 25개 구에만 적용한 방법론을 전국 기초지자체로 확대하기도 간단할 것으로 기대된다. 공공빅데이터를 활용함으로써 연구영역을 확장할 수 있다는 것은 장점이지만, 별도의 목적으로 생성된 자료를 활용한다는 점에서 공공빅데이터의 근본적 한계는 존재한다.
추후 장기적인 추정을 통해 인구주택총조사 결과와 비교하여 보정해 나감으로써 결과를 개선할 필요가 있다. 또, 본 연구는 자료구득의 한계로 일반단독과 다세대주택 MW모형만 수립할 수 있었으므로, 아파트 MW모형은 후속 연구가 필요하다.
마지막으로, 공공빅데이터를 분석해 새롭게 도출한 정보들은, 기존의 방법의 결과물이 없어 비교가 곤란하므로 그 신뢰성을 직접 확인할 수 없는 것도 한계점이었다. 본 연구는 이와 같은 확장성을 제시하는 데 초점을 두어야 했지만, 추후에는 반대로 공공빅데이터가 제공하는 새로운 정보가 맞는지 정기조사 방식을 통해 확인하고 신뢰도를 높이는 작업도 이어져야 할 것으로 생각된다.
본 연구의 공공빅데이터와 이를 활용해 구축하는 MW모형을 실시간으로 업데이트하여 시계열 자료로 축적할 경우 활용성이 더 클 것으로 기대된다. 본 연구는 비교적 간단한 알고리즘만으로 MW모형을 수립할 수 있었으며, 이를 일괄처리함으로써 지속적인 모니터링과 연구 확장도 기대할 수 있다. 또 현재 서울시 25개 구에만 적용한 방법론을 전국 기초지자체로 확대하기도 간단할 것으로 기대된다.
공공빅데이터를 활용함으로써 연구영역을 확장할 수 있다는 것은 장점이지만, 별도의 목적으로 생성된 자료를 활용한다는 점에서 공공빅데이터의 근본적 한계는 존재한다. 본 연구는 이를 극복하기 위해 분석대상의 개념들을 재정의하고, 범위를 한정하는 등의 작업이 필요했다.
마지막으로, 공공빅데이터를 분석해 새롭게 도출한 정보들은, 기존의 방법의 결과물이 없어 비교가 곤란하므로 그 신뢰성을 직접 확인할 수 없는 것도 한계점이었다. 본 연구는 이와 같은 확장성을 제시하는 데 초점을 두어야 했지만, 추후에는 반대로 공공빅데이터가 제공하는 새로운 정보가 맞는지 정기조사 방식을 통해 확인하고 신뢰도를 높이는 작업도 이어져야 할 것으로 생각된다. 앞으로도 공공빅데이터가 기존의 통계조사를 보완하거나 대체할 수 있을 정도로 의미 있는 결과를 보여줄 수 있도록 가공하는 방법 등에 대한 꾸준한 연구가 필요할 것이다.
본 연구의 공공빅데이터와 이를 활용해 구축하는 MW모형을 실시간으로 업데이트하여 시계열 자료로 축적할 경우 활용성이 더 클 것으로 기대된다. 본 연구는 비교적 간단한 알고리즘만으로 MW모형을 수립할 수 있었으며, 이를 일괄처리함으로써 지속적인 모니터링과 연구 확장도 기대할 수 있다.
공공빅데이터의 다세대주택 자료는 가구 단위로 구성되어 있지 않고, 다세대주택 1개 동(정확히는 1개 주소) 단위로 구성되어 있음에도 유사한 결과가 나타나는 것은 고무적이라 할 수 있다. 본 연구의 방법론이 지속적인 1인당 주거면적 모니터링에 유용할 것으로 기대할 수 있다. 다만 강남4구의 결과가 미진한 것은 보완이 필요할 것으로 생각된다.
본 연구의 자료는 1개 도로명 주소에 주택이 2개 이상 존재하는 다세대주택, 아파트 등 공동주택은 개별호 단위까지 매칭할 수 없는 한계가 있다. 따라서 다세대주택과 공동주택의 건축물대장은 해당 도로명주소 내 건축물들의 전체 연면적과 주택 수(건축물대장 기준으로 다가구주택은 1주택으로 등재)만을 획득할 수 있었다.
본 연구는 이와 같은 확장성을 제시하는 데 초점을 두어야 했지만, 추후에는 반대로 공공빅데이터가 제공하는 새로운 정보가 맞는지 정기조사 방식을 통해 확인하고 신뢰도를 높이는 작업도 이어져야 할 것으로 생각된다. 앞으로도 공공빅데이터가 기존의 통계조사를 보완하거나 대체할 수 있을 정도로 의미 있는 결과를 보여줄 수 있도록 가공하는 방법 등에 대한 꾸준한 연구가 필요할 것이다.
25개 일반단독주택 MW모형들은 낮은 연령대의 1인당 주거면적이 높은 연령대보다 크게 나타나는 경향을 보인다. 이는 정기조사에 기반을 둔 모형 3이나 모형 4가 연령이 증가할수록 1인당 주거면적이 증가하는 결과를 보인 것과는 차이가 있는 것으로, 기초통계로 확인하였듯이 저 연령대의 주민등록대장 등재가 적었던 것이 한계점으로 작용한 것으로 생각된다. 추후 좀 더 실용적인 방향으로 개선하기 위해서는 연령별 계수의 보정방법 등을 고안해야할 것으로 생각된다.
종합하면, 상술한 분류 알고리즘을 활용하고 있을 때, 공공빅데이터는 기존 정기조사에 기반을 둔 MW 모형에 근사한 결과를 보여주어 활용성이 있을 것으로 판단된다. 특히 다세대주택 MW모형은 일반단독주택 MW모형보다 기존 정기조사에 의한 모형과 유사한 결과를 보였다.
다만 젊은 층의 주민등록이 실제보다 적게 반영되어 이들의 1인당 거주면적이 과다추정되는 문제가 있었다. 추후 장기적인 추정을 통해 인구주택총조사 결과와 비교하여 보정해 나감으로써 결과를 개선할 필요가 있다. 또, 본 연구는 자료구득의 한계로 일반단독과 다세대주택 MW모형만 수립할 수 있었으므로, 아파트 MW모형은 후속 연구가 필요하다.
이는 정기조사에 기반을 둔 모형 3이나 모형 4가 연령이 증가할수록 1인당 주거면적이 증가하는 결과를 보인 것과는 차이가 있는 것으로, 기초통계로 확인하였듯이 저 연령대의 주민등록대장 등재가 적었던 것이 한계점으로 작용한 것으로 생각된다. 추후 좀 더 실용적인 방향으로 개선하기 위해서는 연령별 계수의 보정방법 등을 고안해야할 것으로 생각된다. 한편, 연령별 계수를 시계열적으로 확보하여 추적하는 경우에는 상대적인 변화를 중심으로 분석하면서 문제를 완화할 수 있을 것으로 생각된다(이영은·안정근, 2003; 진미윤·김경선, 2010; 이경민 외, 2012).
질의응답
핵심어
질문
논문에서 추출한 답변
맨큐-와일(Mankiw-Weil) 모형이란 무엇인가?
맨큐-와일(Mankiw-Weil) 모형(또는 ‘MW 모형’)은 연령별 1인당 주거면적 등의 주택수요를 추정함으로써 미래 주택수요를 예측할 수 있는 모형이다(Mankiw & Weil, 1989). 가구별 구성원들의 연령과그들의 주거면적만 알고 있어도 가격변화에 의한 자본 이득, 조달금리, 주택 관련 세제 등 변동 요인을 배제하고 기본적인 모형 구축이 가능하다.
공공빅데이터의 범위는 어떠한가?
공공빅데이터는 거의 전 분야를 망라하기 때문에,행정 영역에 따라 구체적인 정의와 활용 방법이 다양하다(김기환, 2013; 성욱준, 2017). 통계청은 2015년 인구주택총조사부터 행정 빅데이터를 활용한 등록센서스를 도입하였고, 기본적인 전수 조사항목은 주민등록대장, 건축물대장 등 11개 기관의 21종 행정자료를 활용하게 되었다.
개인정보의 접근이 어려운 탓에 생긴 문제는 무엇인가?
또 개인정보의 접근이라는 어려운 과정은 분석을 보다 신중히 진행해야 하는 부담이 될 수 있고, 비식별화를 거친 자료를 분석함에 따라 연구설계가 어려워지는 문제도 있었다. 제공 받은 공공빅데이터 자료가 동호가 분리되지 않고 도로명주소 단위로 제공되었기 때문에 대규모 아파트단지는 처음부터 제외하고 분석해야 했으며, 연립주택도 단지로 구성되는 경우가 많아 일괄 제외해야 했다. 그럼에도 한정된 정보라는 불리함을 역이용해 간결하고 안정적인 알고리즘을 제시하고자 노력하였다.
Swan, C., 1995, Demography and the demand for housing A reinterpretation of the Mankiw-Weil demand variable, Regional Science and Urban Economics, 25(1), pp.41-58.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.