공간 데이터 재구축을 통한 음식업종 매출액 영향 요인 분석 : 이종 공간 데이터의 집계단위 변환을 중심으로 Analyzing Influence Factors of Foodservice Sales by Rebuilding Spatial Data : Focusing on the Conversion of Aggregation Units of Heterogeneous Spatial Data원문보기
이 연구에서는 서울연구원 제공 집계구 자료를 이용하여 유동인구와 공간 특성, 공간자기상관이 음식업종의 매출액에 미치는 영향을 분석한다. 최근 공공 분야의 빅데이터가 증가하고 있지만 자료집계 단위가 달라 연구에 어려움을 야기하는 경우가 많다. 본 연구에서도 종속변수인 매출액은 SKT 집계구 단위로, 공간 특성은 통계청 집계구와 행정동 단위로, 그리고 유동인구는 Point 정보로 구축되어 있다. 분석을 위해 먼저 SKT 집계구 단위로 모든 독립변수의 집계단위를 변환하였다. 공간자기상관 효과를 검정할 수 있는 모형인 SEM을 이용하여 회귀분석을 수행한 결과 매출액에 대한 공간자기상관의 영향이 확인되었으며, 또한 유동인구와 주변 종사자수, 집계 구 면적이 매출액에 정의 영향을 주는 것으로 나타났다. 또한, 강남구에 비해 중구, 영등포구, 송파구 매출액이 더 적은 것으로 나타났다. 이 같은 결과는 유동인구가 많고 주변 종사자수가 많은 지역, 그리고 음식업종 점포들이 몰려있는 지역이 창업에 유리하다는 것을 시사한다. 이 연구는 이종 공간 데이터의 집계단위 변환의 유용성 과 함께 지도상의 면적 비례로 집계단위를 변환하는 것의 한계를 보여줌으로써 후속 연구에 시사점을 제공한다.
이 연구에서는 서울연구원 제공 집계구 자료를 이용하여 유동인구와 공간 특성, 공간자기상관이 음식업종의 매출액에 미치는 영향을 분석한다. 최근 공공 분야의 빅데이터가 증가하고 있지만 자료집계 단위가 달라 연구에 어려움을 야기하는 경우가 많다. 본 연구에서도 종속변수인 매출액은 SKT 집계구 단위로, 공간 특성은 통계청 집계구와 행정동 단위로, 그리고 유동인구는 Point 정보로 구축되어 있다. 분석을 위해 먼저 SKT 집계구 단위로 모든 독립변수의 집계단위를 변환하였다. 공간자기상관 효과를 검정할 수 있는 모형인 SEM을 이용하여 회귀분석을 수행한 결과 매출액에 대한 공간자기상관의 영향이 확인되었으며, 또한 유동인구와 주변 종사자수, 집계 구 면적이 매출액에 정의 영향을 주는 것으로 나타났다. 또한, 강남구에 비해 중구, 영등포구, 송파구 매출액이 더 적은 것으로 나타났다. 이 같은 결과는 유동인구가 많고 주변 종사자수가 많은 지역, 그리고 음식업종 점포들이 몰려있는 지역이 창업에 유리하다는 것을 시사한다. 이 연구는 이종 공간 데이터의 집계단위 변환의 유용성 과 함께 지도상의 면적 비례로 집계단위를 변환하는 것의 한계를 보여줌으로써 후속 연구에 시사점을 제공한다.
This study analyzes the effect of floating population, locational characteristics and spatial autocorrelation on foodservice sales using big data provided by the Seoul Institute. Although big data provided by public sector is growing recently, research difficulties are occurred due to the difference...
This study analyzes the effect of floating population, locational characteristics and spatial autocorrelation on foodservice sales using big data provided by the Seoul Institute. Although big data provided by public sector is growing recently, research difficulties are occurred due to the difference of aggregation units of data. In this study, the aggregation unit of a dependent variable, sales of foodservice is SKT unit but those of independent variables are various, which are provided as the aggregation unit of Korea National Statistical Office, administration dong unit and point. To overcome this problem, we convert all data to the SKT aggregation unit. The spatial error model, SEM is used for analysing spatial autocorrelation. Floating population, the number of nearby workers, and the area of aggregation unit effect positively on foodservice sales. In addition, the sales of Jung-gu, Yeongdeungpo-gu and Songpa-gu are less than that of Gangnam-gu. This study provides implications for further study by showing the usefulness and limitations of converting aggregation units of heterogeneous spatial data.
This study analyzes the effect of floating population, locational characteristics and spatial autocorrelation on foodservice sales using big data provided by the Seoul Institute. Although big data provided by public sector is growing recently, research difficulties are occurred due to the difference of aggregation units of data. In this study, the aggregation unit of a dependent variable, sales of foodservice is SKT unit but those of independent variables are various, which are provided as the aggregation unit of Korea National Statistical Office, administration dong unit and point. To overcome this problem, we convert all data to the SKT aggregation unit. The spatial error model, SEM is used for analysing spatial autocorrelation. Floating population, the number of nearby workers, and the area of aggregation unit effect positively on foodservice sales. In addition, the sales of Jung-gu, Yeongdeungpo-gu and Songpa-gu are less than that of Gangnam-gu. This study provides implications for further study by showing the usefulness and limitations of converting aggregation units of heterogeneous spatial data.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 유동인구와 공간 특성, 그리고 공간자기상관이 음식업종 매출액에 미치는 영향을 분석하고자 한다. 분석방법으로는 공간자기상관을 고려할 수 있는 공간회귀모형(spatial regression model)을 이용하고자 한다.
이 연구는 서울연구원이 제공한 음식업종의 집계구 매출액 자료를 이용하여 음식업종 매출액에 영향을 주는 요인들을 분석하였다. 분석모형으로 공간회귀모형의 일종인 SEM을이용하였으며, 자료 구축은 SKT 매출액 집계구를 기준으로 통계청 집계구와 행정동 단위로 구축된 공간특성 자료, 그리고 Point로 구축된 유동인구 자료를 변환하였다.
분석방법으로는 공간자기상관을 고려할 수 있는 공간회귀모형(spatial regression model)을 이용하고자 한다. 한편, 데이터베이스 구축과정에서 Point 정보로 구축된 유동인구 자료와 통계청 집계구 자료를 SKT 집계구 자료로 변환하게 되는데, 이를 통해 이종 데이터의 집계단위 변환을 통한 공간통계분석의 가능성과 함께 그 한계를 살펴보고자 한다.
가설 설정
6만m² 이하로나타나고 있는데, 집계구를 원으로 가정할 경우 반경 145m 이하에 해당한다. 이 같은 결과와 Korea Communications Commission(2015)에 근거하여 본 연구에서는 기지국의 측정 오차를 최소화하면서 집계구에 들어와 있을 가능성이 높은 반경 150m 이내 유동인구를 해당 집계구의 유동인구로 가정한다.
제안 방법
본 연구는 데이터 제공의 한계로 해당 업종의 점포 기준이 아닌 점포가 입지한 집계구 단위로 분석이 이루어졌다. 따라서 업종별로 점포 자체의 특성이 고려되지 못했다는 점과 개별 점포의 분석결과가 아닌 집계구 단위의 매출액 합계가 분석에 사용되었다는 점에서 한계가 있다.
대상 데이터
본 연구에서는 SKT 집계구 음식업종 매출액을 종속변수로설정하며, 분석에 이용하는 자료는 2013년 4월 월간 매출액이다. 매출액에 대한 기초통계분석 결과, 평균은 250,758천원인데 표준편차는 514,721천원으로 평균의 2배가 넘는 것으로 나타나 집계구의 매출액 차이가 큰 것으로 나타났다.
본 연구에서는 서울연구원에서 제공한 SKT Geovison의 음식업종 매출액 추정 자료를 분석에 이용한다. SKT Geovision에서는 매출액 정보를 점포 또는 필지 단위가 아닌집계구 단위로 제공하고 있기 때문에 본 연구에서도 불가피하게 집계구 단위로 자료를 구축할 수밖에 없는 한계를 가지게 되었다.
본 연구에서는 서울연구원이 제공한 서울시 6개구(종로구, 중구, 영등포구, 강남구, 서초구, 송파구)의 2013년 4월 평균 유동인구수를 분석 대상으로 한다. 이 자료는 SKT Geovision이 제공한 것으로 SKT 통신횟수(통화, 문자 등) 자료를 50m*50m 단위로 집계한 것으로 Table 5에서는 구별로 유동인구를 정리하였다.
지역상권의 발달정도에 따른 지역별 차이를 분석하기 위해 서울시 6개구(종로구, 중구, 강남구, 영등포구, 서초구, 송파구)를 강남구를 참조집단으로 하는 지역더미변수 형태로 투입한다. 교통접근성이 매출액에 미치는 영향을 분석하기 위해 정차 버스수(number of buses)와 지하철역까지의 거리(subway station distance)를 분석에 이용한다.
데이터처리
본 연구에서는 1차 가공된 데이터를 GIS Spatial Join 기능을 통해 해당 매출액 집계구에 포함된 유동인구를 분석하여 그 평균을 이용한다. 2차 가공 집계구 유동인구는 Fig.
LMlag과 LM-error의 통계치가 모두 1% 유의수준에서 유의하여 선택을 어렵게 하고 있지만 Robust LM Lag 통계치는 10%, Robust LM Error 통계치는 1% 유의수준에서 유의하여 SEM이 SLM보다 더 적합하다는 것을 보여주고 있다. 이에 본 연구에서는 SEM을 최종모형으로 하여 회귀분석을 수행한다. 분석 결과, SEM의 Loglikelihood가 OLS보다 더 크며 AIC(Akaike Info Criterion)과 SC(Schwarz Criterion)은더 작게 나타났다.
이론/모형
이 연구는 서울연구원이 제공한 음식업종의 집계구 매출액 자료를 이용하여 음식업종 매출액에 영향을 주는 요인들을 분석하였다. 분석모형으로 공간회귀모형의 일종인 SEM을이용하였으며, 자료 구축은 SKT 매출액 집계구를 기준으로 통계청 집계구와 행정동 단위로 구축된 공간특성 자료, 그리고 Point로 구축된 유동인구 자료를 변환하였다.
본 연구에서는 유동인구와 공간 특성, 그리고 공간자기상관이 음식업종 매출액에 미치는 영향을 분석하고자 한다. 분석방법으로는 공간자기상관을 고려할 수 있는 공간회귀모형(spatial regression model)을 이용하고자 한다. 한편, 데이터베이스 구축과정에서 Point 정보로 구축된 유동인구 자료와 통계청 집계구 자료를 SKT 집계구 자료로 변환하게 되는데, 이를 통해 이종 데이터의 집계단위 변환을 통한 공간통계분석의 가능성과 함께 그 한계를 살펴보고자 한다.
정차 버스수는 집계구에 속한 버스정류장에 정차하는 버스의 수를 산정하며, 정차 버스수가 많을수록 집계구는 버스 접근성이 높다는 것을 의미한다. 지하철역까지의 거리는 GIS near tool을 이용하여 각 집계구에서 최단 거리에 위치한 지하철역까지의 거리를 측정하였다. 지하철역까지의 거리 측정은 집계구와 지하철역 입구의 최근접 거리로 측정하며, 지하철역 입구가 집계구에 포함되어 있을 경우 집계구와 지하철역까지의 거리는 0으로 하였다.
성능/효과
이는 매출액이 클수록 군집하는 경향이 있다는 것을 의미한다. 독립변수 중 유의한 변수를 보면 유동인구가 많을수록, 주변 종사자수가 많을수록,집계구의 면적이 클수록 음식업종의 매출액이 커지는 것으로 나타났다. 탄력성을 비교한 결과, 유동인구의 탄력성이 주변 종사자수나 집계구 면적에 비해 상당히 높게 나타나 입지 결정 시 유동인구에 대한 가중치를 높게 할 필요가 있는 것으로 나타났다.
본 연구의 유동인구와 같이 주변지역의 영향을 받거나 위치정확도가 충분치 않은 데이터의 집계단위의 변환에는 주변 Point 정보를 활용한 자료 전처리가 필요하다. 둘째, 변수들 중 음식업종 비율변수의 경우 가설의 성립 가능성에도 불구하고 행정동 단위 자료를 변환한 변수가 유의하지 않게 나타났는데, 이는 통계청집계구 기준 정보를 SKT 집계구로 변환하는 과정에서 단순히 지도상 면적 비례에 따라 집계단위를 변환한 것이 영향을 미쳤을 가능성이 있다.
LISA는 특정 지역과 인접한 지역들이 갖는 값의 가중 평균값으로 산출되며 가중 평균값이 서로 유사하게 나타나면 정적인 자기상관으로, 차이가 크게 나타나면 부적인 자기상관으로 나타난다. 음식 업종의 LISA 분석 결과, 매출액이 높은 집계구 주변에 매출액이 높은 HH유형(high-high)이468개, 매출액이 낮은 집계구 주변으로 매출액이 낮은 LL유형(low-low)이 170개, 매출액이 낮은 집계구 주변으로 매출액이 높은 LH유형(low-high)이 63개, 매출액이 높은 집계구 주변으로 매출액이 낮은 HL유형(high-low)이 40개로 분석되었다. 매출액이 높은 지역들이 이웃하고 있는 HH유형과 매출액이 낮은 지역들이 이웃하고 있는 LL유형의 분포를 통해 음식업종의 매출액이 국지적인 차원에서 공간적으로 군집을 이루고 있음을 알 수 있다.
음식업종 집계구 매출액 분석 결과, 공간자기상관을 고려한 SEM이 OLS 회귀모형보다 적합도가 더 좋은 것으로 나타났으며 이를 통해 공간자기상관이 집계구 매출액에 정의 영향을 준다는 사실을 확인할 수 있다. 이는 매출액이 클수록 군집하는 경향이 있다는 것을 의미한다.
집계구가 속한 자치구를 의미하는 구(Gu) 변수는 더미변수이고 추정 계수들이 모두 음의 값을 보이고 있기 때문에 계량경제학에 따르면 계수값 β는 해당 구의 음식업종 매출액이 강남구와 비교하여 (eβ - 1) × 100% 더 낮은 것으로 해석된다. 음식업종 집계구 매출액은 강남구에 비해 중구가 55%, 영등포구가 37%, 송파구가 21% 더 낮은 것으로 나타났다. 하지만 종로구와 서초구는 통계적으로 유의한 차이를 보여주지 않았다.
유동인구와 종사자수는 그 특성이 다른데, 유동인구가 일회성 소비자라면 종사자수는 주기적 성격을 가지는 소비자로 해석할 수 있다. 음식업종의 매출액은 유동인구와 종사자수에 모두 정(+)의 영향을 받지만 유동인구의 탄력성이 종사자수보다 커 유동인구에 더욱 민감하다는 것을 알 수 있다.
종사자수는 전 사업체의총 종사자수를 집계구 단위로 재구성한 변수로 종사자수가 증가한다는 것은 해당 집계구에 일정시간 머물면서 해당 지역의 소비지출에 영향을 주는 인구가 증가한다는 것을 의미한다. 음식업종의 매출액은 지역의 종사자수가 1% 증가할 때, 0.55% 증가하는 것으로 나타났다. 유동인구와 종사자수는 그 특성이 다른데, 유동인구가 일회성 소비자라면 종사자수는 주기적 성격을 가지는 소비자로 해석할 수 있다.
분석 결과, SEM의 Loglikelihood가 OLS보다 더 크며 AIC(Akaike Info Criterion)과 SC(Schwarz Criterion)은더 작게 나타났다. 이 결과는 SEM이 음식업종의 집계구 매출액 분석에서는 OLS 회귀모형보다 적합도가 높다는 것을 의미한다.
분석 과정에서 확인된 이종 자료의 집계단위 변화에 대한시사점을 정리하면 다음과 같다. 첫째, 이종 자료의 집계단위변환에 Spatial Join 기능을 활용할 때 자료의 성격에 따라 자료에 대한 전처리가 필요한 것으로 나타났다. 본 연구의 유동인구와 같이 주변지역의 영향을 받거나 위치정확도가 충분치 않은 데이터의 집계단위의 변환에는 주변 Point 정보를 활용한 자료 전처리가 필요하다.
후속연구
최근 들어 빅데이터 활용의 중요성이 강조되면서 공공분야를 중심으로 이 같은 상황이 개선될 여지가 보이고 있는데, 이와 관련하여 서울시와 서울연구원에서는 소매업종 점포 매출액 자료를 집계구 단위로 집계하여 연구자들에게 제공하고 있다. 이를 이용할 경우 음식업종 매출액의 공간분포도 분석할 수 있으며, 기존의 공간 자료와 결합할 경우 매출액에 영향을 주는 요인도 분석할 수 있을 것으로 보인다.
따라서 업종별로 점포 자체의 특성이 고려되지 못했다는 점과 개별 점포의 분석결과가 아닌 집계구 단위의 매출액 합계가 분석에 사용되었다는 점에서 한계가 있다. 향후 연구과정에서 유동인구의 특성을 구분하여 성별, 연령별 정보에 대한 분석을 추가한다면 음식업종 창업자들에게 좀 더 유용하게 활용될 수 있을 것으로 기대된다.
질의응답
핵심어
질문
논문에서 추출한 답변
공간자기상관 검정 시, LM Lag와 LM Error 모두 유의할 경우 무엇을 수행하는가?
LM Lag 통계치만 유의하다면 SLM을, LM Error 통계치만 유의할 경우에는 SEM을 선택한다. 둘 다 유의할 경우에는 Robust LM Lag과Robust LM Error 검정을 통해 더 우수한 모형을 선택하게 된다(Lim and Lee, 2013).
공간자기 상관이란 무엇인가?
본 연구의 분석대상이 되는 음식업종 매출액은 집계구 자료이기 때문에 공간계량경제학(spatial econometrics)에서 말하는 공간자기상관을 내포할 가능성이 매우 높다. 공간자기 상관은 일반적으로 양의 자기상관을 의미하는 데, 이는 인접할수록 유사한 특성을 지니게 되고 상관관계가 높아지게 되는 것을 의미한다(Lim and Lee, 2013). 공간자기상관의 존재는 OLS(ordinary least square) 회귀모형의 추정치를 최소분산 추정치(minimum variance)로 확신할 수 없게 한다는 점에서 대안을 필요로 한다.
공간회귀모형으로 많이 사용되는 모형에는 어떤 것들이 있는가?
공간자기상관이 관측될 경우 일반적으로 공간회귀모형을 분석에 이용한다. 공간회귀모형으로는 공간종속변수(spatial dependent variable)를 OLS 모형에 포함하는 SLM(spatial lag model)과 공간오차(spatial error)를 삽입하는 SEM(spatial error model)이 많이 사용된다(Kim et al., 2010).
참고문헌 (14)
Anselin, L. (1995), Local indicators of spatial association-LISA, Geographical Analysis, Vol. 27, pp. 93-115.
Choi, M. and Shin, S. (2001), An empirical analysis of the effect of pedestrian volume on retail sales, Journal of Korea Planning Association, Vol. 36, No. 2, pp. 75-83. (in Korean with English abstract)
Jung, E., Sung, H., and Rho, J. (2015), Analysis on influence factors for apparel retail sales considering spatial autocorrelation, Journal of Korea Planning Association, Vol. 50, No. 5, pp. 215-231. (in Korean with English abstract)
Kim, C. and Jeong, S. (2013), A study on the factors affecting hotel & restaurant location in Seoul, Korean Management Consulting Review, Vol. 13, No. 4, pp. 297-314. (in Korean with English abstract)
Kim, D., Song, Y., and Lee, S. (2010), The spatial multiplier effect of office rent by the location of a business conglomerate, Seoul Studies, Vol. 11, No. 2, pp. 35-49. (in Korean with English abstract)
Kim, S., Kim, T., Im, H., and Choi, C. (2015), Pedestrian volume and built environmental factors on sales of convenience stores, cosmetic shops and coffee shops in Seoul, Journal of Korea Planning Association, Vol. 50, No. 3, pp. 299-318. (in Korean with English abstract)
Kim, T. and Ko, J. (2015), The impacts of potential consuming population on the store density - the case of food and beverage service activities in Seoul, Urban Design, Vol. 16, No. 3, pp. 101-116. (in Korean with English abstract)
Korea Communications Commission (2015), Providing 119 Wi-Fi location information platform service for emergencies, Press Releases of Korea Communications Commission. (in Korean)
Lee, I., Lee, C., and Kang, S. (2010), The study of site factors affecting the sales of convenience stores, Journal of the Korea Real Estate Analysts Association, Vol. 16, No. 4, pp. 53-77. (in Korean with English abstract)
Lee, K. and Jung, C. (2014), The effect of time period pedestrian volume on store location - focused on the suwon's retail stores and restaurants, Journal of the Architectural Institute of Korea Planning & Design, Vol. 30, No. 8, pp. 47-55. (in Korean with English abstract)
Lim, P. and Lee, S. (2013), Estimation of prices and rents of knowledge industrial centers in seoul metropolitan area considering spatial autocorrelation, Journal of the Korea Real Estate Analysts Association, Vol. 19, No. 2, pp. 5-20. (in Korean with English abstract)
Shin, W. and Moon, S. (2011), A study on the effects of locational characteristics on the sales of a coffee shop franchise, Journal of the Korea Real Estate Analysts Association, Vol. 17, No. 2, pp. 111-123. (in Korean with English abstract)
Shin, W., Jung, C., and Lee, S. (2001) A study on the changing patterns of the commercial power based on retail trade area analysis, Journal of the Korea Real Estate Analysts Association, Vol. 8, No. 1, pp. 1-11. (in Korean with English abstract)
Yu, K., Jang, S., and An, Y. (2016), An analysis on the impact of commercial street factors and floating population on commercial sales by region using the structural equation model, SH Urban Research & Insight, Vol. 6, No. 2, pp. 137-152. (in Korean with English abstract)
※ AI-Helper는 부적절한 답변을 할 수 있습니다.