[국내논문] 머신러닝을 이용한 정부통계지표가 소매업 매출액에 미치는 예측 변인 탐색: 약국을 중심으로
Exploring the Predictive Variables of Government Statistical Indicators on Retail sales Using Machine Learning: Focusing on Pharmacy 원문보기

Journal of Internet Computing and Services = 인터넷정보학회논문지, v.23 no.3, 2022년, pp.125 - 135  

이광수 (Department of Computer Education, Sungkyunkwan University)

AI-Helper 아이콘AI-Helper

본 연구는 데이터, 네트워크, 인공지능을 기반으로 산업 생태계 조성을 위해 구축된 정부통계지표가 약국 매출액에 영향을 미치는지 머신러닝을 이용하여 변인을 탐색하고 약국 매출액 예측에 적합한 분석 기법을 제공하고자 한다. 이에, 본 연구는 28개 정부통계지표와 소매업종인 약국을 대상으로 2016년 1월부터 2021년 12월까지의 분석 데이터를 활용하여 머신러닝 기법인 랜덤 포레스트, XGBoost, LightGBM, CatBoost을 통해 예측 변인 및 성능을 탐색하였다. 분석결과 경기관련 지표인 경제심리지수, 경기동행지수순환변동치, 소비자심리지수는 약국 매출액에 영향을 미치는 중요한 변인으로 나타났고, 회귀성능은 지표 MAE, MSE, RMSE를 살펴본 결과 랜덤 포레스트가 XGBoost, LightGBM, CatBoost 보다 성능이 가장 우수하게 나타났다. 이에, 본 연구는 머신러닝 결과를 토대로 약국 매출액에 영향을 미치는 변인과 최적의 머신러닝 기법을 제시하였으며, 여러 시사점과 후속연구를 제안하였다.

Abstract AI-Helper 아이콘AI-Helper

This study aims to explore variables using machine learning and provide analysis techniques suitable for predicting pharmacy sales whether government statistical indicators built to create an industrial ecosystem based on data, network, and artificial intelligence affect pharmacy sales. Therefore, t...


  • 이에, 본 연구는 정부에서 발표 및 관리하고 있는 사회· 경제관련 지표들이 소매업에 영향을 미치는지를 탐색하고자 한다
  • 머신러닝 분석을 통해 사회·경제관련 정부통계지표 중 어떤 지표가 약국 매출액에 가장 영향을 미치는 변수인지 탐색하고, 각 머신러닝 기법 간의 성능을 비교함으로써 약국 매출액 예측에 적합한 머신러닝 기법을 제안하고자 한다.
  • 이에, 본 연구는 통계청 e-나라지표와 한국은행 경제통계 시스템에서 제공하는 통계 지표를 활용하여 정부통계지표가 소매업종인 약국 매출액에 영향을 미치는 예측 변인을 탐색하고자 머신러닝의 앙상블 기법인 랜덤 포레스트, XGBoost, LightGBM, CatBoost을 적용하여 분석 데이터 특성에 맞는 최적의 머신러닝 기법을 제시하고, 약국 매출액에 영향을 미치는 주요 예측변수가 무엇인지를 탐색 및 제안하고자 한다.
  • 본 연구는 4차 산업혁명으로 인해 인공지능, 사물인터넷, 빅데이터 등이 정보통신기술과 융합되고 데이터, 네트워크, 인공지능을 기반으로 산업 생태계 조성을 하고있는 상황에서 각 중앙행정기관에서 관리하고 있는 지표와 민간의 통계자료 등을 토대로 만들어진 정부통계지표가 소매업에 영향을 미치는 예측 변인을 탐색하고 모형 간의 예측 결과를 비교·분석하여 최적의 머신러닝 기법을 제시하는 것이다.
