$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] Gradient Boosting 모형을 이용한 중소기업 R&D 지원금 결정요인 분석
Who Gets Government SME R&D Subsidy? Application of Gradient Boosting Model 원문보기

한국전자거래학회지 = The Journal of Society for e-Business Studies, v.25 no.4, 2020년, pp.77 - 109  

강성원 (Korea Environmental Institute) ,  강희찬 (Department of Economics, Incheon National University)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 그래디언트 부스팅 모형을 활용하여 정부의 중소기업 연구개발 지원 결정에 영향을 미치는 요인들을 파악하였다. 기존 연구가 사후적으로 정부의 연구개발 지원이 수혜 기업에 미친 영향을 분석하는 것에 중점을 두었다면, 본 논문은 정부의 연구개발 지원 결정 방식을 파악하고, 그 방식이 기업에게 제공하는 유인을 분석하고자 하였다. 이를 위하여 본 논문은 지원금 결정에 영향을 미치는 다양한 잠재적 요인들을 선택하고, 기계학습 접근법을 활용하여 추정오차 축소효과가 큰 요인들을 선별하였다. 구체적으로 본 논문은 한국과학기술평가원이 구축한 국가연구개발조사분석 자료와 한국신용평가자료를 연결한 자료에 그래디언트 부스팅(Gradient Boosting) 모형을 적용하여 지원금 추정모형을 구축하였다. 본 논문에서 구축한 그래디언트 부스팅 모형은 선형회귀분석 응용모형에 비해 평균제곱근오차를 7.20% 축소할 수 있었다. 각 변수의 순열 중요도(permutation importance)를 분석한 결과 연구성과지표 및 연구개발비가 추정오차 축소에 기여가 큰 것으로 파악되었다. 그리고 각 변수의 부분의존도(Partial Dependence Plot: PDP) 및 SHAP 값(SHAP value: SHapley Additive exPlanation value)을 분석한 결과 연구성과지표가 좋고 연구개발비 지출이 큰 기업이 많은 연구개발 지원금을 받는 반면, 영업이익이 크고 자기자본회전율이 높은 기업은 적은 지원금을 받는 경향이 발견되었다. 본 연구의 결과는 현재 중소기업 연구개발 지원금 배분 방식이 연구성과지표 제고 및 연구개발투자 증가 유인은 제공하나, 기업 경영성과 제고 유인은 취약함을 시사한다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we build a gradient Boosting model to predict government SME R&D subsidy, select features of high importance, and measure the impact of each features to the predicted subsidy using PDP and SHAP value. Unlike previous empirical researches, we focus on the effect of the R&D subsidy dist...

Keyword

표/그림 (15)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문은 기계학습 방법론인 그래디언트 부스팅(Gradient Boosting) 모형을 이용하여 어떤 요인이 정부의 중소기업 연구개발 지원 배분에 영향을 미치는지 파악하는 논문이다. 기존 관련 연구들을 보면 대부분 정부가 지원한 재원이 어떤 성과를 유발했는지, 즉 성과 중심으로 분석하고 있다.
  • 기존 관련 연구들을 보면 대부분 정부가 지원한 재원이 어떤 성과를 유발했는지, 즉 성과 중심으로 분석하고 있다. 그러나 본 논문에서는 정부의 연구개발 지원이 근본적으로 어떤 요인들에 의해 결정되는지를 파악하고자 한다. 기업들은 정부의 연구개발 지원을 더 효과적으로 받고자 적합한 자격요건을 갖추는 데 노력한다.
  • 최근 대두되고 있는 기계학습(Machine Learning) 방법론은 사전적으로 포괄적 요인을 분석에 포함할 수 있어서, 기존 실증분석 방식의 약점을 극복할 수 있다. 본 논문은 이러한 기계학습의 장점을 이용하여, 중소기업 연구개발 지원금 배분 요인을 파악하고자 한다.
  • 본 논문은 이러한 문제를 기계학습(MachineLearning) 방법론 중 지도학습(supervised learning)을 사용하여 해소할 수 있음에 주목한다. 지도학습에서는 추정함수를 선험적으로 설계하지 않고, 주어진 자료를 이용하여 학습하는 방식을 채택할 수 있다.
  • 그러나 최근 개별 변수가 종속변수에 미치는 영향을 평가하는 도구를 개발하여 기계학습 모형의 설명 가능성을 제고하려는 연구가 활발하게 진행되고 있다[23, 24]. 본 논문은 이러한 도구 중 개별 변수의 독립적인 영향을 평가하는 부분의존도와 여타 변수와의 상호작용을 통해서 미치는 영향을 포괄하여 개별 변수의 영향을 평가하는 SHAP 값을 사용하여 변수의 영향을 평가하고, 그 결과로부터 정책적 시사점을 도출하고자 한다.
  • 요약하자면, 본 논문은 다양한 요인을 포괄할 수 있는 기계학습의 장점을 이용하여 정부의 중소기업 연구개발 지원금 규모를 결정하는 요인을 실증적으로 파악하고자 한다. 구체적으로 본 논문은 다양한 지도학습 방법론을 적용하여 정부의 중소기업 연구개발 지원금을 추정하는 추정모형을 구축하고, 그 중 평균제곱근오차 (RMSE)로 평가한 추정오차를 가장 축소할 수 있는 모형을 선정하여 정부의 연구개발 지원금을 추정한다.
  • 마지막으로 이렇게 선정한 중요 변수들이 지원금의 증감에 미친 영향의 크기와 방향성을 부분의존도 및 SHAP 값을 이용하여 분석한다. 특히 독립변수에 포함된 기업경영 성과 지표가 지원금 증감에 미친 영향을 파악하여, 정부 중소기업 연구개발 지원금 지원 방식이 기업 경영성과 제고 유인을 제공하고 있는지 여부를 진단한다.
  • 이는 기업의 성과가 좋은 소수의 기업과 성과가 좋지 않은 다수의 기업이 공존하는 중소기업의 현황을 반영하는 현상으로 간주하였고, 따라서 왜도의 완화는 시도하지 않았다. 또한 본 논문에서는 주성분을 선험적으로 추출하지 않고, 모형 선택 과정에 주성분 추출을 포괄하는 모형을 포함하여 추정 오차 축소에 도움이 되는 경우에 주성분 분석을 사용하고자 하였다. 마지막으로, 본 논문에서는 선형 종속인 독립변수는 선험적으로 추출하지 않고 릿지 회귀분석 및 라소 회귀분석을 이용하여 예측오차를 최소화하는 독립변수를 선택하게 하였다.
  • 결측치 보간(imputation)은 결측치가 발생한 기업 표본의 연간 추세를 우선 반영하고자 하였고, 기업 표본에서 연간 추세를 사용할 수 없는 경우에는 해당 변수의 연간 표본 중위값의 연간 추세를 반영하고자 하였다. 구체적으로 결측치가 있는 변수의 기업별 표본이 2개 이상의 관측치가 있는 경우에는 각 기업 표본의 가용한 관측 치를 종속변수로 하고 상수와 연도변수를 독립 변수로 하는 선형회귀분석을 수행하고, 그 회귀 분석의 예측치로 결측치를 보간하였다.
  • [Table 4] 및 [Table 5]의 순열 중요도 분석결과는 개별 변수가 연구개발 지원금 추정의 정확도에 미치는 영향의 크기에 대한 정보는 제공하지만, 개별 변수가 지원금 규모의 증감에 주는 영향에 대한 정보는 제공하지 못한다. 이를 보완하기 위해서 본 논문에서는 개별 변수의 부분의존도와 SHAP 값을 분석하였다. 부분의존도는 여타 독립변수의 영향 이외에 개별 독립변수가 종속변수 추정치에 미치는 추가적인 영향(Marginal Effect)을 나타내는 지표이고, SHAP 값은 여타 독립변수와의 상호작용을 모두 고려하여 개별 독립변수가 종속변수의 추정치에 미치는 영향을 나타내는 지표이다.
  • 본 논문은 정부 중소기업 연구개발 지원금 배분을 결정하는 요인을 기계학습을 적용하여 파악하고자 하였다. 이를 위하여 본 논문은 한국과학기술평가원에서 구축한 중소기업 연구 개발 지원금 자료에 그래디언트 부스팅 모형을 적용하여 중소기업 연구개발 지원금 추정모형을 개발하였고, 순열중요도 분석을 시행하여 추정오차 축소 효과가 큰 변수를 선정하였으며, 선정된 변수의 부분의존도 및 SHAP 값을 분석 하여 지원금 추정치를 증가시키는 독립변수를 파악하였다.
  • 본 논문은 정책연구의 관점에서 방법론의 제약으로 연구가 상대적으로 부족하였던 중소기업 연구개발 지원금 배분 방식 연구에 기계학습 방법론을 적용하여 방법론의 제약을 완화하였다. 또한, 본 연구는 기계학습 연구의 관점에서도 최근의 연구성과인 부분의존도와 SHAP 값을 사용하여 기계학습 연구 결과의 정책적인 활용도를 제고하였다. 본 연구에서 개발한 중소기업 연구개발 지원금 추정모형은 중소 기업 지원을 담당하는 정책부서에서는 중소기업 지원금 배분 현황을 파악하는 도구로 활용할 수 있으며, 중소기업의 연구개발 지원금 지원 시에 지원금을 예측하고 연구개발 지원금 수령액수를 높이기 위해 필요한 요인을 파악하는 도구로 활용할 수 있을 것으로 기대한다.

가설 설정

  • 이와 같이 다양한 조건부평균 함수로부터 적합한 모형을 추출한 이유는 종속변수와 독립 변수 간의 관계의 비선형성에 따라서 적합한 모형이 다르기 때문이다. 선형회귀분석 응용모형은 종속변수가 독립변수의 선형결합으로 근사될 수 있음을 가정한다. 주성분분석 응용모형에서는 독립변수를 조합하여 추출한 새로운 독립변수(주성분)의 선형결합을 사용하면 종속변수에 근사한 추정치를 도출할 수 있음을 가정한다.
  • 선형회귀분석 응용모형은 종속변수가 독립변수의 선형결합으로 근사될 수 있음을 가정한다. 주성분분석 응용모형에서는 독립변수를 조합하여 추출한 새로운 독립변수(주성분)의 선형결합을 사용하면 종속변수에 근사한 추정치를 도출할 수 있음을 가정한다. 반면 의사결정나무 응용모형 및 신경망 모형은 독립변수와 종속변수간의 관계에 대한 선험적인 가정을 사용하지 않고, 비선형성이 존재할 경우에 이를 반영하여 종속변수를 추정할 수 있도록 복잡한 구조를 도입한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (32)

  1. Bergstra, J. S., Bardenet, R., Bengio, Y., and Kegl, B., Algorithms for hyper-parameter optimization, NIPS'11: Proceedings of the 24th International Conference on Neural Information Processing Systems, pp. 2546-2554, 2011. 

  2. Bloom, N., Reenen, J. V., and Williams, H., "A Toolkit of Policies to Promote Innovation," Journal of Economic Perspectives, Vol. 33, No 3, pp. 163-84, 2019. 

  3. Chang, W. H., "Is Korea's Public Funding for SMEs Achieving Its Intended Goals?," KDI Focus, No. 63, 2016. 2. 3. 

  4. Choi, J. M., "A Study of the Effects of Government R&D Support on Product Innovation in Small and Medium-sized Enterprises(SMEs): Focusing on the Moderating Effect of Firm Characteristics," Korean Journal of Public Administration, Vol. 56, No. 2, pp. 213-248, 2018. 

  5. Cin, B., Kim, Y., and Vonortas, N. S., "The Impact of Government R&D Subsidy on Firm Performance: Evidence from Korean SMEs," Small Business Economics, Vol. 48, No. 2, pp. 345-360, 2017. 

  6. Fisher, A., Rudin, C., and Dominici, F., "All Models are Wrong, but Many are Useful: Learning a Variable's Importance by Studying an Entire Class of Prediction Models Simultaneously," Journal of Machine Learning Research, Vol. 20, No. 177, pp. 1-81, 2019. 

  7. Friedman, J. H., "Greedy function approximation: a gradient boosting machine," Annals of statistics, Vol. 29, No. 5, pp. 1189-1232, 2001. 

  8. Gerath, J., Witten, D., Hastie, T., and Tibshirani, R., An Introduction to Statistical Learning, New York: Springer, 2013. 

  9. Hall, B. H. and Lerner, J., Chapter 14-The financing of R&D and innovation, In Handbook of the Economics of Innovation, Vol. 1, pp. 609-639, 2010. 

  10. Hong, J. P. and Kim, J. H., "Impacts of Financial Policies for SMEs on Firms Performance: Role of Supplier Network between Large Firms and SMEs," Journal of Korean Economic Analysis, Vol. 21, No. 3, pp. 185-240, 2015. 

  11. Ivezic, Z., Connolly, A. J., VanderPlas, J. T., and Gray, A., Statistics, Data Mining, and Machine Learning in Astronomy: A Practical Python Guide for the Analysis of Survey Data. Princeton University Press, 2019. 

  12. Ji, M. W., "Did Legal Criteria for Receiving Governmental Support Cause a Negative Effect in Employment Growth of SMEs?:Evidence from the Korean Manufacturing Industry," The Journal of Korean Public Policy, Vol. 17, No. 3, pp. 3-31, 2015. 

  13. Jun, B. W. and Choi, E., "Review on Tax Expenditures for Small-and-Mid Sized Firms," Asia Pacific Journal of Small Business, Vol. 37, No. 3, pp. 1-24, 2015. 

  14. Kang et al., "An empirical Study on the Impact of Government R&D Investment on SMEs in Korea," Korea Institute of S&T Evaluation and Planning, Report no. 2016-027, 2016. 

  15. Kang et al., "Big Data Analysis: Application to Environmental Research and Service II," Korea Environment Institute, 2018. 

  16. Kang et al., "Big Data Analysis: Application to Environmental Research and Service," Korea Environment Institute, 2017. 

  17. Kim, K. H. and Yang, J. Y., "Government R&D Support and Apply Strategy for SMEs," Regional Industry Review, Vol. 41, No. 3, pp. 299-324, 2018. 

  18. Kim, K. W., Kim, J., Shin, J. K., and Hong, S. B., How to Improve the efficiency of Government R&D Investment, Korea Development Institute, 2011. 

  19. Ko, H. S., Chung, Y. H., Seo, H. K., and Song, L. K., "A Study on the Effectiveness of the SMEs Consulting Support Project:Focused on Hidden Champion Business Supporting in Daejeon," Asia Pacific Journal of Small Business, Vol. 38, No. 1, pp. 169-188, 2016. 

  20. Kuhn, M. and Johnson, K., Applied predictive modeling(Vol. 26), New York: Springer, 2013. 

  21. Lee, D. H. and Kim, K. H., "Deep Learning Based Prediction Method of Long-term Photovoltaic Power Generation Using Meteorological and Seasonal Information," The Journal of Society for e-Business Studies, Vol. 24, No. 1, pp. 1-16, 2019. 

  22. Lerner, J., Boulevard of broken dreams:why public efforts to boost entrepreneurship and venture capital have failed and what to do about it. Princeton University Press, 2009. 

  23. Li, T., Jing, B., Ying, N., and Yu, X., "Adaptive Scaling," arXiv preprint arXiv: 1709. 00566, 2017. 

  24. Lundberg, S. M. and Lee, S. I., "A unified approach to interpreting model predictions," In Advances in neural informatio processing systems (pp. 4765-4774), 2017. 

  25. Lundberg, S. M., Erion, G. G., and Lee, S. I., "Consistent individualized feature attribution for tree ensembles," arXiv preprint arXiv:1802.03888, 2018. 

  26. Molnar, Christoph. Interpretable Machine Learning, Lulu.com, 2020. 

  27. National Assembly Budget Office, Analysis on Government R&D Program : Overview, Seoul, 2019. 

  28. OECD, The SME Financing Gap (Vol. I):Theory and Evidence, OECD Publishing, Paris, 2006. 

  29. Pyo, H. H. and Choi, H. H., "The Effects of Export Promotion on Korean Manufacturing SMEs' Performance," Kukje Kyungje Yongu, Vol. 24, No. 3, pp. 29-56, 2018. 

  30. Strobl, C., Boulesteix, A., Zeileis, A., and Hothorn, T., "Bias in random forest variable importance measures: Illustrations, sources and a solution," BMC Bioinformatics, Vol. 25, No. 8, pp. 1-21, 2007. 

  31. Zhao, Q. and Hastie, T., "Causal interpretations of black-box models," Journal of Business & Economic Statistics, DOI:10.10870/07350015, 2019. 

  32. Zuniga-Vincente, J. A., Alonso-Borrego, C., Forcadell, F. J., and Galan, J. I., "Assessing the effect of public subsidies on firm R&D investment: a survey," Journal of Economic Surveys, Vol. 28, No. 1, pp. 36-67, 2014 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로