기초연구지원사업의 재정소요 전망 도출을 위한 시계열 모형 수립 연구 A Study on Establishment of Time Series Model for Deriving Financial Outlook of Basic Research Support Programs원문보기
기초연구 분야는 정부의 적극적인 지원으로 양적 확대가 큰 폭으로 이루어지는 반면, 체계적인 투자계획이나 데이터에 기반한 재정소요를 제시하는 연구 및 정책자료가 전무하여 관련 연구가 요구되는 시점이다. 이에 본 연구는 시계열 예측모형을 활용하여 기초연구지원사업의 향후 재정소요를 전망하였다. 기초연구분야의 특성을 포함한 다양한 요인들을 종합적으로 고려하기 위하여 시간에 따른 단일 종속변수의 값을 예측하는 ARIMA 모형이 아닌, 다변수의 영향을 반영할 수 있는 ARIMAX 모형을 선택하였다. 모형 적합성 판단을 위해 ARIMAX 모형과 ARIMA 모형의 예측값을 비교한 결과 ARIMAX 모형에서 예측오차율이 개선됨을 확인하였다. ARIMAX 모형에 기반하여 2017년에서 2021년까지 5년 간의 기초연구지원사업 재정소요를 전망하였다. 본 연구는 기초연구지원사업의 재정소요를 통계적 접근방법인 시계열모형을 적용해 전망한 시범적 연구를 수행하였다는 점과, 단변량이 아닌 다변량을 고려하여 예측력을 개선했다는 점에서 의의를 지닌다. 또한 현 정부 국정과제인 '기초연구 예산 2배 확대' 등 기초연구 투자의 중요성이 꾸준히 강조되는 정책기조를 고려할 때 향후 기초연구 투자전략 수립 시 참고자료로 활용 될 수 있다.
기초연구 분야는 정부의 적극적인 지원으로 양적 확대가 큰 폭으로 이루어지는 반면, 체계적인 투자계획이나 데이터에 기반한 재정소요를 제시하는 연구 및 정책자료가 전무하여 관련 연구가 요구되는 시점이다. 이에 본 연구는 시계열 예측모형을 활용하여 기초연구지원사업의 향후 재정소요를 전망하였다. 기초연구분야의 특성을 포함한 다양한 요인들을 종합적으로 고려하기 위하여 시간에 따른 단일 종속변수의 값을 예측하는 ARIMA 모형이 아닌, 다변수의 영향을 반영할 수 있는 ARIMAX 모형을 선택하였다. 모형 적합성 판단을 위해 ARIMAX 모형과 ARIMA 모형의 예측값을 비교한 결과 ARIMAX 모형에서 예측오차율이 개선됨을 확인하였다. ARIMAX 모형에 기반하여 2017년에서 2021년까지 5년 간의 기초연구지원사업 재정소요를 전망하였다. 본 연구는 기초연구지원사업의 재정소요를 통계적 접근방법인 시계열모형을 적용해 전망한 시범적 연구를 수행하였다는 점과, 단변량이 아닌 다변량을 고려하여 예측력을 개선했다는 점에서 의의를 지닌다. 또한 현 정부 국정과제인 '기초연구 예산 2배 확대' 등 기초연구 투자의 중요성이 꾸준히 강조되는 정책기조를 고려할 때 향후 기초연구 투자전략 수립 시 참고자료로 활용 될 수 있다.
In the basic research field, quantitative expansion is carried out with active support from the government, but there is no research and policy data suggesting systematic investment plans or data-based financial requirements yet. Therefore, this study predicted future financial requirements of basic...
In the basic research field, quantitative expansion is carried out with active support from the government, but there is no research and policy data suggesting systematic investment plans or data-based financial requirements yet. Therefore, this study predicted future financial requirements of basic research support programs by using time series prediction model. In order to consider various factors including the characteristics of the basic research field, we selected the ARIMAX model which can reflect the effect of multi valuable factors rather than the ARIMA model which predicts the value of single factor over time. We compared the predictions of ARIMAX and ARIMA models for model suitability and found that the ARIMAX model improves the prediction error rate. Based on the ARIMAX model, we predicted the fiscal spending of basic research support programs for five years from 2017 to 2021. This study has significance in that it considers the financial requirements of the basic research support programs as a pilot research conducted by applying a time series model, which is a statistical approach, and multi-variate rather than single-variate. In addition, considering the policy trends that emphasize the importance of basic research investment such as 'the expansion of basic research budget twice', which is the current government's national policy task, it can be used as reference data in establishing basic research investment strategy.
In the basic research field, quantitative expansion is carried out with active support from the government, but there is no research and policy data suggesting systematic investment plans or data-based financial requirements yet. Therefore, this study predicted future financial requirements of basic research support programs by using time series prediction model. In order to consider various factors including the characteristics of the basic research field, we selected the ARIMAX model which can reflect the effect of multi valuable factors rather than the ARIMA model which predicts the value of single factor over time. We compared the predictions of ARIMAX and ARIMA models for model suitability and found that the ARIMAX model improves the prediction error rate. Based on the ARIMAX model, we predicted the fiscal spending of basic research support programs for five years from 2017 to 2021. This study has significance in that it considers the financial requirements of the basic research support programs as a pilot research conducted by applying a time series model, which is a statistical approach, and multi-variate rather than single-variate. In addition, considering the policy trends that emphasize the importance of basic research investment such as 'the expansion of basic research budget twice', which is the current government's national policy task, it can be used as reference data in establishing basic research investment strategy.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 연구에서는 연구자 주도 기초연구지원 예산 2배 확대라는 국정과제의 원활한 수행과 이를 위한 투자전략 도출의 기반을 마련하기 위해 기초연구지원사업 예산의 영향요인을 탐색하고, 시계열 예측모형을 활용하여 향후 5년3)간의 기초연구지원사업 재정소요를 전망하고자 한다. 기존의 기초연구 예산계획은 주로 단기적인 시뮬레이션4)을 바탕으로 수립되었으나, 본 연구에서 수립한 모델을 통해 보다 예측력 높은 재정소요 전망이 가능해질 것으로 기대된다.
본 연구는 통계적 분석방법을 활용하여 기초연구지원사업의 재정소요를 전망하는 기존 연구가 전무한 상황에서, 통계적 분석방법인 시계열 예측모형을 활용한 시범적 연구로써의 의의를 지닌다. 또한 예산추계에 많이 활용되는 단변량 모형이 아닌, ARIMAX모형을 활용함으로써 예산규모에 영향을 미치는 여러 가지 요인들을 고려하고자 하였고, 그 결과 단변량 예측모형에 비해 예측력이 개선됨을 확인하였다.
제안 방법
민간연구개발투자는 2차 차분하여 DFT를 실시한 결과 자료의 정상성이 확보됨(a)을 확인하였다. ACF/PACF 그래프와 BIC 통계량 값을 검토한 결과 최소의 BIC 값(558.88)을 가지는 ARIMA(0,2,0)모형을 최적모형으로 추정하였다. 잔차분석(c)에서 백색잡음과정을 확인하여 추정모형의 적합성을 확인하였다
ARIMAX 모형의 적합성을 판단하기 위해 경제적·사회적·정치적·기초연구 관련 요인에서 변수를 하나씩 추출하여 조합을 만들고, 이를 기반으로 16개의 ARIMAX 모형을 도출하였다.
Box-Jenkins방법론()을 적용한 ARIMA 모형 설계의 첫 단계로 정상성(stationary) 검정을 실시하여 자료가 안정화되었는지 확인한다.
이론적 논의에서 언급된 다중합리성 이론이나 총체주의 이론은 다양한 사회 경제 정치 과학기술적 요인을 고려하는 것으로 반영되며, 단절균형 이론은 정책변동을 나타낼 수 있는 정치적 요인에 해당한다 할 수 있다. 각 경제적․사회적․정치적 요인은 앞서 논의한 선행연구를 바탕으로 선별하였고, 과학기술적 요인인 기초연구 관련요인은 기초연구지원사업 및 정부연구개발사업 예산 업무 담당자 및 전문가6)와의 논의결과를 반영하여 선별하였다. 선정된 9개의 독립변수와 종속변수 간의 연관성 확인을 위해 상관분석7)을 진행하였고, 각 변수에 대해 ARIMA에서 가장 많이 활용되는 Box-Jenkins 방법으로 시계열모형을 도출하였다.
각 변수의 ARIMA 모형을 반영하여 ARIMAX 모형을 수립할 수 있는데, 보다 예측력 높은 ARIMAX 모형을 선택하기 위해 경제적·사회적·정치적 요인과 특성적 요인에서 하나씩의 변수를 추출하여 변수조합에 따른 16개의 ARIMAX 모형을 만들고 예측력을 비교하였다.
진상기·오철호(2015)는 고등교육분야의 예산결정요인에 대한 연구에서 종속변수로 고등교육 예산을 설정하였고 독립변수는 교육수요요인, 일반사회·경제 요인, 행정요인, 정치요인으로 구분하여 선정하였다. 고등교육분야 관련 정책 및 예산의 영향을 직접적으로 받는 대상은 예산결정단계에서 필수적으로 고려되어야 하므로 수요요인으로 고등학생수, 대학생수, 고등교육기관 수를 측정지표로 선정하였다. 정부 예산을 고려할 때 경제적, 사회적 상황도 중요한 영향을 미친다.
우선 함성득·윤기중(2002)은 국방분야의 예산결정요인에 대한 연구에서 종속변수로 국방비 총액의 GNP비율, 전투력 증강의 GNP비율, 운영유지비의 GNP비율을 설정하였고 독립변수로 공급적 요인, 수요적 요인, 기타 요인 등 3종류의 변수를 선정하였다. 국방분야는 국가의 경제능력과 경제상태를 고려하지 않을 수 없기 때문에 공급적 요인으로 경제력(GDP), 물가상승률, 실업률을 선택하였다. 남북이 휴전상태임을 감안하여 북한의 군사력을 주시할 필요가 있으므로 수요적 요인에 북한의 군사 GNP비율을 선정하였다.
기초연구지원사업에 영향을 미치는 영향요인의 경우 경제적 요인, 사회적 요인, 정치적 요인, 기초연구관련 요인으로 분류하였다. 경제적 요인으로는 국내총생산(GDP), 소비자물가총지수, 정부총예산, 민간연구개발투자를 선정하였다.
국방분야는 국가의 경제능력과 경제상태를 고려하지 않을 수 없기 때문에 공급적 요인으로 경제력(GDP), 물가상승률, 실업률을 선택하였다. 남북이 휴전상태임을 감안하여 북한의 군사력을 주시할 필요가 있으므로 수요적 요인에 북한의 군사 GNP비율을 선정하였다. 이외에 현행의 예산 결정과정에서 지배적인 영향을 미치는 요인을 추가적으로 반영하기 위해서 기타 환경적 요인으로 예산점증 요인, 대통령의 정책의지를 요인으로 선정하였다.
다양한 분야의 예산결정요인 관련 선행연구검토, 정부연구개발사업 및 기초연구지원사업의 예산배분·조정 업무 담당자 등의 의견을 수렴하여 기초연구지원사업에 적용가능한 영향요인을 선정하였다.
다양한 분야의 예산결정요인 관련 선행연구검토, 정부연구개발사업 및 기초연구지원사업의 예산배분·조정 업무 담당자 등의 의견을 수렴하여 기초연구지원사업에 적용가능한 영향요인을 선정하였다. 다음으로 예측모형 도출을 위해 종속변수 및 영향요인 9개에 대한 28개년의 데이터셋을 수집하였고 변수별 ARIMA 모형을 수립하는 과정을 진행하였다. 단일변수별 ARIMA 모형이 높은 예측력을 나타냈고 ARIMAX 모형을 통해 종속변수의 예측오차율이 더욱 개선되면서 ARIMAX 예측모형의 적합성을 확인하였다.
두 조합을 기초연구지원사업예산의 향후 5년 전망의 모형으로 활용하기 위해 선행적 으로 ARIMA 모형을 통해 단일 변수별 5년 전망 값을 과 같이 얻었다.
우선 종속변수인 기초연구지원사업 예산에 영향을 미치는 주요변수를 선별하였다. 변수 유형은 경제적 요인, 사회적 요인, 정치적 요인, 기초연구 관련요인으로 구별하였다. 이론적 논의에서 언급된 다중합리성 이론이나 총체주의 이론은 다양한 사회 경제 정치 과학기술적 요인을 고려하는 것으로 반영되며, 단절균형 이론은 정책변동을 나타낼 수 있는 정치적 요인에 해당한다 할 수 있다.
사회경제적 요인은 1인당 소득, 인구밀도, 도시화, 노인인구 비중 등을 고려한 요인이다. 복지지출 대상이 대중이기 때문에 예산의 수요, 대중의 반응과 성과 등을 확인할 수 있는 요소들을 중심으로 영향요인을 선정하였다. 사회복지분야의 예산 또한 급격한 사회적 변화가 없는 한, 한정된 자원에서 배분되어야 하므로 지난 해의 예산을 기준으로 편성되는 점증주의 요건도 영향요인으로 선정되었다.
시계열 Yt가 평균이 0, 외생변수 xit가 k개인 ARIMAX 모형의 식은 ϕp(B)(1-B)d·Yt = θq(B)at +#로 표현하며, ϕp(B), θq(B)는 각각 p차, q차 다항식이다(최수임·손흥구·김삼용, 2018: 1139). 본 연구에서는 R프로그램의 TSA package에 있는 ARIMAX 명령문을 이용하여 통계분석을 수행하였다.
본 연구에서는 기초연구지원사업 예산에 영향을 미치는 요인들을 도출하고 시계열 예측모형을 활용하여 재정소요를 도출하였다. 다양한 분야의 예산결정요인 관련 선행연구검토, 정부연구개발사업 및 기초연구지원사업의 예산배분·조정 업무 담당자 등의 의견을 수렴하여 기초연구지원사업에 적용가능한 영향요인을 선정하였다.
5)을 기준으로 ARIMA(1,1,0)모형을 최적의 모형으로 판단하였다. 선별한 모형의 적합성을 판단하기 위해 잔차분석(c)을 수행하였고 백색잡음과정10)을 확인하여 최적 모형을 선정하였다.
예측값과 실제값 간 오차를 기준으로 예측력의 정확성을 판단하였다. 선정된 변수의 1989년-2013년 간 시계열자료로 ARIMA 모형을 구축하였고 이를 바탕으로 3년치 예측값(2014년-2016년)을 도출하여 실제값(2014년-2016년)과 비교하여 예측오차를 측정하였다. 최영문(1997)에 따르면 예측오차가 10% 미만은 매우정확, 10-20%이내는 정확, 20-50%는 보통, 50%이상은 부정확한 것으로 간주한다.
영향요인들을 조합하여 와 같이 16개의 ARIMAX 모형을 도출하였다.
ARIMAX 모형의 적합성을 판단하기 위해 경제적·사회적·정치적·기초연구 관련 요인에서 변수를 하나씩 추출하여 조합을 만들고, 이를 기반으로 16개의 ARIMAX 모형을 도출하였다. 이 모형을 적용한 예측오차율 값과 종속변수를 ARIMA 모형에 반영한 예측오차율 값을 비교하여 ARIMAX 모형의 이점을 확인하고, 가장 예측력이 높은 모형을 기반으로 기초연구지원사업의 향후 재정소요 전망을 도출하였다.
이 외에도 사회적 요인 및 정치적 요인으로 학생 수, R&D 종사 연구자 수, 연구비 단가, 선거 등 다양한 요인들을 검토하였으나 기초연구사업 예산과의 연관성을 고려하여 9개의 주요 변수를 선정하였다.
단일변수별 ARIMA 모형이 높은 예측력을 나타냈고 ARIMAX 모형을 통해 종속변수의 예측오차율이 더욱 개선되면서 ARIMAX 예측모형의 적합성을 확인하였다. 이 중 가장 예측오차율이 낮은 변수조합으로 ARIMAX 모형을 선정하여 기초연구지원사업의 향후 5년(2017년-2021년)동안의 예측값을 도출하였다
남북이 휴전상태임을 감안하여 북한의 군사력을 주시할 필요가 있으므로 수요적 요인에 북한의 군사 GNP비율을 선정하였다. 이외에 현행의 예산 결정과정에서 지배적인 영향을 미치는 요인을 추가적으로 반영하기 위해서 기타 환경적 요인으로 예산점증 요인, 대통령의 정책의지를 요인으로 선정하였다.
Box-Jenkins방법론(<그림 1>)을 적용한 ARIMA 모형 설계의 첫 단계로 정상성(stationary) 검정을 실시하여 자료가 안정화되었는지 확인한다. 자료가 불안정한 상태라면 차분이나 로그변환을 통해서 평균과 분산이 시간에 따라 변하지 않는 정상성을 갖춘 자료로 변형되는데, 본 연구에서는 단위근 검정(Dickey-Fuller Test)을 실시하여 안정성을 확인하여 차분과정을 거쳤다. 일반적으로 사회과학분야에서의 시계열분석 변수들은 비정상인 경우가 다수이기 때문에 시계열모형을 활용하기 위해서는 차분 과정이 필요하다(원종욱·성병찬·장인수, 2016: 4).
36)을 갖는 ARIMA(0,2,1)모형을 선택하였다. 잔차분석에서 백색잡음과정을 확인하였고 모형의 적합성을 확인하였다.
본 연구에서는 R프로그램의 Auto-arima기능을 활용하여 모형 추정의 단계까지 진행하였고 선출한 최적 모형의 적합성을 확인하기 위해 잔차분석을 실시하였다. 잔차항에서 백색잡음과정의 유무를 확인하였는데, 백색잡음과정이 확인되면 최적 모형으로 판단하였다. 백색잡음과정을 만족하기 위해서는 평균이 모든 시기에 0으로 일정, 시간이 지나도 변하지 않는 일정한 등분산, 어떤 시차에 대해서 자기상관이 존재하지 않아 연속적인 관련성이 존재하지 않는 조건을 만족해야 한다(이우리, 2013).
대상 데이터
기초연구지원사업에 영향을 미치는 영향요인의 경우 경제적 요인, 사회적 요인, 정치적 요인, 기초연구관련 요인으로 분류하였다. 경제적 요인으로는 국내총생산(GDP), 소비자물가총지수, 정부총예산, 민간연구개발투자를 선정하였다. 우선 GDP는 나라에 있는 노동, 자본 등 모든 생산요소를 결합하여 만들어 낸 최종 생산물의 합을 의미한다.
2조원임을 국정과제에 명시함으로써 대상을 명확히 하였다(국정기획자문위원회, 2017: 66). 따라서 본 연구에서도 국정과제에서 명시한 사업군을 대상으로 분석을 진행하였다.
ARIMA 모형의 경우 표본의 수가 많으면 많을수록 예측이 원활하게 이루어지고, 더 정확한 값을 나타낸다. 시계열분석 시, 최소 50개 이상의 표본(관측치)이 필요하다는 의견이 있으나(김영주, 2014) 본 연구에서는 자료의 한계로 인해 28개년의 데이터로 분석을 진행하였다. 다음으로, 문재인 정부는 우리나라 기초연구의 중요성을 강조하면서 2022년까지 연구자주도 기초연구 예산을 2배 확대하겠다는 국정과제를 발표한 바 있다.
이 외에도 사회적 요인 및 정치적 요인으로 학생 수, R&D 종사 연구자 수, 연구비 단가, 선거 등 다양한 요인들을 검토하였으나 기초연구사업 예산과의 연관성을 고려하여 9개의 주요 변수를 선정하였다. 이렇게 도출된 총 9개의 독립변수와 1개의 종속변수 간의 시계열모형 수립을 위해 1989년부터 2016년까지 총 28년간의 자료를 수집하여 분석하였다. 변수의 조작적 정의 및 구체적 자료원은 다음 표와 같다.
데이터처리
기초연구 과제수 자료에 1차 차분하여 DFT를 실시한 결과 자료의 정상성이 확보됨 (a)을 확인하였다. ACF/PACF 그래프와 BIC 통계량 값을 검토한 결과 최소의 BIC 통계량(447.19)을 기준으로 ARIMA(0,1,0)모형을 선택하였다. 잔차분석(c)에서 백색잡음과정을 확인하였다
앞서 선정한 9개의 변수에 대한 최적 ARIMA 모형을 설계하기 위해 다음과 같은 과정을 수행하였다. 기초연구지원사업 예산자료를 1차 차분한 후 Dickey-Fuller Test(이하 DFT)를 실시하여 자료의 정상성(a)을 확인하였다. 정상성을 확보한 후 자기상관함수(ACF), 편자기상관함수(PACF)그래프와 최소의 BIC 통계량(412.
자기상관함수(ACF: Auto-Correlation Function), 편자기상관함수(PACF: Partial Auto-Correlation Function)의 모형으로 최적화된 파라미터를 추정하는 것을 기본으로 진행하였으나, 자기상관함수와 편자기상관함수로 식별이 어려운 경우 BIC(Bayesian Information Criterion)통계량으로 모형을 추정하였다. 본 연구에서는 R프로그램의 Auto-arima기능을 활용하여 모형 추정의 단계까지 진행하였고 선출한 최적 모형의 적합성을 확인하기 위해 잔차분석을 실시하였다. 잔차항에서 백색잡음과정의 유무를 확인하였는데, 백색잡음과정이 확인되면 최적 모형으로 판단하였다.
선정된 9개의 독립변수와 종속변수 간의 연관성 확인을 위해 상관분석7)을 진행하였고, 각 변수에 대해 ARIMA에서 가장 많이 활용되는 Box-Jenkins 방법으로 시계열모형을 도출하였다.
05 이상 등 3가지의 조건을 만족하면 백색잡음 과정이므로 모형이 적합한 것으로 판단하였다(송경재·양희민, 2005). 이 과정을 거쳐 9개의 변수별 ARIMA 모형을 도출하였고 미래의 값을 예측하기 위한 과정인 만큼 ARIMA 모형의 예측 정확도를 확인하기 위한 사후평가를 수행하였다.
기초연구지원사업 예산자료를 1차 차분한 후 Dickey-Fuller Test(이하 DFT)를 실시하여 자료의 정상성(a)을 확인하였다. 정상성을 확보한 후 자기상관함수(ACF), 편자기상관함수(PACF)그래프와 최소의 BIC 통계량(412.5)을 기준으로 ARIMA(1,1,0)모형을 최적의 모형으로 판단하였다. 선별한 모형의 적합성을 판단하기 위해 잔차분석(c)을 수행하였고 백색잡음과정10)을 확인하여 최적 모형을 선정하였다.
이론/모형
SCI 논문 수 자료는 2차 차분하여 DFT를 실시한 결과 자료의 정상성이 확보됨(a)을 확인하였다. ACF/PACF 그래프와 BIC 통계량 값을 검토한 결과 최소의 BIC값(451.36)을 갖는 ARIMA(0,2,1)모형을 선택하였다. 잔차분석에서 백색잡음과정을 확인하였고 모형의 적합성을 확인하였다.
과학기술정책의지 자료에 1차 차분하여 자료의 정상성이 확보됨(a)을 확인하였다. ACF/PACF 그래프와 BIC 통계량 값을 검토한 결과 최소의 BIC통계량(16.14)을 갖는 ARIMA(0,1,0)모형으로 선정하였다. 잔차분석(c) 통해 백색잡음과정을 확인하였다.
일반적으로 사회과학분야에서의 시계열분석 변수들은 비정상인 경우가 다수이기 때문에 시계열모형을 활용하기 위해서는 차분 과정이 필요하다(원종욱·성병찬·장인수, 2016: 4). 다음으로 변수별 최적의 ARIMA(p,d,q)모형을 수립하였다. 자기상관함수(ACF: Auto-Correlation Function), 편자기상관함수(PACF: Partial Auto-Correlation Function)의 모형으로 최적화된 파라미터를 추정하는 것을 기본으로 진행하였으나, 자기상관함수와 편자기상관함수로 식별이 어려운 경우 BIC(Bayesian Information Criterion)통계량으로 모형을 추정하였다.
변수별 ARIMA 최적모형의 수립 후 기초연구지원사업 예산에 영향을 미치는 다수의 요인들을 고려하여 재정소요를 전망하는 과정을 진행하였는데, 경제적·사회적·정치적·기초연구관련 요인들을 복합적으로 고려하기 위해 전이함수 모형인 ARIMAX 모형을 활용하였다.
기초연구지원사업 관련 정책목표 달성과 체계적인 투자 계획을 수립하기 위해서는 미래의 소요액을 확인하는 과정이 필수적이다. 본 연구에서는 기초연구지원사업의 향후 재정소요 전망을 위해 단변량 시계열분석인 ARIMA 모형과 전이함수 형태인 ARIMAX 모형을 활용하였다5). ARIMAX 모형은 다변수의 조건을 고려하여 종속변수와의 동적 관련성을 반영함으로써 단일변량 모형의 예측값을 개선하는 효과를 기대할 수 있다는 장점이 있다(Hawes, 2015; Pankratz·Alan, 1991).
이와 같이 변수별 최적의 ARIMA모형을 설계하였고, 정리하면 와 같다.
다음으로 변수별 최적의 ARIMA(p,d,q)모형을 수립하였다. 자기상관함수(ACF: Auto-Correlation Function), 편자기상관함수(PACF: Partial Auto-Correlation Function)의 모형으로 최적화된 파라미터를 추정하는 것을 기본으로 진행하였으나, 자기상관함수와 편자기상관함수로 식별이 어려운 경우 BIC(Bayesian Information Criterion)통계량으로 모형을 추정하였다. 본 연구에서는 R프로그램의 Auto-arima기능을 활용하여 모형 추정의 단계까지 진행하였고 선출한 최적 모형의 적합성을 확인하기 위해 잔차분석을 실시하였다.
성능/효과
1|%보다 개선되는 것을 확인하였고 다수의 독립변수를 활용한 예측값 도출에 ARIMAX 모형이 적합함을 확인하였다. 2014년-2016년 값의 예측을 통해 조합7 과 조합6에서 가장 낮은 예측오차율을 보임을 확인하였다.
전임교원 수 자료는 1차 차분하여 DFT를 실시한 결과 자료의 정상성이 확보됨(a)을 확인하였다. ACF/PACF 그래프와 BIC 통계량 값을 검토한 결과 최소의 BIC 통계량 (523.77)을 갖는 ARIMA(0,1,0)을 최적의 모형으로 선별하였다. 잔차분석에서 백색잡음과정을 확인하여 모형의 적합성을 확인하였다.
국내 석·박사 수 자료에 1차 차분하여 DFT를 실시한 결과 자료의 정상성이 확보됨(a)을 확인하였다. ACF/PACF 그래프와 BIC 통계량 값을 검토한 결과 최소의 BIC 통계량(544.17)을 갖는 ARIMA(0,1,0)모형을 최적의 모형으로 선택하였다. 잔차분석(c)에서 백색잡음과정을 확인하여 모형의 적합성을 확인하였다.
ARIMAX 모형 중 조합7(소비자물가총지수·전임교원수·과학기술정책의지·기초연구과 제수)과 조합6(소비자물가총지수·석박사수·과학기술정책의지·SCI논문수)의 예측오차율 은 각 |0.1|%와 |0.2|%로 매우 높은 예측력을 보임을 확인하였다.
ARIMAX 모형의 예측오차율이 의 기초연구지원사업 예산에 대한 ARIMA 모형 예측오차율인 |1.1|%보다 개선되는 것을 확인하였고 다수의 독립변수를 활용한 예측값 도출에 ARIMAX 모형이 적합함을 확인하였다.
SCI 논문 수 자료는 2차 차분하여 DFT를 실시한 결과 자료의 정상성이 확보됨(a)을 확인하였다. ACF/PACF 그래프와 BIC 통계량 값을 검토한 결과 최소의 BIC값(451.
국내 석·박사 수 자료에 1차 차분하여 DFT를 실시한 결과 자료의 정상성이 확보됨(a)을 확인하였다.
기초연구 과제수 자료에 1차 차분하여 DFT를 실시한 결과 자료의 정상성이 확보됨 (a)을 확인하였다. ACF/PACF 그래프와 BIC 통계량 값을 검토한 결과 최소의 BIC 통계량(447.
다음으로 예측모형 도출을 위해 종속변수 및 영향요인 9개에 대한 28개년의 데이터셋을 수집하였고 변수별 ARIMA 모형을 수립하는 과정을 진행하였다. 단일변수별 ARIMA 모형이 높은 예측력을 나타냈고 ARIMAX 모형을 통해 종속변수의 예측오차율이 더욱 개선되면서 ARIMAX 예측모형의 적합성을 확인하였다. 이 중 가장 예측오차율이 낮은 변수조합으로 ARIMAX 모형을 선정하여 기초연구지원사업의 향후 5년(2017년-2021년)동안의 예측값을 도출하였다
따라서 일반사회·경제 요인에 GDP차분, 청년 실업률, 도시화, GINI계수, 소비자 물가지수가 포함되었다.
본 연구는 통계적 분석방법을 활용하여 기초연구지원사업의 재정소요를 전망하는 기존 연구가 전무한 상황에서, 통계적 분석방법인 시계열 예측모형을 활용한 시범적 연구로써의 의의를 지닌다. 또한 예산추계에 많이 활용되는 단변량 모형이 아닌, ARIMAX모형을 활용함으로써 예산규모에 영향을 미치는 여러 가지 요인들을 고려하고자 하였고, 그 결과 단변량 예측모형에 비해 예측력이 개선됨을 확인하였다. 즉, 재정소요를 보다 정확하게 예측하기 위해 경제적 요인, 사회적 요인, 정치적 요인, 기초연구 관련요인을 예측모형에 포함시키는 것이 필요하며, 이때 예측력을 높이는 개별 변수가 존재하는 것이 아닌, 예측력이 개선되는 변수의 특정 조합이 존재함을 확인하였다.
본 연구에서는 이를 그래프로 판단하였는데, ①Standard residual에서 특정패턴이 없이 임의로 흩어진(scattering) 모형을 보이며, ②ACF residual에서 총합이 0, ③p-value값이 0.05 이상 등 3가지의 조건을 만족하면 백색잡음 과정이므로 모형이 적합한 것으로 판단하였다(송경재·양희민, 2005).
각 변수의 ARIMA 모형을 반영하여 ARIMAX 모형을 수립할 수 있는데, 보다 예측력 높은 ARIMAX 모형을 선택하기 위해 경제적·사회적·정치적 요인과 특성적 요인에서 하나씩의 변수를 추출하여 변수조합에 따른 16개의 ARIMAX 모형을 만들고 예측력을 비교하였다. 비교결과, 단변량 예측모형인 ARIMA를 적용했을 때보다 예측력이 더 높은 ARIMAX 모형이 있음을 확인하였다. 이렇게 도출된 예측력이 가장 높은 ARIMAX 모형을 기준으로 기초연구지원사업의 5년간의 재정소요를 전망하였다.
예측값과 실제값 간 오차를 기준으로 예측력의 정확성을 판단하였다. 선정된 변수의 1989년-2013년 간 시계열자료로 ARIMA 모형을 구축하였고 이를 바탕으로 3년치 예측값(2014년-2016년)을 도출하여 실제값(2014년-2016년)과 비교하여 예측오차를 측정하였다.
최영문(1997)에 따르면 예측오차가 10% 미만은 매우정확, 10-20%이내는 정확, 20-50%는 보통, 50%이상은 부정확한 것으로 간주한다. <표 3>의 결과에서 변수 9개의 오차율이 5%의 미만을 보여 예측력이 높은 것으로 판단할 수 있다.
전임교원 수 자료는 1차 차분하여 DFT를 실시한 결과 자료의 정상성이 확보됨(a)을 확인하였다. ACF/PACF 그래프와 BIC 통계량 값을 검토한 결과 최소의 BIC 통계량 (523.
또한 예산추계에 많이 활용되는 단변량 모형이 아닌, ARIMAX모형을 활용함으로써 예산규모에 영향을 미치는 여러 가지 요인들을 고려하고자 하였고, 그 결과 단변량 예측모형에 비해 예측력이 개선됨을 확인하였다. 즉, 재정소요를 보다 정확하게 예측하기 위해 경제적 요인, 사회적 요인, 정치적 요인, 기초연구 관련요인을 예측모형에 포함시키는 것이 필요하며, 이때 예측력을 높이는 개별 변수가 존재하는 것이 아닌, 예측력이 개선되는 변수의 특정 조합이 존재함을 확인하였다. 지금까지 기초연구를 위한 정부 투자규모의 산출은 많은 부분 단순 시뮬레이션에 의지한 경향이 컸다.
후속연구
지금까지 기초연구를 위한 정부 투자규모의 산출은 많은 부분 단순 시뮬레이션에 의지한 경향이 컸다. 그러나 이후에는 예측 모형을 활용한 전망 결과도 함께 활용될 수 있는 가능성을 제시하여, 정책적 판단의 갭을 파악하거나 향후 방향성을 제시하는데 참고하는 등 실질적인 정책적 활용도의 측면에서 본 연구의 기여점이 있다고 할 수 있다.
간의 기초연구지원사업 재정소요를 전망하고자 한다. 기존의 기초연구 예산계획은 주로 단기적인 시뮬레이션4)을 바탕으로 수립되었으나, 본 연구에서 수립한 모델을 통해 보다 예측력 높은 재정소요 전망이 가능해질 것으로 기대된다. 기초연구의 재정소요 전망 결과는 기초연구지원사업의 체계적·전략적 추진과 연구자 수요를 고려한 효율적 재원배분에 기여할 수 있을뿐 아니라, 정부의 주요 정책 추진 등을 위한 자금조달 가능성을 살펴보기 위해 중장기 재정소요 규모를 확인할 필요성이 제기되는 경우에도 실질적 참고자료가 될 수 있다.
이러한 경우 해당 정권이 유지되는 기간 동안 영향을 미칠 수 있는 현 정권의 정책목표를 미리 고려할 수 있다는 이점이 있으므로 후속연구에서는 정책적 요인을 해당 정권 자체의 요인으로 포함하여 분석하는 방안을 고려해보는 것도 의의가 있을 것으로 보인다. 마지막으로, 기초연구지원사업 예산의 영향요인을 선정하는 과정에서 더욱 다양한 분야의 전문가 의견을 수렴하여 변수를 선정한다면 예측력을 보다 높이는 것이 가능할 수 있을 것이다.
본 연구는 기초연구의 재정소요를 전망하는 예측모형을 도출하는 최초의 시도로, 후속 연구에서는 이러한 한계점을 수정․보완하여 보다 정교한 예측모형이 개발될 필요가 있고, 개선된 모형을 통해 기초연구의 향후 재정소요가 보다 정확하게 도출될 수 있을 것으로 기대된다.
뿐만 아니라 기초연구의 예산이 지속적으로 증가하는 것에 비해 구체적인 증액속도와 규모를 예측하기 힘들어 체계적 사업계획 수립이 어려웠던 한계가 있었으나, 예측모형을 활용해 어느 정도의 전망이 가능해진다면 예산 규모와 연구자의 수요를 보다 면밀히 고려하여 세부적인 지원전략 수립이 가능해지고, 이에 따라 예산배분의 효율성이 높아질 수 있을 것으로 기대할 수 있다. 기초연구 투자 확대에도 불구하고 연구자의 체감도가 여전히 낮은 문제점이나 수요를 고려한 기초연구지원사업 지원체계 개편 필요성에 대한 지적(신애리 윤수진, 2017: 14; 국가과학기술심의회, 2017: 149; 국가과학기술심의회, 2018: 186) 등은 이를 통해 다소나마 해소될 수 있을 것이다.
다음으로, 문재인 정부는 우리나라 기초연구의 중요성을 강조하면서 2022년까지 연구자주도 기초연구 예산을 2배 확대하겠다는 국정과제를 발표한 바 있다. 이는 매우 도전적인 목표로, 2017년 이후에 발생하는 큰 폭의 기초연구 예산 확대를 직접적으로 견인하였으나, 본 연구의 분석 데이터 범위는 2016년까지로 해당 요인이 반영되지 못한 한계가 있다. 본 연구에서는 연구개발비 비중으로 정부의 정책의지를 반영하고자 하였으나, 정권에 따라 국정목표가 변화하는 만큼 정권교체 자체나 정책목표를 변수로 고려하는 방법도 있다.
본 연구에서는 연구개발비 비중으로 정부의 정책의지를 반영하고자 하였으나, 정권에 따라 국정목표가 변화하는 만큼 정권교체 자체나 정책목표를 변수로 고려하는 방법도 있다. 이러한 경우 해당 정권이 유지되는 기간 동안 영향을 미칠 수 있는 현 정권의 정책목표를 미리 고려할 수 있다는 이점이 있으므로 후속연구에서는 정책적 요인을 해당 정권 자체의 요인으로 포함하여 분석하는 방안을 고려해보는 것도 의의가 있을 것으로 보인다. 마지막으로, 기초연구지원사업 예산의 영향요인을 선정하는 과정에서 더욱 다양한 분야의 전문가 의견을 수렴하여 변수를 선정한다면 예측력을 보다 높이는 것이 가능할 수 있을 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
기초연구의 특징은?
오랜 경기침체를 극복하고 새로운 성장을 위한 재도약이 요구되는 시기로, 경제, 환경, 사회적 난제 해결 등의 중장기적 이슈해결 및 신성장동력 창출을 위한 주요 방안 중 하나로 창의적인 기초연구1)의 역할이 강조되고 있다. 하지만 기초연구는 타 분야와 달리 투자성과가 도출되는데 오랜 시간이 걸리고, 활용분야를 특정하기 어려운 경우가 많아 민간기업 보다는 정부에서 주도적으로 지원한다. 미국, 유럽 등 선진국은 기초연구에 대한 지속적인 지원의 필요성을 인식하고 각국의 특성에 맞는 지원체계를 확립하여 정부지원을 적극적으로 추진하고 있다(신은정, 2016).
점증주의 이론의 결점을 보완할 이론으로 단절균형이론이 선택된 이유는?
이를 보완하는 대표적인 접근으로 예산의 급진적 변화를 설명하는 단절균형이론을 들수 있다. 점증주의 이론과 유사하게 안정적인 현상을 유지하면서 정치적 변동에 따른 예산 증감률 등의 현상을 설명할 수 있는 이론으로 간주되며 점증주의의 발전된 형태로 평가받고 있다(이현숙 외, 2011: 69-70). Jones et al.
기초연구 분야에 필요한 것은?
기초연구 분야는 정부의 적극적인 지원으로 양적 확대가 큰 폭으로 이루어지는 반면, 체계적인 투자계획이나 데이터에 기반한 재정소요를 제시하는 연구 및 정책자료가 전무하여 관련 연구가 요구되는 시점이다. 이에 본 연구는 시계열 예측모형을 활용하여 기초연구지원사업의 향후 재정소요를 전망하였다.
참고문헌 (56)
국가과학기술심의회 (2017), "2018년도 정부연구개발 투자방향 및 기준(안)". 국가과학기술심의회 운영위원회, 2017.3.14.
국가과학기술심의회 (2018), "2019년도 정부연구개발 투자방향 및 기준(안)", 국가과학기술심의회 운영위원회, 2018.3.14.
OECD.한국과학기술기획평가원 (2016), "프라스카티 매뉴얼 2015, 연구개발 자료수집과 보고에 관한 지침".
Chan, K..B. Ripley (2018), Time Series Analysis, Version 1.2. URL: https://cran.r-project.org/web/packages/TSA/
Dritsakis, N..P. Klazoglou (2017), Time series analysis using ARIMA models: an approach to forecasting health expenditures in USA, 2019 volume 72, Issue 1-February, pp.77-106.
Hawes, J. M. (2015), Proceedings of the 1989 Academy of Marketing Science (AMS) Annual Conference. Springer.
Jones, B..F. Baumgartner.C. Breuning, C. Wlezien.S. Soroca, M. Foucault.A. Francois.C. Green-Pedersen.C. Koski, P. John.P. Mortensen.F. Varone, and Walgrave (2009), A General Empirical Law of Public Budget: A Comparative Analysis. American Journal of Political Science Vol. 53(4), pp.855-873.
Pankratz, A. (1991), Forecasting with Dynamic Regression Models. 1st Edition, Wiley-Interscience.
Swanson, C. J. (2008), Long-Term Financial Forecasting for Local Governments, Goverment Finance Review, pp.60-66.
Wildavsky, A. (1979), How to Limit Government Spending. University of California Press.
Williams, D. W..T. D.Calabrese (2016), The status of budget forecasting. Journal of Public and Nonprofit Affairs, 2(2), pp.127-160.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.