한국프로야구에서 관중수는 프로야구 발전을 위한 가장 큰 수입원이며 프로야구팀의 관심사이므로 수요예측 모형이 있다면 프로야구구단들은 관중유치 전략을 세우는데 도움이 될 것이다. 이러한 이유로 본 연구에서는 한국프로야구 관중수를 예측하는 모형을 제안하고자 하며 제한된 여건 속에서 관중수에 영향을 미치는 이용 가능한 대부분의 변수들을 고려하였다. 종속변수는 로그관중수로 두고 다양한 독립변수와 오차항의 분산을 등분산, 조건부 이분산을 가정한 여러 가지 일반화 자기회귀 모형, 오차항의 분포가 t분포를 따른다는 가정을 이용한 일반화 자기회귀 조건부 이분산 모형들을 서로 비교하였는데, 그 결과 고려된 모형 중에서는 t분포를 가정한 일반화 자기회귀 조건부 이분산 모형이 가장 예측력이 뛰어났다.
한국프로야구에서 관중수는 프로야구 발전을 위한 가장 큰 수입원이며 프로야구팀의 관심사이므로 수요예측 모형이 있다면 프로야구구단들은 관중유치 전략을 세우는데 도움이 될 것이다. 이러한 이유로 본 연구에서는 한국프로야구 관중수를 예측하는 모형을 제안하고자 하며 제한된 여건 속에서 관중수에 영향을 미치는 이용 가능한 대부분의 변수들을 고려하였다. 종속변수는 로그관중수로 두고 다양한 독립변수와 오차항의 분산을 등분산, 조건부 이분산을 가정한 여러 가지 일반화 자기회귀 모형, 오차항의 분포가 t분포를 따른다는 가정을 이용한 일반화 자기회귀 조건부 이분산 모형들을 서로 비교하였는데, 그 결과 고려된 모형 중에서는 t분포를 가정한 일반화 자기회귀 조건부 이분산 모형이 가장 예측력이 뛰어났다.
In Korean professional baseball, attendance is the largest source of revenue for development of professional baseball and the highest concern of professional baseball teams. So, if there is demand forecasting model, it will be helpful for pennant chasers to work out the strategies for drawing attend...
In Korean professional baseball, attendance is the largest source of revenue for development of professional baseball and the highest concern of professional baseball teams. So, if there is demand forecasting model, it will be helpful for pennant chasers to work out the strategies for drawing attendance. For this reason, this research intends to suggest the model which estimates Korean professional baseball's attendance and uses all usable variables which have an effect on attendance in limited circumstances. We supposed that dependent variable is attendance as well as several independent variables and error term are homoscedastic variance. And then, we compared the models which assume conditional heteroscedastic variance like GARCH and EGARCH with GARCH-t models which use the assumption that error term's distribution follows student-t distribution. In result of that, we could confirm that the models which were made by using GARCH(1,1)-t made estimates the most accurately among the several models considered.
In Korean professional baseball, attendance is the largest source of revenue for development of professional baseball and the highest concern of professional baseball teams. So, if there is demand forecasting model, it will be helpful for pennant chasers to work out the strategies for drawing attendance. For this reason, this research intends to suggest the model which estimates Korean professional baseball's attendance and uses all usable variables which have an effect on attendance in limited circumstances. We supposed that dependent variable is attendance as well as several independent variables and error term are homoscedastic variance. And then, we compared the models which assume conditional heteroscedastic variance like GARCH and EGARCH with GARCH-t models which use the assumption that error term's distribution follows student-t distribution. In result of that, we could confirm that the models which were made by using GARCH(1,1)-t made estimates the most accurately among the several models considered.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이런 연유로 관중수를 예측하는 모형이 많이 존재하지만, 대부분의 연구는 미국 메이저리그의 관중수를 예측하는 모형에 국한되어있다. 따라서 본 논문은 한국프로야구 관중수를 예측하는 모형을 제시하는데 그 의의를 두고 있다. 본 연구에서는 최종 모형으로 AR(2)-GARCH(1,1)−t 모형을 선택하였는데, 모형분석 결과 로그변환한 관중수 및 ARCH류의 모형으로 분석하는 것이 좀 더 높은 설명력을 가지며, ARCH류의 모형을 설정할 때, 오차항의 분포가 정규분포보다 t분포를 가정한 모형이 더 적합하였다.
관중수에 영향을 미치는 요인에는 날씨, 경기시간, 홈구장의 시설, 이벤트, 구단의 승률 등과 같은 많은 변수들이 있겠지만 현실적으로 이런 변수들을 모두 고려하기는 매우 어렵다. 따라서 본 연구에서는 선행연구들을 참고로 하여 한국프로야구에서 영향을 많이 줄 것으로 간주되는 관측 가능한 여러 가지 주요 변수들을 고려하여 한국프로야구 관중수를 예측하는 모형을 제안하고자 한다. 일반적으로 관중수는 복합적인 요인들에 의해 변동성이 큰데 이러한 변동성을 등분산 모형으로 설명하는 것은 한계가 있다고 생각되어 조건부 이분산성을 고려한 모형 중 일반적으로 많이 사용되는 일반화 자기회귀 조건부 이분산모형 (GARCH)을 활용하였다.
본 절에서는 앞에서 설정한 ARCH타입의 모형을 토대로 부터 까지의 여러 가지 모형들을 비교하고자 한다.
제안 방법
ADF검정은 오차항이 자기상관 (autocorrelated)되어 있는 경우에 있어서 자기상관의 효과를 완화시키기 위해 오차항이 백색오차 (white noise)가 되도록 충분한 수의 시차 차분항 (lagged difference terms)을 추가하는데, 차분추가항의 차수는 표본자료의 정보량을 잘 반영하는 Akaike의 정보기준 AIC에 의거하여 AIC값이 최소가 되는 모형을 선택하였다. 표 3.
총 3,668경기를 통해 2000년부터 2005년도의 자료를 훈련자료로, 2006년도의 자료를 검증 자료로 사용하였다. 종속변수는 로그변환을 한 관중수 (로그관중수)이고 독립변수는 크게 시간, 구단, 자기상관에 관한 3가지 요인으로 나누어 분석하였으며 변수에 관한 자세한 설명은 표 2.1에 제시되어 있다. 그리고 공휴일에는 식목일, 제헌절, 어린이날, 석가탄신일, 현충일, 광복절, 개천절을 포함시켰다.
대상 데이터
본 연구에서는 2000년부터 2006년 동안의‘한국프로야구 연감’에 기록된 경기와 관련된 여러 자료를 이용하였다.
본 연구에서는 2000년부터 2006년 동안의‘한국프로야구 연감’에 기록된 경기와 관련된 여러 자료를 이용하였다. 총 3,668경기를 통해 2000년부터 2005년도의 자료를 훈련자료로, 2006년도의 자료를 검증 자료로 사용하였다. 종속변수는 로그변환을 한 관중수 (로그관중수)이고 독립변수는 크게 시간, 구단, 자기상관에 관한 3가지 요인으로 나누어 분석하였으며 변수에 관한 자세한 설명은 표 2.
데이터처리
본 연구에서는 제안된 모형들의 효율성을 서로 비교하기 위하여 일반적으로 많이 사용되는 추정량 선택기준인 평균제곱오차의 제곱근 (RMSE, root mean square error)과 평균절대편차 (MAD, mean absolute deviation)를 사용하였다. 이 경우 시간 i의 관중수를 yi, 추정된 관중수를 ŷi, 총 게임수를 n이라고 두면, RMSE와 MAD는 각각 다음 식과 같이 정의되며, 추정량들의 RMSE와 MAD를 계산하여 값이 가장 작은 것이 제일 좋은 추정량이라 할 수 있다.
2. 데이터처리 및 통계분석
통계패키지 SPSS 17K와 MATLAB을 이용하여 회귀방정식을 구하고 잔차의 정규성검정, 단위근 검정 및 ARCH 검정을 시행하였다
.
이론/모형
따라서 회귀분석 이전에 시계열 자료에 대한 단위근 검정을 수행하여 시계열의 확률적 추세 존재유무를 파악할 필요가 있다. 본 연구에서는 로그관중수에 대하여 최근 많이 사용되고 있는 단위근 검정법인 ADF검정 (Augmented Dickey Fuller test)를 사용하여 분석하였다.
따라서 본 연구에서는 선행연구들을 참고로 하여 한국프로야구에서 영향을 많이 줄 것으로 간주되는 관측 가능한 여러 가지 주요 변수들을 고려하여 한국프로야구 관중수를 예측하는 모형을 제안하고자 한다. 일반적으로 관중수는 복합적인 요인들에 의해 변동성이 큰데 이러한 변동성을 등분산 모형으로 설명하는 것은 한계가 있다고 생각되어 조건부 이분산성을 고려한 모형 중 일반적으로 많이 사용되는 일반화 자기회귀 조건부 이분산모형 (GARCH)을 활용하였다. GARCH 모형에 대한 최근 연구들은 Park과 Lee (2007), Lee (2007), Lee와 Ha (2007), Lee (2009) 등이 있다.
한편 본 연구에서는 여러 가지 ARCH 모형을 고려하는 것도 좋지만 Bollerslev (1986)의 GARCH (Generalized ARCH) 모형 중 단순한 GARCH(1,1)모형으로도 반복적 대입과정을 통하여 ARCH(∞) 모형으로 다시 쓸 수 있기 때문에 ARCH 모형대신 GARCH(1,1) −t와 Nelson (1991)의 EGARCH (Exponential GARCH) 중 간단한 EGARCH(1,1) −t의 두 가지 모형을 고려하였다.
성능/효과
14로서 꼬리가 매우 두터운 분포임을 알 수 있다. 또한 잔차가 정규분포의 형태를 갖는지를 확인하기 위해 Jarque-Bera 검정을 실시하였는데, 유의확률이 0.001로 유의수준 1%에서 정규분포를 따르지 않는 것으로 나타났으며, Engle (1982)의 자기회귀 조건부 이분산 (Autoregressive Conditional Heteroskedasticity: ARCH) 모형의 도입여부를 위하여 Engle (1982)의 ARCH 검정을 수행하면 ARCH 효과 존재 여부를 파악 할 수 있는데, 표 3.3을 통하여 유의수준 1%에서 ARCH 효과가 있다고 할 수 있으므로 오차항을 꼬리가 두터운 t분포로 가정한 여러 가지 ARCH류 모형을 고려하여 분석하는 것이 타당하다고 간주되어진다.
또한 지속성 모수의 추정값이 1에 비교적 근접한 수치로 볼 수 있어서 현재와 유사한 변동성 수준이 장래에도 지속될 가능성이 높은 것으로 보이며 EGARCH (1,1)−t 모형보다는 GARCH(1,1)−t가 더 적합한 모형으로 선택되었지만 그 차이는 근소했다.
모형의 추정은 Matlab에서 제공하는 GARCHSET와 GARCHFIT 절차를 이용하였으며 그 결과인 표 3.4를 보면 t분포의 자유도는 8.0646로 낮게 추정되었는데, 보통 자유도가 20보다 작은 경우에는 두꺼운 꼬리를 갖는 분포로 볼 수 있으므로 잔차들의 분포가 정규분포보다 좀 더 두터운 꼬리를 갖는다고 할 수 있으며 따라서 오차항을 t분포로 가정하는 것이 타당하다는 것을 알 수 있다. 그리고 지속성 모수 φ + ψ은 값이 1에 가까울수록 현재의 변동성 수준이 유사한 수준으로 장래에도 지속될 가능성이 높다고 할 수 있으므로 표 3.
본 연구에서는 최종 모형으로 AR(2)-GARCH(1,1)−t 모형을 선택하였는데, 모형분석 결과 로그변환한 관중수 및 ARCH류의 모형으로 분석하는 것이 좀 더 높은 설명력을 가지며, ARCH류의 모형을 설정할 때, 오차항의 분포가 정규분포보다 t분포를 가정한 모형이 더 적합하였다.
ADF검정은 오차항이 자기상관 (autocorrelated)되어 있는 경우에 있어서 자기상관의 효과를 완화시키기 위해 오차항이 백색오차 (white noise)가 되도록 충분한 수의 시차 차분항 (lagged difference terms)을 추가하는데, 차분추가항의 차수는 표본자료의 정보량을 잘 반영하는 Akaike의 정보기준 AIC에 의거하여 AIC값이 최소가 되는 모형을 선택하였다. 표 3.1의ADF의 단위근 검정 결과를 보면 2차 차분한 경우에 추세항을 모두 포함한 검정식을 사용하여 분석한 결과, 유의수준 1%에서 단위근이 존재한다는 귀무가설을 기각할 수 있어서 시계열에 확률적 추세가 없고 따라서 이로 인한 허구적 회귀문제를 피할 수 있다고 할 수 있다.
후속연구
아울러 AR(2)-GARCH(1,1)−t 모형에 대한 MAD의 평균값으로부터 2006년의 예측치가 실제보다 구단별로 평균적으로 2,000명 이상 차이가 난다고 해석될 수 있는데 그 이유는 현실적인 제약여건 관계로 더 많은 요인들을 고려하지 못했기 때문이라고 볼 수 있어 날씨 등의 변수를 추가로 보완한다면 예측력을 좀 더 향상시킬 수 있을 것으로 기대된다.
질의응답
핵심어
질문
논문에서 추출한 답변
관중수가 프로야구팀들의 중요한 관심사 중의 하나인 이유는?
프로야구팀들의 중요한 관심사중의 하나는 관중수인데 관중의 유치는 프로야구 발전을 위한 수입원과 밀접한 관계가 있기 때문이다. 이와 같은 이유로 세계야구를 선도하는 메이저리그를 대상으로 관중수를 예측하는 연구들이 많이 수행되었는데, 승률이 관중수에 중요한 영향을 미친다는 연구 (Fort와 Rosenman, 1999; Meehan 등, 2007), 승률보다는 다른 요인이 관중수에 더 큰 영향을 미친다는 분석 (Gifis와 Sommers, 2006; Chupp 등, 2007), 마이너리그 관중수에 영향을 미치는 요인에 대한 연구 (Paul 등, 2009), GARCH 모형을 이용한 팀의 승리와 메이저리그 관중수에 관한 연구 (Michael, 2009) 등이 있으며, 한국프로야구에 관한 관중수를 예측하는 연구로는 Lee (2006)가 있다.
한국프로야구 관중수를 예측하기 위한 모형에 고려될 수 있는 변수에는 어떤 것들이 있는가?
관중수에 영향을 미치는 요인에는 날씨, 경기시간, 홈구장의 시설, 이벤트, 구단의 승률 등과 같은 많은 변수들이 있겠지만 현실적으로 이런 변수들을 모두 고려하기는 매우 어렵다. 따라서 본 연구에서는 선행연구들을 참고로 하여 한국프로야구에서 영향을 많이 줄 것으로 간주되는 관측 가능한 여러 가지 주요 변수들을 고려하여 한국프로야구 관중수를 예측하는 모형을 제안하고자 한다.
메이저리그를 대상으로 프로야구 관중수를 예측하는 연구들로는 어떤 것들이 있나요?
프로야구팀들의 중요한 관심사중의 하나는 관중수인데 관중의 유치는 프로야구 발전을 위한 수입원과 밀접한 관계가 있기 때문이다. 이와 같은 이유로 세계야구를 선도하는 메이저리그를 대상으로 관중수를 예측하는 연구들이 많이 수행되었는데, 승률이 관중수에 중요한 영향을 미친다는 연구 (Fort와 Rosenman, 1999; Meehan 등, 2007), 승률보다는 다른 요인이 관중수에 더 큰 영향을 미친다는 분석 (Gifis와 Sommers, 2006; Chupp 등, 2007), 마이너리그 관중수에 영향을 미치는 요인에 대한 연구 (Paul 등, 2009), GARCH 모형을 이용한 팀의 승리와 메이저리그 관중수에 관한 연구 (Michael, 2009) 등이 있으며, 한국프로야구에 관한 관중수를 예측하는 연구로는 Lee (2006)가 있다.
참고문헌 (16)
김명직, 장국현 (2003). , 경문사, 서울.
한국야구위원회 (2000-2006). , 한국야구위원회, 서울.
Bollerslev, T. (1986). Generalized autoregressive conditional heteroskedasticity. Journal of Econometrics, 31, 307-327.
Chupp, A., Stephenson, F. and Taylor, R. (2007). Stadium alcohol availability and baseball attendance: Evidence from a natural experiment. International Journal of Sport Finance, 2, 36-44.
Engle, R. F. (1982). Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation. Econometrica, 50, 987-1007.
Lee, O. S. (2007). Sufficient conditions for stationarity of smooth transition ARMA/GARCH models. Journal of the Korean Data & Information Science Society, 18, 237-245.
Lee, T. W. (2009). Numerical study on Jarque-Bera normality test for innovations of ARMA-GARCH models. Journal of the Korean Data & Information Science Society, 20, 453-458.
Lee, T. W. and Ha, J. C. (2007). Testing the domestic financial data for the normality of the innovation based on the GARCH(1,1) model. Journal of the Korean Data & Information Science Society, 18, 809-815.
Lee, Y. H. (2006). The decline of attendance in the Korean professional baseball league: The major league effects. Journal of Sports Economics, 7, 187-200.
Meehan, J. W. Jr., Nelson, R. A. and Richardson, T. V. (2007). Competitive balance and game attendance in major league baseball. Journal of Sports Economics, 8, 563-580.
Park, S. Y. and Lee, S. Y. (2007). Modelling KOSPI200 data based on GARCH(1,1) parameter change test. Journal of the Korean Data & Information Science Society, 18, 11-16.
Paul, J. R., Toma, M. and Weinbach, A. P. (2009). The minor league experience: What drives attendance at south atlantic league baseball games? The Coastal Business Journal, 8, 70-84.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.