영화 산업에서 영화 출시 이후의 영화 박스오피스 수익의 예측은 데이터 마이닝 측면에서 중요한 이슈이다. 과거에는 통계적 방법과 기계학습 기반 알고리즘 등과 같은 비즈니스 인텔리전스 기술이 개별적으로 적용되어 왔지만, ...
영화 산업에서 영화 출시 이후의 영화 박스오피스 수익의 예측은 데이터 마이닝 측면에서 중요한 이슈이다. 과거에는 통계적 방법과 기계학습 기반 알고리즘 등과 같은 비즈니스 인텔리전스 기술이 개별적으로 적용되어 왔지만, 앙상블 방법을 사용하여 박스오피스 수익을 예측하는 연구는 아직 수행되어있지 않았다. 본 연구에서는 영화 출시 이후 1주후, 2주후, 3주후에 영화 박스오피스 수익에 대한 예측의 정확도를 향상시키기 위해 앙상블 방법을 사용한 의사결정 나무 기법을 제안하고 있다. 1,439개의 영화 샘플을 이용하여 랜덤포레스트(random forests), 배깅(bagging)과 부스팅(boosting)을 기반으로 의사결정 나무의 예측 성능을 배깅부스팅을 기반으로 k-nearest-neighbor(k-NN) 및 선형회귀(linear regression) 예측 성능과 비교되었다. 실험결과는 의사결정 나무를 기반으로 하는 앙상블 방법(random forests, bagging, boosting)이 앙상블 방법 사용하는 k-NN(bagging, boosting) 보다 예측성과가 우수하다는 것을 나타냈다. 앙상블 방법을 이용한 의사결정 나무기법은 영화의 출시 후 첫 번째 주의 박스 오피스를 예측하는데 있어서 앙상블 방법을 사용하는 선형회귀 분석보다 우수한 예측 성능을 제공하였다. 이는 앙상블 방법을 이용한 의사결정 나무가 앙상블 방법을 사용하지 않는 의사결정 나무기법보다 예측 성과가 우수한 반면에, k-NN, 그리고 선형회귀분석에서는 앙상블 방법이 앙상블을 사용하지 않는 방법보다 예측성과가 우수하지 않게 나온 결과로 유추될 수 있다. 즉, 의사결정나무가k-NN과 선형회귀 분석보다 앙상블 적용의 효과성이 높다고 볼 수 있다.
영화 산업에서 영화 출시 이후의 영화 박스오피스 수익의 예측은 데이터 마이닝 측면에서 중요한 이슈이다. 과거에는 통계적 방법과 기계학습 기반 알고리즘 등과 같은 비즈니스 인텔리전스 기술이 개별적으로 적용되어 왔지만, 앙상블 방법을 사용하여 박스오피스 수익을 예측하는 연구는 아직 수행되어있지 않았다. 본 연구에서는 영화 출시 이후 1주후, 2주후, 3주후에 영화 박스오피스 수익에 대한 예측의 정확도를 향상시키기 위해 앙상블 방법을 사용한 의사결정 나무 기법을 제안하고 있다. 1,439개의 영화 샘플을 이용하여 랜덤포레스트(random forests), 배깅(bagging)과 부스팅(boosting)을 기반으로 의사결정 나무의 예측 성능을 배깅부스팅을 기반으로 k-nearest-neighbor(k-NN) 및 선형회귀(linear regression) 예측 성능과 비교되었다. 실험결과는 의사결정 나무를 기반으로 하는 앙상블 방법(random forests, bagging, boosting)이 앙상블 방법 사용하는 k-NN(bagging, boosting) 보다 예측성과가 우수하다는 것을 나타냈다. 앙상블 방법을 이용한 의사결정 나무기법은 영화의 출시 후 첫 번째 주의 박스 오피스를 예측하는데 있어서 앙상블 방법을 사용하는 선형회귀 분석보다 우수한 예측 성능을 제공하였다. 이는 앙상블 방법을 이용한 의사결정 나무가 앙상블 방법을 사용하지 않는 의사결정 나무기법보다 예측 성과가 우수한 반면에, k-NN, 그리고 선형회귀분석에서는 앙상블 방법이 앙상블을 사용하지 않는 방법보다 예측성과가 우수하지 않게 나온 결과로 유추될 수 있다. 즉, 의사결정나무가k-NN과 선형회귀 분석보다 앙상블 적용의 효과성이 높다고 볼 수 있다.
The prediction of movie box-office revenue after release has always been a challenging problem in a movie industry. Many business intelligence methods have been applied in the past individually, such as statistical methods and machine learning based algorithms, but the studies using an ensemble appr...
The prediction of movie box-office revenue after release has always been a challenging problem in a movie industry. Many business intelligence methods have been applied in the past individually, such as statistical methods and machine learning based algorithms, but the studies using an ensemble approach to predict box-office revenue are almost nonexistent. In this study, we propose decision trees using ensemble methods to achieve improved predictive accuracy of box-office earnings for a week later, two weeks later, and three weeks after release. The prediction performance of decision trees based on random forests, bagging and boosting are compared with that of k-nearest-neighbor (k-NN) and linear regression based on bagging and boosting using the sample of 1439 movies. The results indicate that ensemble methods based on decision trees (random forests, bagging, boosting) outperform ensemble methods based on k-nearest-neighbor, (bagging, boosting). Decision trees using ensemble methods provide better prediction performance than ensemble methods based on linear regression analysis in the box-office at week 1 after release. This is explained by the results that decision trees using ensemble methods provide better application effectiveness of ensemble methods than k-NN and linear regression analysis after comparing the prediction performance between ensemble methods and non-ensemble methods for decision trees, k-NN, and linear regression analysis. Decision tree methods, unlike the other methods, the prediction performance of ensemble methods is greater than that of non-ensemble methods.
The prediction of movie box-office revenue after release has always been a challenging problem in a movie industry. Many business intelligence methods have been applied in the past individually, such as statistical methods and machine learning based algorithms, but the studies using an ensemble approach to predict box-office revenue are almost nonexistent. In this study, we propose decision trees using ensemble methods to achieve improved predictive accuracy of box-office earnings for a week later, two weeks later, and three weeks after release. The prediction performance of decision trees based on random forests, bagging and boosting are compared with that of k-nearest-neighbor (k-NN) and linear regression based on bagging and boosting using the sample of 1439 movies. The results indicate that ensemble methods based on decision trees (random forests, bagging, boosting) outperform ensemble methods based on k-nearest-neighbor, (bagging, boosting). Decision trees using ensemble methods provide better prediction performance than ensemble methods based on linear regression analysis in the box-office at week 1 after release. This is explained by the results that decision trees using ensemble methods provide better application effectiveness of ensemble methods than k-NN and linear regression analysis after comparing the prediction performance between ensemble methods and non-ensemble methods for decision trees, k-NN, and linear regression analysis. Decision tree methods, unlike the other methods, the prediction performance of ensemble methods is greater than that of non-ensemble methods.
Keyword
#movie box-office revenue, ensemble methods, prediction, decision tree
학위논문 정보
저자
BIKASH K. C
학위수여기관
세종대학교 대학원
학위구분
국내석사
학과
경영학과
발행연도
2018
키워드
movie box-office revenue, ensemble methods, prediction, decision tree
※ AI-Helper는 부적절한 답변을 할 수 있습니다.