$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

영화 관객 수 예측을 위한 기계학습 기법의 성능 평가 연구
A Study on the Performance Evaluation of Machine Learning for Predicting the Number of Movie Audiences 원문보기

한국전자거래학회지 = The Journal of Society for e-Business Studies, v.25 no.2, 2020년, pp.49 - 63  

정찬미 (Graduate School(Big Data Analytics), Ewha Womans University) ,  민대기 (School of Business, Ewha Womans University)

초록
AI-Helper 아이콘AI-Helper

영화 제작에 막대한 비용이 투입되지만 관객수요는 매우 불확실하기 때문에 개선된 수요예측은 수익 개선을 위한 의사결정의 중요 수단으로 활용될 수 있다. 본 연구에서는 영화의 개봉 후 수요를 예측함에 있어 기계학습 기법의 적용 타당성을 예측 성능의 관점에서 검증하였다. 분석결과를 종합하면 다음과 같다. 첫째, 대안변수에 대한 통계적 검증 결과 기본 영화 특성(감독, 배우)과 함께 개봉 후 2주차까지의 스크린수, 상영횟수, 관객수, 주요 배우에 대한 관심도 등 시계열 자료가 수요예측에 유의미한 것을 확인하였다. 둘째, Random Forest Classifier와 SVM(Support Vector Machine) 등 분류 기반 기계학습 기법과 Random Forest Regressor와 k-NN Regressor와 같은 회귀모형 기반 기계학습 기법에 적용하여 예측 성능을 평가한 결과, Random Forest 기법이 우수한 결과를 보였다. 셋째, 누적관객수가 1분위보다 작은 영화에서 회귀모형 기반 기법은 낮은 예측 정확도를 보였으며, 분류기반 기법은 반대로 가장 우수한 결과를 얻었다. 즉, 영화 수요의 분포 특성에 따라서 차별화된 기계학습 기법을 적용하는 것이 필요하다.

Abstract AI-Helper 아이콘AI-Helper

The accurate prediction of box office in the early stage is crucial for film industry to make better managerial decision. With aims to improve the prediction performance, the purpose of this paper is to evaluate the use of machine learning methods. We tested both classification and regression based ...

주제어

표/그림 (7)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • Random Forest 모형은 영화 관객 수 예측문제에서 성능이 우수한 것으로 알려져 있어 분류기반 모형과 회귀모형 기반 모형에서 모두 사용하였다[33]. K-NN과 SVM 은 다양한 유형의 데이터에 적용하기 쉽고 노이즈(noise)에 대한 영향이 적은 기법으로 노이즈가 존재하는 본 연구 데이터를 대상으로 Random Forest Classifier와 우수한 성능을 갖는지 비교하고자 한다.
  • 본 논문에서는 영화산업에서 개봉 영화의 수익개선을 위한 의사결정을 지원하기 위한 목적에서 개봉 영화의 관객 수 예측 문제를 고려하 였다. 특히, 연속형 종속변수를 위한 회귀모형 기반 기계학습 모형과 범주형 종속변수를 대상 으로 하는 분류 기반 기계학습 모형의 예측성 능을 비교함으로써 의사결정에 유용한 정보의수준에 적합한 기계학습 모형을 확인하고자 한다.
  • 본 논문은 개봉 영화의 관객 수 예측 문제를 대상으로 기존 연구에서 주로 사용했던 분류 기반의 기계학습 모형과 함께 연속형 종속변수를 대상으로 회귀모형 기반의 기계학습 모형의 성능을 비교 평가하는 것을 목적으로 한다. 이번 장에서는 이와 같은 연구목적을 달성하기 위한 연구 수행 절차와 단계별 주요 고려사항을 설명한다.
  • 본 연구는 영화 수익 개선을 위한 의사결정에서 중요한 정보이지만 높은 불확실성으로 정확한 예측이 어려운 개봉 영화의 누적 관객 수예측 문제를 대상으로 기계학습 모형의 성능을 평가하였다. 특히, 기존 연구에서 주로 사용하던분류기반의 기계학습 예측 모형(k-NN, Random Forest Regressor)과 함께 회귀모형 기반의 기계학습 모형(SVM, Random Forest Classifier)의 적용 타당성을 분석하였다.
  • 마지막으로 일부 연구에서 영화의 제작 국가 또는 상영 지역과 관객 수의 차이를 고려하고 있으나 지역별 차이에 의한 효과는 제한적으로 나타나고 있다[27, 31, 35]. 본 연구에서는 한국영화와 해외 영화의 특성 차이를 반영하기 위하여 두 영화를 단일 모형에서 함께 다루지 않고 한국 영화와 외국 영화를 분리한 모형 또한 구축하였다.
  • 본 논문에서는 영화산업에서 개봉 영화의 수익개선을 위한 의사결정을 지원하기 위한 목적에서 개봉 영화의 관객 수 예측 문제를 고려하 였다. 특히, 연속형 종속변수를 위한 회귀모형 기반 기계학습 모형과 범주형 종속변수를 대상 으로 하는 분류 기반 기계학습 모형의 예측성 능을 비교함으로써 의사결정에 유용한 정보의수준에 적합한 기계학습 모형을 확인하고자 한다. 또한 기계학습 모형을 구성함에 있어 관객 수와 같은 시계열 데이터와 함께 영화 특성을 함께 입력변수로 고려함으로써 모형 특성에 따라서 예측성능 개선에 유용한 데이터의 특성을 제시한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
분류 기반 기계학습 기법과 회귀 모형 기반 기계학습 기법의 적용을 특성에 따라 차별화하여 적용해야 하는 이유는 무엇인가? 둘째, Random Forest Classifier와 SVM(Support Vector Machine) 등 분류 기반 기계학습 기법과 Random Forest Regressor와 k-NN Regressor와 같은 회귀모형 기반 기계학습 기법에 적용하여 예측 성능을 평가한 결과, Random Forest 기법이 우수한 결과를 보였다. 셋째, 누적관객수가 1분위보다 작은 영화에서 회귀모형 기반 기법은 낮은 예측 정확도를 보였으며, 분류기반 기법은 반대로 가장 우수한 결과를 얻었다. 즉, 영화 수요의 분포 특성에 따라서 차별화된 기계학습 기법을 적용하는 것이 필요하다.
SVM은 무엇이며 특징은 어떻게 되는가? SVM은 패턴 인식 및 자료 분석을 위한 지도 학습(Supervised Learning) 기법으로, k-NN과 같이 다양한 데이터 유형에 적용하기 쉽고 노이즈에 대한 영향이 적은 장점이 있다. 하지만 최적의 모델을 찾기 위해 Kernel과 매개변수들 사이의 조합에 대한 성능 실험이 필요하며 입 력변수와 데이터가 많은 경우 학습이 오래 걸리는 단점이 있다[8, 9].
Random Forest 기법이 전반적으로 예측 성능이 우수한 이유는 무엇인가? Random Forest 기법이 전반적으로 예측 성능이 우수한 결과는 입력변수가 많고 데이터가 적은 본 연구 데이터 특성에 따라서 다수 표본을 활용한 앙상블 기법 기반의 Random Forest 기법의 예측 정확도가 높게 나온 것으로 판단된다. 따라서 가용 정보가 제한적이고 입력변수가 적은 상황에서 동일한 연구결과를 기대할 수 있는지 추가 실험이 요구된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (36)

  1. Abel, F., Diaz-Aviles, E., Henze, N., Krause, D., and Siehndel, P., "Analyzing the Blogosphere for predicting the success of music and movie products," International Conference on Advances in Social Networks Analysis and Mining, pp. 276-280, 2010. 

  2. Breiman, L., Machine Learning 45:5. Kluwer Academic Publishers, 2001. 

  3. Brewer, S. M., Kelley, J. M., and Jozefowicz, J. J., "A blueprint for success in the US film industry," Applied Economics, Vol. 41, No. 5, pp. 589-606, 2009. 

  4. Chintagunta, P. K., Gopinath, S., and Venkataraman, S., "The effects of online user reviews on movie box office performance: Accounting for sequential rollout and aggregation across local markets," Marketing Science, Vol. 29, No. 5, pp. 944-957, 2010. 

  5. Chong, M., "Evaluating real-time search query variation for intelligent information retrieval service," Journal of Digital Convergence, Vol. 16, No. 12, pp. 335-342, 2018. 

  6. Delen, D., Sharda, R., and Kumar, P., "Movie forecast Guru: A Web-based DSS for Hollywood managers," Decision Support Systems, Vol. 43, No. 4, pp. 1151-1170, 2007. 

  7. Demir, D., Kapralova, O., and Lai, H., "Predicting IMDB movie ratings using Google Trends," 2012. 

  8. Eliashberg, J. and Shugan, S. M., "Film Critics: Influencers or Predictors?," Journal of Marketing, Vol. 61, No. 2, pp. 68-78, 1997. 

  9. Ginsberg, J., Mohebbi, M. H., Patel, R. S., Brammer, L., Smolinski, M., and Brilliant, L., "Detecting influenza epidemics using search engine query data," Nature, Vol. 457, No. 19, pp. 1012-1015, 2009. 

  10. Gong, J. J., Young, S. M., and der Stede, W. A. V.. "Real options in the motion picture industry: Evidence from film marketing and sequels," Contemporary Accounting Research, Vol. 28, No. 5, pp. 1438-1466, 2011. 

  11. Gunn, S. R., "Support vector machines for classification and regression," ISIS technical report, Vol. 14, No. 1, pp. 5-16, 1998. 

  12. Guo, Z., Zhang, X., and Hou, Y., "Predicting box office receipts of movies with pruned Random Forest," International Conference on Neural Information Processing ICONIP 2015: Neural Information Processing, pp. 55-62, 2015. 

  13. Jung, J., Hwang, S., and Kwon, C., "Forecasting Korean Unemployment Rate with Web Queries," Korean Institute of Industrial Engineers, pp. 3373-3377, 2015. 

  14. Kim, J. and Kim., J., "Relationship between Internet Buzz Share and Market Share : Movie Ticket Case", The Journal of Society for e-Business Studies, Vol. 18, No. 2, pp. 241-255, 2013. 

  15. Kim, T., Hong, J., and Kang, P., "Box office forecasting using machine learning algorithms based on SNS data," International Journal of Forecasting, Vol. 31, pp. 364-390, 2015. 

  16. Koo, P. and Kim, M., "A Study on the Relationship between Internet Search Trends and Company's Stock Price and Trading Volume", The Journal of Society for e-Business Studies, Vol. 20, No. 2, pp. 1-14, 2015. 

  17. Kwon, S. J., "Factors influencing Cinema Success: using News and Online Rates," Review of Culture & Economy, Vol. 17, No. 1, pp. 35-55, 2014. 

  18. Lee, K. J. and Chang, W., "Bayesian belief network for box-office performance: A case study on Korean movies," Expert Systems with Applications, Vol. 36, pp. 280-291, 2009. 

  19. Litman, B. R., "Predicting Success of Theatrical Movies: An Empirical Study," The Journal of Popular Culture, Vol. 16, No. 4, pp. 159-175, 1983. 

  20. Lovallo, D., Clarke, C., and Camerer, C., "Robust analogizing and the outside view: two empirical tests of case-based decision making," Strategic Management Journal, Vol. 33, No. 5, pp. 496-512, 2012. 

  21. Preis, T., Moat, H., and Stanley, H., "Quantifying trading behavior in financial markets using Google trends," Science Report, Vol. 3, p. 1684, 2013. 

  22. Qin, L., "Word-of-Blog for movies: A predictor and an outcome of box office revenue?," Journal of Electronic Commerce Research, Vol. 12, No. 3, pp. 187-198, 2011. 

  23. Ravid, S. A., "Information, blockbusters, and stars: A study of the film industry," The Journal of Business, Vol. 72, No. 4, pp. 463-492, 1999. 

  24. Rogers, E. M., "New product adoption and diffusion," Journal of Consumer Research, Vol. 2, No. 4, pp. 290-301, 1976. 

  25. Sawhney, M. S. and Eliashberg, J., "A parsimonious model for forecasting gross box-office revenues of motion pictures," Marketing Science, Vol. 15, No. 2, pp. 113-131, 1996. 

  26. Sharda, R. and Delen, D., "Predicting boxoffice success of motion pictures with neural networks," Expert Systems with Applications, Vol. 30, pp. 243-254, 2006. 

  27. Simonoff, J. S. and Sparraw, I. R., "Predicting movie grosses: winners and losers, blockbusters and sleepers," Chance, Vol. 13, No. 3, pp. 15-24, 2000. 

  28. Siroky, D. S., "Navigating Random Forests and related advances in algorithmic modeling," Statistics Survey, Vol. 3, pp. 147-163, 2009. 

  29. Song, J., Choi., K., and Kim. G., "Development of New Variables Affecting Movie Success and Prediction of Weekly Box Office Using Them Based on Machine Learning," Journal of Intelligent Information System, Vol. 24, No. 4, pp. 67-83, 2018. 

  30. Subramaniyaswamy, V., Viginesh, V. M., Vishnu, P. R., and Logesh, R., "Predicting movie box office success using multiple regression and SVM," 2017 International Conference on Intelligent Sustainable Systems(ICISS), pp. 182-186, 2017. 

  31. Wang, F., Zhang, Y., Li, X., and Zhu, H., "Why do moviegoers go to the theater? The role of prerelease media publicity and online word of mouth in driving moviegoing behavior," Journal of Interactive Advertising, Vol. 11, No. 1, pp. 50-62, 2010. 

  32. Wen, K. and Yang, C., "Determinants of the box office performance of motion picture in China-indication for Chinese motion picture market by adapting determinants of the box office(part II)," Journal of Science and Innovation, Vol. 1, No. 4, pp. 17-26, 2011. 

  33. Yu, L., Zhao, Y., Tang, L., and Yang, Z., "Online big data-driven oil consumption forecasting with Google trends," International Journal of Forecasting, Vol. 35, pp. 213-223, 2019. 

  34. Zhang, L., Luo, J., and Yang, S., "Forecasting box office revenue of movies with BP neural network," Expert Systems with Applications, Vol. 36, pp. 6580-6587, 2009. 

  35. Zhang, W. and Skiena, S., "Improving movie gross prediction through news analysis," 2009 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology-Workshops, pp. 301-304, 2009. 

  36. Zhang, Z., Li, B., Deng, Z., Chai, J., Wang, Y., and An, M., "Research on movie box office forecasting based on internet data," 2015 8th International Symposium on Computational Intelligence and Design, 2015. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로