본 논문에서는 영화의 흥행을 예측하기 위한 방법을 제안한다. 최근 영화시장이 성장함에 따라 시장의 수요를 예측하기 위한 다양한 연구들이 수행되고 있다. 영화는 비교적 수명주기가 짧은 문화상품이다. 따라서 안정적인 수익을 창출하기 위해 개봉 전 마케팅비용 및 개봉 후 스크린 수 등에 대한 설계가 필요하다. 이를 위해서는 상품의 수요와 경제적인 수익규모에 대한 계산이 선행되어야 한다. 기존 관련 연구들의 경우 예측을 위한 변수로서 주로 영화 자체의 속성들이나 시장에서의 경쟁요인 등을 이용한다. 그러나 정작 상품을 구매하는 주체인 잠재관객들에 대한 비중은 비교적 미비하다. 따라서 본 논문에서는 사람들이 가진 영화에 대한 인지도를 고려하기 위해 트위터를 하나의 설문표본으로서 활용했다. 기존에 사용된 변수들과 트위터에서 추출한 정보를 오프라인 요소와 온라인 요소로 정의하고, 두 요소를 취합하여 기계학습을 적용했다. 실험을 통해 본 논문에서 제시하는 예측기법을 검증했으며, 실험결과 약 95%의 정확도로 영화의 흥행을 예측했다.
본 논문에서는 영화의 흥행을 예측하기 위한 방법을 제안한다. 최근 영화시장이 성장함에 따라 시장의 수요를 예측하기 위한 다양한 연구들이 수행되고 있다. 영화는 비교적 수명주기가 짧은 문화상품이다. 따라서 안정적인 수익을 창출하기 위해 개봉 전 마케팅비용 및 개봉 후 스크린 수 등에 대한 설계가 필요하다. 이를 위해서는 상품의 수요와 경제적인 수익규모에 대한 계산이 선행되어야 한다. 기존 관련 연구들의 경우 예측을 위한 변수로서 주로 영화 자체의 속성들이나 시장에서의 경쟁요인 등을 이용한다. 그러나 정작 상품을 구매하는 주체인 잠재관객들에 대한 비중은 비교적 미비하다. 따라서 본 논문에서는 사람들이 가진 영화에 대한 인지도를 고려하기 위해 트위터를 하나의 설문표본으로서 활용했다. 기존에 사용된 변수들과 트위터에서 추출한 정보를 오프라인 요소와 온라인 요소로 정의하고, 두 요소를 취합하여 기계학습을 적용했다. 실험을 통해 본 논문에서 제시하는 예측기법을 검증했으며, 실험결과 약 95%의 정확도로 영화의 흥행을 예측했다.
This paper suggests a method for predicting a box-office success of the film. Lately, as the growth of the film industry, a variety of studies for the prediction of market demand is being performed. The product life cycle of film is relatively short cultural goods. Therefore, in order to produce sta...
This paper suggests a method for predicting a box-office success of the film. Lately, as the growth of the film industry, a variety of studies for the prediction of market demand is being performed. The product life cycle of film is relatively short cultural goods. Therefore, in order to produce stable profits, marketing costs before opening as well as the number of screen after opening need a plan. To fulfill this plan, the demand for the product and the calculation of economic profit scale should be preceded. The cases of existing researches, as a variable for predicting, primarily use the factors of competition of the market or the properties of the film. However, the proportion of the potential audiences who purchase the goods is relatively insufficient. Therefore, in this paper, in order to consider people's perception of a movie, Twitter was utilized as one of the survey samples. The existing variables and the information extracted from Twitter are defined as off-line and on-line element, and applied those two elements in machine learning by combining. Through the experiment, the proposed predictive techniques are validated, and the results of the experiment predicted the chance of successful film with about 95% of accuracy.
This paper suggests a method for predicting a box-office success of the film. Lately, as the growth of the film industry, a variety of studies for the prediction of market demand is being performed. The product life cycle of film is relatively short cultural goods. Therefore, in order to produce stable profits, marketing costs before opening as well as the number of screen after opening need a plan. To fulfill this plan, the demand for the product and the calculation of economic profit scale should be preceded. The cases of existing researches, as a variable for predicting, primarily use the factors of competition of the market or the properties of the film. However, the proportion of the potential audiences who purchase the goods is relatively insufficient. Therefore, in this paper, in order to consider people's perception of a movie, Twitter was utilized as one of the survey samples. The existing variables and the information extracted from Twitter are defined as off-line and on-line element, and applied those two elements in machine learning by combining. Through the experiment, the proposed predictive techniques are validated, and the results of the experiment predicted the chance of successful film with about 95% of accuracy.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
다음으로 기존의 연구들에 비해 본 논문에서 제시한 예측 모델이 어느 정도의 정확도 향상을 보였는지 알아보았다. Fig.
그러나 마케팅과 관련된 배급전략이나 실제 수요에 직접적인 영향을 미치는 잠재관객에 대한 조사 및 활용은 미비하여 명확한 한계를 가지고 있다. 따라서 본 논문에서는 이를 개선하기 위해 트위터를 하나의 설문표본으로 활용하여 잠재관객들이 가지고 있는 영화에 대한 인지도를 반영했다. 또한 제안하는 시스템의 이해를 돕고자 영화의 내적요인들과 잠재관객의 인지도를 오프라인 요소와 온라인 요소로 정의했다.
앞서 언급한 사례들에서는 영화의 내적인 요소보다 영화관객 수에 더 큰 상관관계를 가지는 SNS를 적극적으로 활용하여 영화의 흥행을 예측하는 데에는 한계가 있었다. 따라서 본 연구에서는 기존 연구에서 영화 내적인 요소를 사용한 것과 더불어 SNS를 추가적으로 활용한 방법 간의 예측 정확도의 차이를 밝히고 최종 영화흥행 예측 모델을 제시한다.
마지막으로 온라인 요소의 포함여부에 대해 데이터 개수가 다를 경우에도 예측 정확도의 차이를 보이는지 알아보기 위해 실험을 진행하였다. 실험을 위해 이전 실험에서 이용한 두 가지의 동일 인스턴스 60개를 10개씩 구분하였고, 각 클래스의 비율을 고려하여 무작위로 추출하였다.
실험에 들어가기에 앞서 실험에 사용된 인스턴스들과 본 논문에서 제안한 속성들이 각각 얼마나 높은 정확도를 가지는지 알아보았다. Fig.
[11]에서는 국내에서 개봉한 영화 <써니>를 중심으로 영화 흥행에 대한 SNS의 영향력을 언급했다. 특히 영화의 생명주기를 시간순서로 나누어 각 시점별로 SNS가 마케팅으로서 어떻게 이용될 수 있는지를 설명했다. 또한 SNS가 영화흥행의 결정요인이자 참고요인으로서 이용될 수 있다는 점을 강조했다.
제안 방법
나이브 베이지안 분류 방법은 하나 이상의 독립적인 속성들로부터 결과를 분류하는 확률적인 분류 방법이다. 각각의 독립적인 속성들이 결합되어 하나의 인스턴스를 이루며 여러 개의 인스턴스를 통해 분류할 결과에 대한 확률을 계산한다.
그러나 0명 단위의 정확한 최대 관객 수를 예측하는 것은 불가능에 가까우며 무의미하다. 따라서 본 연구에서는 예측할 관객 수의 범위를 범주화하여 영화를 범주에 맞게 분류했다. 범주의 기준은 [12, 14]를 참고하였으며 Table 2와 같다.
이 경우 해당 트윗이 영화 <관상>만을 뜻하는 내용인지 명확히 알 수 없다. 따라서 평소에 해당 영화 제목을 포함했던 트윗의 비율을 따로 저장하여 영화 개봉일 전후 1주일간 증가한 만큼의 트윗 비율을 기준으로 삼았다.
[10]에서는 영화에 대한 구전효과가 흥행에 영향을 미칠 수 있다는 점을 언급했다. 또한 이를 가시화하기 위해 야후에서 제공하는 영화정보 웹 사이트에 작성된 사용자들의 의견을 바탕으로 실험을 진행했다. 실험결과 사용자들에 의한 영화의 구전활동은 영화개봉 직전과 영화개봉 후 1주일 동안이 가장 활발했으며, 영화에 대한 기대도는 개봉 후 1주일을 기준으로 조금씩 낮아진다는 것을 밝혔다.
다음으로 [10]에서 언급한 바와 같이 트윗은 개봉 전 1주 일간의 트윗과 개봉 후 1주일간의 트윗으로 구분했다. 또한, 데이터로 이용될 영화들에 대해 각각 개봉일이 다르므로 영화별로 기간을 달리하여 트윗 데이터를 구분했다. 결과적으로 개봉 전과 후에 트위터 내에서 각각의 영화마다 해당 영화가 언급된 트윗의 비율이 두 개씩 반환된다.
[9]에서는 영화 내적인 요소를 기준으로 어떠한 요소가 경제적인 수익과 직접적인 연관이 있는지를 밝혔다. 실험을 위해 액션영화, 아동용 영화, 속편여부, 수상여부, 배급사의 예산 등을 속성으로 이용했으며 이들 간의 상관관계를 밝혔다.
1과 같다. 예측을 위해 데이터를 수집하는 단계와 기계학습을 통해 예측을 수행하는 단계로 구성했다. 먼저 데이터 수집 단계에서는 특정 영화에 대한 온라인/오프라인 정보들을 수집한다.
2와 같다. 우선 트윗의 내용을 분석하여 특정 영화제목이 포함된 트윗을 해당 영화에 대한 트윗으로 구분했다. 이때 띄어쓰기는 고려하지 않았다.
따라서 수집된 다수의 영화 편수만큼 동일 개수의 인스턴스가 생성된다. 이를 기반으로 기계학습을 적용했고 학습결과 최종 반환되는 클래스(Class)로 영화의 흥행을 예측한다. 예측은 시점에 따라 총 2번 수행된다.
또한 제안하는 시스템의 이해를 돕고자 영화의 내적요인들과 잠재관객의 인지도를 오프라인 요소와 온라인 요소로 정의했다. 이후 이 두 요소를 기반으로 기계학습을 적용하여 영화 흥행을 예측하기 위한 모델을 제시했다.
대상 데이터
우선 포털 자료에 대한 데이터는 국내에서 가장 많은 사용자를 보유한 네이버에서 제공하는 네이버 영화[16]의 설문 자료를 이용하였다. 관련 자료는 2013년 11월 27일에 일괄적으로 수집했다. 포털 자료에는 포털 평점과 포털 평점 설문에 참여한 참여자 수가 있다.
본 연구에서는 영화의 흥행을 예측하기 위해 트위터를 이용했다. 기존 연구에서 영화 내적인 요소들만을 위주로 예측을 시도했던 것과는 달리 잠재 관객들의 영화에 대한 인지도를 고려하였으며, 이를 위해 트위터와 포털 자료를 이용했다. 실험을 통해 제안하는 예측 모델의 효율성을 검증하였으며, 최종 실험 결과 95%의 예측 정확도를 보였다.
예측을 위해 데이터를 수집하는 단계와 기계학습을 통해 예측을 수행하는 단계로 구성했다. 먼저 데이터 수집 단계에서는 특정 영화에 대한 온라인/오프라인 정보들을 수집한다. 데이터에 대한 자세한 설명은 3.
수집한 트윗 코퍼스(Corpus)에서 특정 영화에 대한 트윗 들을 추출하기 위해 2013년 4월 1일부터 8개월간 발생한 트윗을 수집했다. 트윗 데이터의 수집과정은 Fig.
마지막으로 온라인 요소의 포함여부에 대해 데이터 개수가 다를 경우에도 예측 정확도의 차이를 보이는지 알아보기 위해 실험을 진행하였다. 실험을 위해 이전 실험에서 이용한 두 가지의 동일 인스턴스 60개를 10개씩 구분하였고, 각 클래스의 비율을 고려하여 무작위로 추출하였다. 실험 결과 Fig.
오프라인 요소에는 영화 내적인 요소가 포함된다. 영화는 2013년 4월에서 10월 사이에 개봉한 영화들 중 무작위로 60편의 영화를 선택하여 데이터 셋(Data Set)을 구성했다. 영화에 대한 정보는 영화진흥위원회[18]에서 제공하는 자료를 기준으로 수집했다.
영화는 2013년 4월에서 10월 사이에 개봉한 영화들 중 무작위로 60편의 영화를 선택하여 데이터 셋(Data Set)을 구성했다. 영화에 대한 정보는 영화진흥위원회[18]에서 제공하는 자료를 기준으로 수집했다.
온라인 요소에 대한 데이터를 수집하여 영화의 잠재고객 들의 수요를 수치화하기 위해 포털 자료와 트위터를 이용했다. 우선 포털 자료에 대한 데이터는 국내에서 가장 많은 사용자를 보유한 네이버에서 제공하는 네이버 영화[16]의 설문 자료를 이용하였다. 관련 자료는 2013년 11월 27일에 일괄적으로 수집했다.
3은 범주별로 각 데이터가 어떻게 분포하는지를 나타낸 그래프이다. 총 5개의 범주에 대해 총 60편의 영화가 실험에 이용되었으며 평균 181만 명의 관객이 동원되었다. Fig.
이론/모형
본 연구에서는 나이브 베이지안 분류(Naive Bayes’ Rule) 방법[15]을 영화 흥행 예측의 도구로서 활용했다.
따라서 Table 3에서 수치화되어 표현된 연속적인 값을 가지는 속성은 그대로 적용할 수 없다. 이를 위해 (5)와 같이 이미 잘 알려진 가우지안 함수를 이용했다. (5)를 이용하면 해당 속성에 대한 독립적인 확률 값을 계산하여 (4)에 적용할 수 있다.
트위터에 대한 데이터를 수집하기 위해 트위터에서 제공 하는 스트리밍(Streaming) API[17]를 이용하였다. 트위터는 트위터 사(社)와 별도의 파이어호스(Firehose)계약이 없다면 일반 개발자에게는 전체 트윗 발생량의 무작위 1%만을 제공한다.
성능/효과
따라서 두 실험 결과를 비교하려면 전체적인 추이를 살펴보아야 한다. 기존 대다수의 연구에서처럼 온라인 요소를 배제하고 예측을 한 결과보다는 온라인 요소를 이용하여 예측을 한 결과가 전체적으로 더 높은 예측 정확도를 가지는 것을 확인할 수 있다. 또한 온라인 요소를 포함한 경우 가장 많은 데이터 셋이었던 60개의 데이터에서 95%의 예측 정확도를 얻었다.
5는 온라인 요소의 포함여부와 예측하는 시점에 따라 예측 정확도가 달라질 수 있음을 나타낸 것이다. 기존 연구에서처럼 온라인 요소를 제거할 경우 개봉일과 개봉 1주일 후의 예측에서는 각각 73.3%와 88.3%의 정확도를 보였다. 반면에 본 연구에서 제안하는 온라인 요소를 포함할 경우 각각 78.
또한 영화 개봉 1주일 후에 예측을 수행할 경우 관람객 수에 관한 속성이 추가됨으로써 잠재 관객들의 영화에 대한 관심이 온라인상에 반영된 것으로 해석할 수 있다. 따라서 온라인 요소를 포함하고 개봉 후 1주일간의 트윗을 함께 분석하는 것이 가장 높은 정확도를 보인다고 결론내릴 수 있다.
기존 대다수의 연구에서처럼 온라인 요소를 배제하고 예측을 한 결과보다는 온라인 요소를 이용하여 예측을 한 결과가 전체적으로 더 높은 예측 정확도를 가지는 것을 확인할 수 있다. 또한 온라인 요소를 포함한 경우 가장 많은 데이터 셋이었던 60개의 데이터에서 95%의 예측 정확도를 얻었다. 따라서 이를 본 논문에서 제시하는 영화 흥행 예측 모듈의 최종 정확도로 정한다.
이는 경제적 힘이 있는 배급사가 상대적으로 많은 제작비를 투자하여 그에 비례하는 관객 수를 확보했다는 것으로 해석된다. 또한 온라인 요소에 해당하는 포탈 평점은 매우 낮은 예측 정확도를 보였으며, 포털 평점 설문 참여자수는 높은 예측 정확도를 보였다. 이는 [10]에서처럼 영화의 흥행이 영화를 관람한 관객들의 평가보다는 특정 영화를 얼마나 많은 사람들이 인지하고 있는지와 연관이 있다는 것으로 해석된다.
3%의 정확도를 보였다. 반면에 본 연구에서 제안하는 온라인 요소를 포함할 경우 각각 78.3%와 95%로 두 시점에서 모두 정확도 향상이 있었다. 이는 영화의 흥행을 예측할 때 온라인 요소를 포함하면 보다 높은 정확도로 예측을 수행할 수 있다는 것을 의미한다.
7%라는 것의 의미는 해당 속성만을 사용해서 영화의 흥행을 예측할 경우의 정확도를 뜻한다. 실험 결과 온라인 요소에 해당하는 속성들이 비교적 높은 정확도를 보였다. 한편 배급사의 경우 오프라인 요소들 중 가장 높은 예측 정확도를 보였다.
또한 이를 가시화하기 위해 야후에서 제공하는 영화정보 웹 사이트에 작성된 사용자들의 의견을 바탕으로 실험을 진행했다. 실험결과 사용자들에 의한 영화의 구전활동은 영화개봉 직전과 영화개봉 후 1주일 동안이 가장 활발했으며, 영화에 대한 기대도는 개봉 후 1주일을 기준으로 조금씩 낮아진다는 것을 밝혔다. 따라서 특정 영화에 대한 관객들의 구전활동의 규모를 연구한다면 영화의 흥행을 예측할 수 있다는 결론을 내릴 수 있다.
기존 연구에서 영화 내적인 요소들만을 위주로 예측을 시도했던 것과는 달리 잠재 관객들의 영화에 대한 인지도를 고려하였으며, 이를 위해 트위터와 포털 자료를 이용했다. 실험을 통해 제안하는 예측 모델의 효율성을 검증하였으며, 최종 실험 결과 95%의 예측 정확도를 보였다.
트위터 피드란 일종의 블로그에서 쓰이는 리트윗과 같은 기능이다. 트위터 피드에서 추출한 사용자들의 감정을 수치화했고 실험 결과 86.7%의 정확도로 다우존스 산업평균 지수를 예측했다. 이처럼 트위터의 패턴을 분석하면 사회현상을 예측하는 것이 가능하다.
후속연구
이와 더불어 제안하는 예측 방법은 예측 결과로써 반환되는 최종 결과가 범주화 된 형태이기 때문에 정밀한 성능평가가 어렵다. 따라서 이에 대한 개선방안도 향후 연구할 계획이다. 마지막으로 결과에 대한 영향은 미비한 것으로 보이나 애니메이션 영화의 경우 배우효과에 관한 속성을 정확히 반영하지 못했다.
향후 연구로는 보다 정확한 영화 관련 트윗 수집을 위해노이즈 제거 및 자연어 처리에 대한 부분을 연구할 계획이다. 또한 영화 흥행 예측에 필요한 다양한 속성들에 대해 신경망(Neural Network) 분석과 같은 방법을 통해 각 속성별 예측 기여도를 분석할 것이다. 이를 통해 특정 속성을 추가하거나 제거한다면 보다 높은 예측 정확도를 얻을 수 있을 것으로 기대된다.
앞서 언급한 사례들에서는 영화의 내적인 요소보다 영화관객 수에 더 큰 상관관계를 가지는 SNS를 적극적으로 활용하여 영화의 흥행을 예측하는 데에는 한계가 있었다. 따라서 본 연구에서는 기존 연구에서 영화 내적인 요소를 사용한 것과 더불어 SNS를 추가적으로 활용한 방법 간의 예측 정확도의 차이를 밝히고 최종 영화흥행 예측 모델을 제시한다.
또한 영화 흥행 예측에 필요한 다양한 속성들에 대해 신경망(Neural Network) 분석과 같은 방법을 통해 각 속성별 예측 기여도를 분석할 것이다. 이를 통해 특정 속성을 추가하거나 제거한다면 보다 높은 예측 정확도를 얻을 수 있을 것으로 기대된다. 이와 더불어 제안하는 예측 방법은 예측 결과로써 반환되는 최종 결과가 범주화 된 형태이기 때문에 정밀한 성능평가가 어렵다.
향후 연구로는 보다 정확한 영화 관련 트윗 수집을 위해노이즈 제거 및 자연어 처리에 대한 부분을 연구할 계획이다. 또한 영화 흥행 예측에 필요한 다양한 속성들에 대해 신경망(Neural Network) 분석과 같은 방법을 통해 각 속성별 예측 기여도를 분석할 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
트위터 내에서는 어떤 관계를 사용하여 다자 간 소통이 이루어지는가?
또한, 다른 SNS와는 다르게 매우 개방적인 네트워크 구조를 지니고 있다. 트위터 내에서는 팔로워(Follower)-팔로위(Followee)라는 개념의 관계를 사용하여 다자 간 소통이 이루어진다. 이 관계는 한쪽의 일방적인 팔로우(Follow)만으로도 관계형성이 가능하다.
트위터의 주된 특징은 무엇인가?
트위터의 주된 특징은 실시간성과 정보의 빠른 확산력이다. 트위터는 트윗이라는 개념의 140자로 제한되는 단문텍스트 서비스를 제공하는데, 이는 사용자로 하여금 보다 손쉽고 간편한 정보의 생산을 유도한다.
트위터를 하나의 설문표본으로서 활용하면 새로운 지식을 생산해내는 것이 가능하다고 여겨지는 이유는 무엇인가?
트위터의 주된 특징은 실시간성과 정보의 빠른 확산력이다. 트위터는 트윗이라는 개념의 140자로 제한되는 단문텍스트 서비스를 제공하는데, 이는 사용자로 하여금 보다 손쉽고 간편한 정보의 생산을 유도한다. 또한, 다른 SNS와는 다르게 매우 개방적인 네트워크 구조를 지니고 있다. 트위터 내에서는 팔로워(Follower)-팔로위(Followee)라는 개념의 관계를 사용하여 다자 간 소통이 이루어진다. 이 관계는 한쪽의 일방적인 팔로우(Follow)만으로도 관계형성이 가능하다. 예를 들어 특정 사용자들이 사용자 A를 팔로우하게 되면 사용자 A의 타임라인에 게재된 트윗들을 다른 팔로워들이 볼 수 있다.
참고문헌 (18)
L. Barbosa and J. Feng, "Robust Sentiment Detection on Twitter from Biased and Noisy Data," Proc. of the 23rd International Conference on Computational Linguistics, pp.36-44, 2010.
E.-M. Kim, "The Determinants of Motion Picture Box Office Performance: Evidence from Movies Exhibited in Korea," Korean Journal of Journalism & Communication Studies, Vol.47, No.2, pp.190-220, 2003.
J. Bollen, H. Mao, and X. Zeng, "Twitter Mood Predicts the Stock Market," Journal of Computational Science, Vol.2, No.1, pp.1-8, 2011.
M. Pennacchiotti and A.-M. Popescu, "A Machine Learning Approach to Twitter User Classification," Proc. of the Fifth International AAAI Conference on Weblogs and Social Media, pp.281-288, 2011.
E. T. K. Sang and J. Bos, "Predicting the 2011 Dutch Senate Election Results with Twitter," Proc. of the SASN/the EACL Workshop on Semantic Analysis in Social Network, pp.53-60, 2012.
A. Tumasjan, T. O. Sprenger, P. G. Sandner, and I. M. Welpe, "Predicting Election with Twitter: What 140 Characters Reveal about Political Sentiment," Proc. of the Fourth International AAAI Conference on Weblogs and Social Media, pp.178-185, 2010.
S. Albert, "Movie Stars and the Distribution of Financially Successful Films in the Motion Picture Industry," Journal of Cultural Economics, Vol.22, No.4, pp.249-270, 1998.
N. Terry, J. W. Cooley, and M. Zachary, "The Determinants of Foreign Box Office Revenue for English Language Movies," Journal of International Business and Cultural Studies, Vol.2, No.1, pp.1-12, 2010.
Y. Liu, "Word of Mouth for Movies: Its Dynamics and Impact on Box Office Revenue," Journal of Marketing, Vol.70, No.3, pp.74-89, 2006.
S.-Y. Park, "Influence of the Word-of-Mouth Effect through SNS on the Movie Performance-Focused on the Case of -," Journal of the Korea Contents Association, Vol.12, No.7, pp.40-53, 2012.
Y. H. Kim, J. H. Hong, "A Study for the Development of Motion Picture Box-office Prediction Model," Communications of the Korean Statistical Society, Vol.18, No.6, pp.859-869, 2011.
J. Yim, B.-Y. Hwang, "An Analysis of Correlation between Movie Attendance and Related Tweets for Predicting Box Office," Proc. of the 40th Korea Information Processing Society Fall Conference, Vol.20, No.2, 2013.
G. Lee, U. Jang, "Predicting Financial Success of a Movie Using Bayesian Choice Model," Proc. of the KIIE/KORMS Spring Conference, pp.1428-1433, 2006.
I. H. Witten, E. Frank, and M. A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, 3rd Ed., pp.85-99, Morgan Kaufmann Series in Data Management Systems, 2011.
NAVER (2013, Nov. 27), Naver Movie [Online]. Available: http://movie.naver.com/
※ AI-Helper는 부적절한 답변을 할 수 있습니다.