$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

소셜 빅데이터를 이용한 영화 흥행 요인 분석
Movie Box-office Analysis using Social Big Data 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.14 no.10, 2014년, pp.527 - 538  

이오준 (단국대학교 소프트웨어학과) ,  박승보 (단국대학교 미디어콘텐츠연구원) ,  정다울 (단국대학교 소프트웨어학과) ,  유은순 (단국대학교 미디어콘텐츠연구원)

초록
AI-Helper 아이콘AI-Helper

수요 예측은 영화 산업에서 매우 중요한 문제이다. 최근 들어 트위터(Twitter), 페이스북(Facebook)과 같은 소셜미디어의 비정형 텍스트 데이터를 이용하여 영화 흥행을 예측하고 분석하는 시도들이 활발하게 이루어지고 있다. 기존에는 주로 데이터의 주기별 변화량을 측정하여 데이터 양과 영화 흥행간의 상관성을 분석하거나 데이터에 대해 감성의 극성 값을 부여하는 오피니언 마이닝을 통해 영화의 흥행 추이를 예측하였다. 하지만 이러한 정량적 접근만으로는 관객들이 영화를 선택하게 된 근거나 영화의 어떤 속성을 선호하는지를 알 수 없기 때문에 영화의 흥행 요인을 밝히는데 한계가 있었다. 따라서 본 연구는 트위터 데이터를 수집한 후 빈도수 측정을 통해 트윗의 내용을 대표하는 토픽(topic) 키워드를 추출하여 관객들의 관심을 반영하는 영화적 속성들이 무엇인지를 밝히고, 그 속성들에 대한 관객들의 반응을 분석함으로써 영화의 흥행에 영향을 미친 요인들을 제시한다.

Abstract AI-Helper 아이콘AI-Helper

The demand prediction is a critical issue for the film industry. As the social media, such as Twitter and Facebook, gains momentum of late, considerable efforts are being dedicated to prediction and analysis of hit movies based on unstructured text data. For prediction of trends found in commerciall...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 부림사건과 고 노무현 대통령을 모티프로 한 이 영화는 정치적 소재로 인해 개봉 전부터 사회적 논란과 화제를 불러 일으키며 개봉 33일만에 천만 관객을 돌파하였고 트위터를 통해 활발한 담론이 형성되었다. 따라서 관객들의 영화 선택이 무엇에 근거하여 이루어졌는지를 분석하여 영화 흥행의 요인을 연구하는데 적합하다고 판단하였다.
  • 텍스트에 대한감성의 극성 분류는 중요하고 유용한 문제이지만 감성 극성의 결과만으로는 사용자들이 무엇을 좋아하고 싫어하는지는 발견할 수 없다. 따라서 본 논문은 정량적 분석 결과에 근거하여 트위터의 내용을 분석하는 정성적 분석을 통해 관객들이 영화의 어떤 속성을 선호하는지를 살펴봄으로써 영화 흥행의 주요 요인을 밝혀보고자 한다.
  • 위에서 기술했듯이, 트위터 분석에서 토픽은 사용자들의 관심과 흥미를 반영한 키워드이기 때문에 방대한 양의 트윗의 내용을 직관적으로 이해하는데 유용하다. 따라서 본 연구에서는 트위터에서 빈번하게 출현한 고빈도 명사들은 관객들이 영화에 대해 관심을 갖고 있는 대상이 무엇인지를 보여주고 있기 때문에 토픽 키워드로 간주하였다. 표는 1위부터 20위에 해당하는 토픽들을 나타낸 것이다.
  • 본 연구는 2013년 12월 18일에 개봉했던 영화 의 트위터 데이터를 분석하여 관객들이 영화의 어떤 속성을 선호하는지를 살펴봄으로써 영화 흥행의 주요 요인을 밝히는 것을 목적으로 한다.
  • 본 연구는 영화 을 천만 흥행으로 이끈 요소들이 무엇인지를 밝혀내는 것을 목적으로 하였다.
  • 이 키워드들은 관객들이 해당 영화에 대해 가장 관심을 갖는 것이 무엇인지를 보여주는 지표이자 관객들이 영화를 선택한 구체적인 동기를 나타낸다. 본 연구는 토픽 추출에서 그치지 않고 토픽들이 시간에 따라 그 비율이 어떻게 정량적으로 변화하는지를 보여주었다.
  • 하지만 정량적 분석만으로는 영화의 흥행 요인을 밝히는데 한계가 있으며, 감성 극성의 결과 값만으로는 관객들이 영화의 어떤 속성을 좋아하는지는 알 수 없다. 본 연구는 트윗으로부터 빈도수 기반의 토픽을 추출하여 관객들이 관심을 갖고 있는 영화의 속성을 제시하고 그 속성들에 대해 관객들의 반응을 분석했다는 점에서 의미가 있다.
  • 명사만을 고려한 이유는 명사는 텍스트에서 가장 높은 빈도를 보이는 품사로써 중요한 정보를 전달하기 때문이며[20], 문장에서 명사만으로도 내용의 핵심을 파악하는 것이 가능하기 때문이다[21]. 본 연구에서는 트위터에서 빈번하게 출현한 명사를 토픽으로 정의하였다. 트위터 분석에서 토픽은 “화제가 되는 키워드 혹은 화제가 되는 키워드와 관련된 이야깃거리[21]”를 의미한다.
  • 따라서 영화 <변호인>의 흥행에 가장 긍정적인 영향을 미친 영화적 속성을 스토리와 감독, 배우로 요약할 수 있다. 이 장에서는 스토리와 감독, 배우에 대해 언급한 트윗의 발생 비율과 이 세 가지 요소에 대한 관객들의 구체적인 반응을 살펴보고자 한다.

가설 설정

  • 트위터 분석에서 토픽은 “화제가 되는 키워드 혹은 화제가 되는 키워드와 관련된 이야깃거리[21]”를 의미한다. 높은 빈도를 보이는 토픽들은 관객들이 영화에 대해 관심을 가지는 대상이 무엇인지를 보여주기 때문에 관객이 영화를 선택하는 근거로 가정하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
트위터가 실제 세계에서 일어나고 있는 사건을 실시간으로 인식할 수 있는 구조적 장점을 갖는 이유는 무엇인가? 소셜 빅데이터는 시간에 따른 사용자들의 의견과 감정의 변화를 추적하거나, 사건과 이슈를 감지하는데 유용하다. 특히 높은 근접성과 간결성을 특징으로 하는 트위터는 140글자 메시지인 트윗(tweet)을 전달하는 리트윗(retweet) 기능과 단방향 관계를 통해 정보를 확산시킬 수 있기 때문에 실제 세계에서 일어나고 있는 사건을 실시간으로 인식할 수 있는 구조적 장점을 갖고 있다.
소셜 빅데이터 분석은 무엇인가? 소셜 빅데이터 분석은 다양한 형태의 소셜미디어에서 실시간으로 생성되는 대규모의 데이터를 수집하고 분석하여 통찰을 이끌어내는 것[3]을 의미한다.
최근 많은 분야에서 소셜미디어에 올라오는 의견을 분석하고 의미를 추출하여 이를 활용하려는 시도들의 예로 들 수 있는 것은 무엇인가? 최근 들어 많은 분야에서 소셜미디어에 올라오는 의견을 분석하고 의미를 추출하여 이를 활용하려는 시도들이 활발하게 이루어지고 있다. 예를 들어 기업들은 분석을 통해 자사 이미지와 제품에 대한 여론을 분석하고 소비자의 니즈를 발견하여 신속한 대응을 하는 등기업의 리스크 관리와 경쟁력 확보를 위한 중요한 도구로 삼고 있다. 또한 선거 기간 동안 트위터의 데이터를 분석하여 선거의 흐름과 판도를 예측하기도 한다. 영화 산업도 예외가 아니다. 영화는 소셜미디어에서 광범위하게 언급되는 문화콘텐츠로써 소셜 분석의 좋은 주제가 될 수 있다. 영화 산업에서의 소셜미디어 활용 연구는 SNS에 올라오는 영화 관련 데이터를 이용한 영화 흥행 예측[4-12]과 영화 마케팅에서의 소셜미디어 활용[13-16], 그리고 SNS 데이터에 내재된 개인 성향 분석을 통한 맞춤형 영화 추천 시스템[17-19]으로 정리될 수 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (33)

  1. 시로타 마코타, 김성재 역, 빅데이터의 충격, 한빛 미디어, p.26, 2013. 

  2. 송길영, "Social Big Data Mining Service : 활용의 예", 한국 IT 서비스 학회 학술대회 논문집, Vol.2012, No.3, pp.161-187, 2012. 

  3. 황승구, 최완, 장명길, 이미영, 허성진, 빅데이터 플랫폼 전략, 전자신문사, p.150, 2013. 

  4. 강지훈, 박찬희, 도형록, 김성범, "데이터마이닝기법을 활용한 영화 흥행 실적 예측 기법", 대한 산업공학회 춘계학술대회논문집, Vol.2014, No.5, pp.142-154, 2014. 

  5. 권선주, "영화 흥행성과의 분석과 예측: 뉴스와 웹사이트 데이터 이용", 한국문화경제학회 문화경제연구, 제17권, 제1호, pp.35-56, 2014. 

  6. 김연형, 홍정한, "영화흥행 결정요인과 흥행성과 예측연구", 한국통계학회 논문집, 제18권, 제6호, pp.859-869, 2011. 

  7. 김진욱, "영화 마케팅의 빅데이터 활용 효과에 관한 연구", Vol.8, No.2, pp.349-356, 2014. 

  8. G. Mishne and N. S. Glance, "Predicting Movie Sales from Blogger Sentiment," In AAAI Spring Symposium: Computational Approaches to Analyzing Weblogs, pp.155-158, 2006. 

  9. L. Lica and M. Tuta, "Predicting Product Performance with Social Media," nformatics in education, Vol.15, No.2, pp.46-56, 2011. 

  10. M. Joshi, D. Das, K. Gimpel, and N. A. Smith, "Movie reviews and revenues: An experiment in text regression," In Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics(NAACL-HLT), Association for Computational Linguistics, pp.293-296, 2010. 

  11. S. Asur and B. A. Huberman, "Predicting the future with social media," in Web Intelligence and Intelligent Agent Technology (WI-IAT), 2010 IEEE/WIC/ACM International Conference on, 2010, Vol.1, No.6, pp.492-499, 2010. 

  12. T. Kim, J. Hong, and H. Koo, "Forecasting Box-Office Revenue by Considering Social Network Services in the Korean Market," Sains Humanika, Vol.64, No.2, 2013. 

  13. 김혜원, "저예산 영화 마케팅에서의 트위터 활용 방안", Vol.11, No.1, pp.111-130, 2011. 

  14. 안지혜, 민병현, "영화 마케팅 채널로서 소셜미디어의 가능성 : 다큐멘터리 영화 트위터 마케팅 사례를 중심으로", 한국콘텐츠학회논문지, Vol.11, No.6, pp.228-241, 2011. 

  15. A. Elberse and B. Anand, "The effectiveness of pre-release advertising for motion pictures: An empirical investigation using a simulated market," Information Economics and Policy, Vol.19, No.3, pp.319-343, 2007. 

  16. F. Zufryden, "Linking Advertising to Box Office Performance of New Film Releases-A Marketing Planning Model," Journal of Advertising Research, Vol.36, No.4, pp.29-42, 1996. 

  17. 이오준, 백영태, "협업 필터링 추천 시스템을 위한 데이터 신뢰도 기반 가중치를 이용한 하이브리드 선호도", 한국컴퓨터정보학회지논문, Vol.19, No.5, pp.61-69, 2014. 

  18. M. Balabanovic and Y. Shoham, "Fab: content-based, collaborative recommendation," Communications of the ACM, Vol.40, No.3, pp.66-72, 1997. 

  19. R. Mukherjee, N. Sajja, and S. Sen, "A movie recommendation system-an application of voting theory in user modeling," User Modeling and User-Adapted Interaction, Vol.13, No1, pp.5-33, 2003. 

  20. 강범모, 김흥규, "명사 빈도의 변화, 사회적 관심의 트렌드 : 물결 21 코퍼스[2000-2009]", 언어학, Vol.61, pp.3-38, 2011. 

  21. 강성진, 군집화 기법과 문서 순위를 이용한 한국어 트윗 상의 토픽 추출, 서울대학교 대학원 석사학위 논문, p.14, 2013. 

  22. L. Doshi, J. Krauss, S. Nann, and P. Gloor, "Predicting movie prices through dynamic social network analysis," Pcocedia-Social and Behavioral Sciences, Vol.2, No.4, pp.6423-6433, 2010. 

  23. S. Kim, S. Jeon, J. Kim, Y. H. Park, and H. Yu, "Finding core topics : Topic extraction with clustering on tweet," In Cloud and Green Computing, 2012 Second International Conference, IEEE, pp.777-782, 2012. 

  24. X. Ni, X.Quan, Z. Lu, L. Wenyin, and B. Hua, "Short text clustering by finding core terms," Knowledge and information systems, Vol.27, No.3, pp.345-365, 2011. 

  25. 허민회, 강필성, 조성준, "오피니언 마이닝을 이용한 영화 흥행의 예측", 2013 한국경영과학회/대한산업공학회 춘계공동학술대회 논문집, Vol.2013, No.5, pp.487-500, 2013. 

  26. 박선영, "SNS를 통한 구전 효과가 영화 흥행에 미치는 영향- 의 사례를 중심으로", 한국콘텐츠학회논문지, Vol.12, No7, pp.40-53, 2012. 

  27. http://fizziolo.gy/products/ 

  28. http://www.mezzomedia.co.kr/mezzomediasocial-analysis/ 

  29. http://wstarnews.hankyung.com/apps/news?popup0&nid01&c101&c201&c300&nkey201305091632321&modesub_view 

  30. www.pulsek.com 

  31. http://ko.wikipedia.org/wiki/%EC%9B%B9_%ED%81%AC%EB%A1%A4%EB%9F%AC 

  32. http://kldp.net/projects/hannanum 

  33. http://docs.oracle.com/javase/7/docs/api/java/util/TreeMap.html 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로