본 연구에서는 영화 관람 후 높은 평점을 매긴 집단과 낮은 평점을 매긴 집단 중 어느 집단이 영화에 대해 더 많은 이야기를 하는지, 즉 온라인 리뷰를 길게 작성하는지에 대해 알아보고자 하였다. 이를 위해 네이버 영화 API에서 제공하는 영화 평점과 리뷰 데이터를 수집하였고, 한국영화진흥위원회에서 제공하는 영화 손익분기점 데이터를 이용하여 영화를 흥행성공, 흥행부진, 흥행실패로 구분하여 영화 평점과 리뷰길이 간의 상관관계, 영화 개봉 전과 후, 흥행여부에 따른 리뷰길이의 특성, 마지막으로 영화 평점이 리뷰길이에 영향을 미치는가에 대한 회귀분석을 실시하여 제시하였다.
본 연구에서는 영화 관람 후 높은 평점을 매긴 집단과 낮은 평점을 매긴 집단 중 어느 집단이 영화에 대해 더 많은 이야기를 하는지, 즉 온라인 리뷰를 길게 작성하는지에 대해 알아보고자 하였다. 이를 위해 네이버 영화 API에서 제공하는 영화 평점과 리뷰 데이터를 수집하였고, 한국영화진흥위원회에서 제공하는 영화 손익분기점 데이터를 이용하여 영화를 흥행성공, 흥행부진, 흥행실패로 구분하여 영화 평점과 리뷰길이 간의 상관관계, 영화 개봉 전과 후, 흥행여부에 따른 리뷰길이의 특성, 마지막으로 영화 평점이 리뷰길이에 영향을 미치는가에 대한 회귀분석을 실시하여 제시하였다.
The study aims to determine which groups leave longer(more active) online reviews(comments) on the film by separating groups, one that satisfied with the movie while the other group dissatisfied with the movie. The data used were rating scores and reviews(comments) from Naver Movie API, and break-ev...
The study aims to determine which groups leave longer(more active) online reviews(comments) on the film by separating groups, one that satisfied with the movie while the other group dissatisfied with the movie. The data used were rating scores and reviews(comments) from Naver Movie API, and break-even point data provided by Korea Film Commission. We analyzed the relationship between movie rating and review length, before and after movie opening, the characteristics of review length according to the box office, and whether the movie rating affects the review length.
The study aims to determine which groups leave longer(more active) online reviews(comments) on the film by separating groups, one that satisfied with the movie while the other group dissatisfied with the movie. The data used were rating scores and reviews(comments) from Naver Movie API, and break-even point data provided by Korea Film Commission. We analyzed the relationship between movie rating and review length, before and after movie opening, the characteristics of review length according to the box office, and whether the movie rating affects the review length.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 영화에 만족하여 높은 평점을 매긴 집단 혹은 영화에 불만족하여 낮은 평점을 매긴 집단 중 어느 집단이 영화에 대해 더 많은 이야기를 하는지, 즉 리뷰를 길게 작성하는지에 대해 알아보고자 하였다. 이를 위해 2017년 5월까지 개봉한 20개 영화의 총 123,014건(개봉 전: 11,141건 / 개봉 후: 111,873건) 데이터를 수집하였고, 평점과 리뷰길이를 분석 데이터로 활용하였다.
본 연구의 의의는 영화 리뷰길이에 대한 기존의 연구가 미비한 상황에서 영화 관람 후 소비자의 만족 혹은 불만족이 리뷰 작성에 어떠한 영향을 미치는가에 대해 데이터기반 분석을 시도하여 영화 개봉 후의 결과에서 평점과 리뷰길이와의 상관관계를 발견한 것이다.
제안 방법
구체적인 분석을 위해 본 연구에서는 한국영화진흥위원회에서 제공하는 20개 영화의 총 관객 수와 영화사에서 발표하는 손익분기점을 기준으로 영화 별 손익분기점 대비 달성률을 산출하여[표 1] 영화의 흥행여부를 흥행성공, 흥행부진, 흥행실패로 정의하였다. 분석대상인 20개 영화의 흥행구분은 다음과 같다.
두 번째는 20개 영화를 개봉 전, 후 및 흥행 여부 세 가지로 조합하여 각 그룹의 리뷰길이의 특성을 비교 분석하여 제시하였다.
수집한 개별 리뷰에 대하여 리뷰길이를 산출하였고,이것을 리뷰 수로 나누어 각 영화에 대한 평균길이를 구하였다. 또한 영화의 개봉 전과 후를 기준으로 영화의 흥행여부(성공, 부진, 실패)에 따라 리뷰 수와 리뷰길이가 어떻게 변화하는지를 분석하기 위하여 영화 개봉 전과 후를 기준으로 총 리뷰길이를 리뷰 수로 나누어 평균길이를 구하였다. 전체 영화 20개에대한 총 리뷰 수, 총 리뷰길이, 평균 리뷰길이는 [표 3]과 같다.
마지막으로 연구문제에 대한 결과를 도출하기 위하여 다음의 총 3단계의 분석을 진행하였다.
본 연구에서는 앞에서 언급한 각 영화의 리뷰 수, 평균 리뷰길이, 그리고 개별 리뷰의 작성날짜와 리뷰길이를 본 연구의 모델구축을 위한 변수로 사용하였으며 각 변수에 대한 정의는 다음과 같다.
기존의 영화 리뷰에 대한 분석은 주로 영화 평점(감성)과 흥행간의 관계를 다룬 연구들이 다수를 이루고 있다[10-12]. 본 연구에서는 영화 평점과 흥행간의 관계를 고려할 때 140자라는 제한된 리뷰의 길이를 변수로 활용하여 영화 평점(감성)과 리뷰길이와의 관계, 그리고 영화 관람 후 긍정 또는 부정 중 어느 감성이 리뷰를 더 적극적으로 작성하는 지를 영화의 흥행성공, 부진, 실패의 측면에서 분석하였다.
수집한 개별 리뷰에 대하여 리뷰길이를 산출하였고,이것을 리뷰 수로 나누어 각 영화에 대한 평균길이를 구하였다. 또한 영화의 개봉 전과 후를 기준으로 영화의 흥행여부(성공, 부진, 실패)에 따라 리뷰 수와 리뷰길이가 어떻게 변화하는지를 분석하기 위하여 영화 개봉 전과 후를 기준으로 총 리뷰길이를 리뷰 수로 나누어 평균길이를 구하였다.
이를 위해 2017년 5월까지 개봉한 20개 영화의 총 123,014건(개봉 전: 11,141건 / 개봉 후: 111,873건) 데이터를 수집하였고, 평점과 리뷰길이를 분석 데이터로 활용하였다. 영화 간 분류를 위해 영화의 손익분기점 달성률을 기준으로 흥행여부를 흥행성공, 흥행부진, 흥행실패 세 그룹으로 분류하였고 추가적으로 개봉 전과 후로 구분하여 총 여섯 개의 카테고리로 영화를 그룹화하여 분석을 진행하였다.
대상 데이터
이러한 영화들은 본 연구에서 분석하고자 하는 영화 관람 후 만족 또는 불만족을 표현한 리뷰의 수가 적고, 분석 결과의 신뢰도와 타당도 또한 문제가 있을 것으로 판단되어 분석에서 제외하였다. 따라서 본 연구에서는 총 165개의 영화 중 관객 수가 10만 명 이상이었던 상업 영화 20편을 대상으로 분석을 진행하였다.
본 연구는 2017년 1월부터 5월까지의 짧은 기간 동안 2017년 개봉영화 20편의 데이터를 수집·분석하였다.
본 연구는 영화진흥위원회 사이트 기준으로 2017년 상반기에 개봉한 한국 영화 20편을 대상으로 하였다. 분석 기준인 영화의 흥행을 측정하는 방식을 정의함에 있어서 미국의 경우 박스 오피스(box office)라는 명칭으로 매출액을 성과의 기준으로 하거나 관객 수(admission)를 성과의 기준으로 할 수 있는데[22], 본연구에서는 두 가지를 모두 채택하였다.
분석 기간은 2017년 1월부터 5월까지로, 이 기간 한국 영화는 총 165편을 개봉하였다. 그러나 전국 기준으로 관객 수 10만 명을 넘긴 영화는 22편으로 13%에 불과하였고, 이 중 100만 명을 넘긴 영화는 7편으로 전체 4%에 그쳤다.
선정된 20개 영화의 평점과 리뷰의 분석을 위해 국내에서 가장 방대한 영화 데이터베이스인 네이버 영화(movie.naver.com)에서 개봉 전과 개봉 후 데이터를 API를 통해 수집하였다. 자바(Java) 기반의 크롤러를 작성하여 개봉 전 11,141건과 개봉 후 133,454건, 총 144,595건의 데이터가 수집되었다.
본 연구에서는 영화에 만족하여 높은 평점을 매긴 집단 혹은 영화에 불만족하여 낮은 평점을 매긴 집단 중 어느 집단이 영화에 대해 더 많은 이야기를 하는지, 즉 리뷰를 길게 작성하는지에 대해 알아보고자 하였다. 이를 위해 2017년 5월까지 개봉한 20개 영화의 총 123,014건(개봉 전: 11,141건 / 개봉 후: 111,873건) 데이터를 수집하였고, 평점과 리뷰길이를 분석 데이터로 활용하였다. 영화 간 분류를 위해 영화의 손익분기점 달성률을 기준으로 흥행여부를 흥행성공, 흥행부진, 흥행실패 세 그룹으로 분류하였고 추가적으로 개봉 전과 후로 구분하여 총 여섯 개의 카테고리로 영화를 그룹화하여 분석을 진행하였다.
com)에서 개봉 전과 개봉 후 데이터를 API를 통해 수집하였다. 자바(Java) 기반의 크롤러를 작성하여 개봉 전 11,141건과 개봉 후 133,454건, 총 144,595건의 데이터가 수집되었다.
데이터처리
마지막으로 영화 평점이 리뷰길이에 미치는 영향이 유의한지 검증하기 위하여 영화 평점을 독립변수로 설정하여 단순회귀분석을 실시하였다.
3. 영화 평점이 리뷰길이에 미치는 영향
영화 평점이 길이에 미치는 영향이 유의한지 검증하기 위하여 영화 평점을 독립변수로 설정하여 단순회귀분석을 실시하였다[표 5]. 개봉 전(BF)에는 흥행성공영화의 경우 R2는 0.
첫 번째는 영화 평점과 리뷰길이 간 상관관계를 알아보기 위하여 Pearson의 이변량 상관분석을 실시하였다.
첫 번째는 영화 평점과 리뷰길이 간 상관관계를 알아보기 위하여 Pearson의 이변량 상관분석을 실시하였다.
성능/효과
7글자로 평점 2점에서 가장 높았다. AF의 그래프를 살펴보면 불한당을 제외한 4개 영화와 평균 AF에서는 평점 3점 이하에서 가장 많은 평균길이가 있었고 우하향하는 흐름이 나타났다. BF에서는 평점과 그래프에서공통적인 특성을 발견할 수 없었다.
3글자로 평점 2점에서 가장 높다. AF의 그래프를 살펴보면 프리즌을 제외한 5개 영화와 평균 AF에서는 평점 3점 이하에서 가장 많은 평균길이가 있었고 우하향하는흐름이 나타났다. BF에서는 ‘흥행부진’과 마찬가지로평점과 그래프에서 공통적인 특성을 발견할 수 없었다.
개봉 후 흥행성공과 흥행부진 영화의 평균 리뷰길이는 2점을 부여한 집단에서 가장 높게 집계되었으며 낮은 평점에서 많고 높은 평점에서 적은 우하향 형태를 나타내었다. 하지만 흥행실패 영화의 경우 4점을 부여한 집단에서 가장 높게 집계되었고 약한 우하향 형태를 보였지만 상관분석과 회귀분석 결과 유의미하지 않은 것으로 분석되었다.
데이터 분석 결과, 개봉 전 흥행성공과 흥행부진 영화의 평균 리뷰길이는 5점을 부여한 집단에서 가장 높게 집계되었다. 흥행실패 영화의 경우 4점을 부여한 집단에서 가장 높게 집계되었고 그래프 상에서 유의미한 결과를 찾지 못하였다.
데이터 분석 결과와 통계적 검증 결과를 종합하여 보면, 영화 개봉 후 관람한 소비자들의 경우, 영화에 대해 불만족스러울 경우(낮은 평점)가 만족스러운 경우(높은 평점)보다 상대적으로 영화에 대해 더 많은 의견을 제시하는 것으로 나타났다. 이를 해석해보면, 영화를 재미있게 본 사람들은 영화에 대한 리뷰를 쓸 때, 좋은 평점을 남기고 왜 이 영화가 좋은지에 대해 길게 남기지 않는 반면, 영화에 대해 불만족한 사람들은 리뷰를 쓸 때, 이 영화가 왜 재미가 없는지에 대해 더 구체적으로 설명하며 비교적 긴 리뷰를 작성한다고 볼 수 있다.
흥행실패 영화의 경우 4점을 부여한 집단에서 가장 높게 집계되었고 그래프 상에서 유의미한 결과를 찾지 못하였다. 또한 상관분석, 회귀분석에서도 통계적으로 유의미하지 않은 것으로 분석되었다.
박승현, 송현주[14]는 온라인 평가 항목을 온라인 평가 빈도와 평균 평점으로 구별하여 온라인 구전 정보와 영화의 흥행성과 간의 관계를 분석하였다. 분석결과에 따르면, 개봉 이전 기간에 나타난 온라인 구전은 전체 흥행성과뿐만 아니라 주별 흥행성과에도 유의미한 영향력을 보여주는 것으로 나타났다.
비교 분석 결과 영화 개봉 후에는 흥행성공과 흥행부진 영화에서는 2점에서 평균길이가 가장 많이 나타났으며, 강하게 우하향하는 형태의 그래프를 보인다. 이는 영화에 불만족한 사람들이 평균적으로 이야기를 더 많이 하고, 만족한 사람들은 상대적으로 적게 이야기했다고 해석할 수 있으며 이 결과는 영화 평점과 리뷰길이의 상관관계 분석결과도 일치한다.
[그림 2]는 20개 영화의 BF, AF 데이터, 총 40개의 평균길이를 흥행성공, 흥행부진, 흥행실패로 산출한 결과이다. 흥행성공과 흥행부진의 AF 데이터를 살펴보면 평균길이가 대체로 낮은 평점에서 많고, 높은 평점에서 완만히 우하향하는 형태의 그래프 결과가 공통적으로 나타났다. 그러나 흥행실패 AF와 흥행성공, 부진, 실패영화의 BF에서는 이러한 형태가 나타나지 않았다.
후속연구
이를 극복하기 위하여 향후 연구에서는 더 많은 개봉영화를 대상으로 본 연구의 방법론을 적용하여 분석하여 봄으로써 연구결과의 일반화가 가능한지 가늠해보는 시도가 필요할 것이다. 또한 후속 연구로 영화 평점 외의 추가적인 요인들, 예를 들면 리뷰 내용 속 출현 단어나 영화의 장르, 출연진, 제작진 등 소비자의 선호도 등의 요인을 추가하여 리뷰 길이와 영화 흥행의 상관관계의 통제 변수로 활용하는 것도 유의미한 결과를 돌출해 낼 수 있으리라 예상한다.
따라서 제한된 표본 수로 인한 결론의 타당성 또는 일반화의 한계가 존재할 수 있다. 이를 극복하기 위하여 향후 연구에서는 더 많은 개봉영화를 대상으로 본 연구의 방법론을 적용하여 분석하여 봄으로써 연구결과의 일반화가 가능한지 가늠해보는 시도가 필요할 것이다. 또한 후속 연구로 영화 평점 외의 추가적인 요인들, 예를 들면 리뷰 내용 속 출현 단어나 영화의 장르, 출연진, 제작진 등 소비자의 선호도 등의 요인을 추가하여 리뷰 길이와 영화 흥행의 상관관계의 통제 변수로 활용하는 것도 유의미한 결과를 돌출해 낼 수 있으리라 예상한다.
질의응답
핵심어
질문
논문에서 추출한 답변
온라인 영화 리뷰란 무엇인가?
영화는 경험재적 속성을 갖고 있기에 개인이 직접 소비하기 이전에 전문가 비평이나 인터넷으로 쉽게 접근할 수 있는 온라인 영화 리뷰를 활용하는 것이 일반적이다. 온라인 영화 리뷰는 영화 관람객들이 자신의 생각이나 의견 및 경험들을 자발적으로 온라인에서 표현하는 행위로 영화를 이미 관람한 이용자들이 해당 영화에 대해 평점과 후기를 공개함으로써 영화를 아직 관람하지 못한 잠재적 이용자들에게 영향을 미치게 된다[1][2]. 최근에는 인터넷과 통신기술의 발달로 이용자들이 온라인영화 리뷰를 과거보다 더 쉽게 접근할 수 있게 되어 그 영향력은 점점 더 커지고 있다고 할 수 있다[3].
본 연구에서 리뷰의 길이가 자발성과 적극성이 반영된 결과라고 해석하는 이유는 무엇 때문인가?
영화 리뷰 작성행위가 ‘자발성’ 또는 ‘적극성’으로 이루어진다고 가정하였을 때, 리뷰의 길이는 작성자의 ‘자발성’ 또는 ‘적극성’이 반영된 결과라고 할 수 있다. 왜냐하면 어휘가 많고 길이가 긴 글이 짧은 글에 비해 주제에 관한 내용 지식이 풍부하며 하고 싶은 말이 많다고 볼 수 있기 때문이다[6-8]. 또한 글의 길이가 길다는 것은 글을 쓰려고 했던 의지가 크고, 하고 싶은 말을 많이 만들어냈거나 찾았다는 의미로 해석할 수 있다[7][9].
본 연구에서 영화 간 분류를 위해 흥행여부를 세 그룹으로 분류하였는데, 그 분류 기준은 무엇인가?
이를 위해 2017년 5월까지 개봉한 20개 영화의 총 123,014건(개봉 전: 11,141건 / 개봉 후: 111,873건) 데이터를 수집하였고, 평점과 리뷰길이를 분석 데이터로 활용하였다. 영화 간 분류를 위해 영화의 손익분기점 달성률을 기준으로 흥행여부를 흥행성공, 흥행부진, 흥행실패 세 그룹으로 분류하였고 추가적으로 개봉 전과 후로 구분하여 총 여섯 개의 카테고리로 영화를 그룹화하여 분석을 진행하였다.
참고문헌 (22)
박지연, 전범수, "네티즌의 흥행 영화 리뷰에 포함된 감정 동사 이용 특성 연구," 한국콘텐츠학회논문지, 제14권, 제5호, pp.85-94, 2014.
A. Chakravarty, Y. Liu, and T. Mazumdar, "The Differential Effects of Online Word-ofMouth and Critics' Reviews on Pre-Release Movie Evaluation," Journal of Interactive Marketing, Vol.24, No.3, pp.185-197, 2009.
W. Duan, B. Gu, and A. B. Whinston, "Do online reviews matter?-An empirical investigation of panel data," Decision support systems, Vol.45, No.4, pp.1007-1016, 2008.
S. W. Sussman and W. S. Siegal, "Informational Influence in Organizations: An Integrated Approach to Knowledge Adoption," Information Systems Research, Vol.14, No.1, pp.47-65, 2003.
M. Clement, D. Proppe, and A. Rott, "Do critics make bestsellers? Opinion leaders and the success of books," Journal of Media Economics, Vol.20, No.2, pp.77-105, 2007.
J. Chesky and E. H. Hiebert, "The effect of prior knowledge and audience on high school students' writing," Journal of Educational Research, Vol.80, No.5, pp.304-313, 1987.
여등승, 임규건, "온라인 영화관련 댓글의 양과 방향성이 구전 의도에 미치는 영향에 관한 연구," 한국 IT 서비스학회 학술대회 논문집, Vol.2014, pp.429-432, 2014.
K. Adwait, Lauren I. Labrecque, and Anthony K. Asare, "The Assimilative and Contrastive Effects of Word-of-Mouth Volume: An Experimental Examination of Online Consumer Ratings," Journal of Retailing, Vol.87, No.1, pp.111-126, 2011.
D. Wenjing, B. Gu, and A. B. Whinston, "The Dynamics of Online Word-of-Mouth and Product Sales―An Empirical Investigation of the Movie Industry," Journal of Retailing, Vol.84, No.2, pp.233-242, 2008.
최지은, "항상 온라인 리뷰수가 많을수록 좋은가? : 영화 평점에 대한 소비자반응을 중심으로," 광고학연구, 제24권, 제7호. pp.87-103, 2013.
C. H. Wee, S. L. Lim, and M. Lewin, "Words-of-mouth communication in Singapore: With focus on effects of message-sidedness, source and user-type," Asia Pacific Journal of Marketing and Logistics, Vol.1, No.2, pp.5-36, 1995.
B. Liu, "Sentiment analysis and opinion mining," Synthesis Lectures on Human Language Technologies, Vol.5, No.1, pp.1-167, 2012.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.