본 연구는 소셜 빅데이터에 기반을 둔 유명인과 브랜드의 이미지 유사도가 광고효과를 예측할 수 있는 결정변수가 될 수 있는지를 파악하기 위해, 광고효과 예측모형을 생성하고 빅데이터 분석기법인 기계학습 방법을 통해 그 타당도를 검증하는 것을 목적으로 하였다. 이를 위해 SNS상의 키워드 네트워크 구조에 기반하여 유명인-브랜드 이미지 유사도를 정량화하고, 학습 데이터를 통해 이미지 유사도를 독립변수로, 광고효과 데이터를 종속변수로 하는 다중회귀모형을 반복 실시하여 광고효과 예측모형을 생성하였다. 이렇게 생성된 예측모형의 정확도를 판단하기 위해 예측 데이터에서 얻은 광고효과 예측값과 비교 기준으로서의 서베이값을 비교한 결과, 타당도를 판단하는 기준치인 75%의 분류 정확도를 보였으므로 본 광고효과 예측 모델링의 타당성은 확보된 것으로 입증되었다. 본 연구는 유명인-브랜드 이미지 유사성 구조를 소셜 네트워크 구조로 설명하고 그 효과를 기계학습을 통한 예측 모델링으로 검증하여 빅데이터 기반 모델링 연구에 새로운 방법론적 대안과 방향을 제시하였다.
본 연구는 소셜 빅데이터에 기반을 둔 유명인과 브랜드의 이미지 유사도가 광고효과를 예측할 수 있는 결정변수가 될 수 있는지를 파악하기 위해, 광고효과 예측모형을 생성하고 빅데이터 분석기법인 기계학습 방법을 통해 그 타당도를 검증하는 것을 목적으로 하였다. 이를 위해 SNS상의 키워드 네트워크 구조에 기반하여 유명인-브랜드 이미지 유사도를 정량화하고, 학습 데이터를 통해 이미지 유사도를 독립변수로, 광고효과 데이터를 종속변수로 하는 다중회귀모형을 반복 실시하여 광고효과 예측모형을 생성하였다. 이렇게 생성된 예측모형의 정확도를 판단하기 위해 예측 데이터에서 얻은 광고효과 예측값과 비교 기준으로서의 서베이값을 비교한 결과, 타당도를 판단하는 기준치인 75%의 분류 정확도를 보였으므로 본 광고효과 예측 모델링의 타당성은 확보된 것으로 입증되었다. 본 연구는 유명인-브랜드 이미지 유사성 구조를 소셜 네트워크 구조로 설명하고 그 효과를 기계학습을 통한 예측 모델링으로 검증하여 빅데이터 기반 모델링 연구에 새로운 방법론적 대안과 방향을 제시하였다.
The purpose of this study is to find out whether image similarity between celebrities and brands on social network service be a determinant to predict advertising effectiveness. To this end, an advertising effect prediction model for celebrity endorsed advertising was created and its validity was ve...
The purpose of this study is to find out whether image similarity between celebrities and brands on social network service be a determinant to predict advertising effectiveness. To this end, an advertising effect prediction model for celebrity endorsed advertising was created and its validity was verified through a machine learning method which is a big data analysis technique. Firstly, the celebrity-brand image similarity, which was used as an independent variable, was quantified by the association network theory with social big data, and secondly a multiple regression model which used data representing advertising effects as a dependent variable was repeatedly conducted to generate an advertising effect prediction model. The accuracy of the prediction model was decided by comparing the prediction results with the survey outcomes. As for a result, it was proved that the validity of the predictive modeling of advertising effects was secured since the classification accuracy of 75%, which is a criterion for judging validity, was shown. This study suggested a new methodological alternative and direction for big data-based modeling research through celebrity-brand image similarity structure based on social network theory, and effect prediction modeling by machine learning.
The purpose of this study is to find out whether image similarity between celebrities and brands on social network service be a determinant to predict advertising effectiveness. To this end, an advertising effect prediction model for celebrity endorsed advertising was created and its validity was verified through a machine learning method which is a big data analysis technique. Firstly, the celebrity-brand image similarity, which was used as an independent variable, was quantified by the association network theory with social big data, and secondly a multiple regression model which used data representing advertising effects as a dependent variable was repeatedly conducted to generate an advertising effect prediction model. The accuracy of the prediction model was decided by comparing the prediction results with the survey outcomes. As for a result, it was proved that the validity of the predictive modeling of advertising effects was secured since the classification accuracy of 75%, which is a criterion for judging validity, was shown. This study suggested a new methodological alternative and direction for big data-based modeling research through celebrity-brand image similarity structure based on social network theory, and effect prediction modeling by machine learning.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이러한 맥락에서 SNS상에서 생성되는 소비자 여론 역시 수많은 네트워크를 통해 확산되는 경향을 보이므로 네트워크 분석으로 그 의미에 접근해 볼 수 있겠다. 따라서 본 연구에서는 소셜 빅데이터를 통해 수집한 유명인 모델의 이미지와 브랜드 이미지의 키워드를 연상의 기본 단위로 여기고, 연상 네트워크 이론에 근거하여 유명인-브랜드 간 이미지 유사도 분석하고자 한다.
따라서 본 연구에서는 유명인 모델의 개체로서의 이미지를 ‘일반인으로서의 이미지’로 규정하고, 유명인으로서의 사회적 위상에 따라 형성되는 이미지를 ‘유명인으로서의 이미지’로 규정하며, 서사적 구조로 드러나는 유명인의 행동을 ‘사건’으로 규정하여 그 실체를 파악해 보고자 한다.
본 연구의 목적은 첫째, 최근 주목받는 소셜 빅데이터를 활용하여 유명인과 브랜드에 대한 소비자 담론으로 유명인 모델의 이미지 실체를 파악하고, 둘째, 유명인-브랜드 이미지 유사도 연구를 통해 복합체로서의 유명인 모델에 대한 이미지 구조를 새롭게 정립하며, 셋째, SNS 상의 키워드 구조를 연상 네트워크 구조로 접근해 볼 수 있다는 점에 착안하여 유명인과 브랜드의 이미지 유사도 산출 식을 도출하는 것이다. 마지막으로, 유명인-브랜드 이미지 유사도를 독립변인으로 하여 실질적으로 광고효과를 예측할 수 있는지, 유명인 모델에 대한 광고효과 예측모형을 생성하고 그 타당성을 검증하고자 한다.
본 연구는 유명인 이미지를 복합체적인 관점으로 접근하여, 유명인-브랜드 이미지 유사성을 소셜미디어 내의 키워드 네트워크에 기반하여 산출한 후, 이미지 유사성을 독립변수로 하여 유명인의 광고효과 예측모형을 구축하는 것이 목적이다. 따라서 해당 목적을 달성하기 위해 다음의 연구 문제를 도출하였다.
본 연구의 목적은 소셜 빅데이터에 근거하여 유명인 모델과 브랜드의 이미지 유사도를 산출하고, 이러한 이미지 유사도에 근거하여 유명인 모델의 광고효과 예측모형을 구축하는 것이다. 이러한 연구 문제를 해결하기 위해 데이터마이닝 절차에 따라 6가지 모듈(빅데이터 수집 모듈→ 빅데이터 전처리 모듈→ 빅데이터 통합 적재 모듈→ 이미지 유사도 산출 모듈→ 광고효과 학습 모듈→ 광고효과 예측 모듈)로 빅데이터 분석을 실행하였다.
본 연구의 목적은 첫째, 최근 주목받는 소셜 빅데이터를 활용하여 유명인과 브랜드에 대한 소비자 담론으로 유명인 모델의 이미지 실체를 파악하고, 둘째, 유명인-브랜드 이미지 유사도 연구를 통해 복합체로서의 유명인 모델에 대한 이미지 구조를 새롭게 정립하며, 셋째, SNS 상의 키워드 구조를 연상 네트워크 구조로 접근해 볼 수 있다는 점에 착안하여 유명인과 브랜드의 이미지 유사도 산출 식을 도출하는 것이다. 마지막으로, 유명인-브랜드 이미지 유사도를 독립변인으로 하여 실질적으로 광고효과를 예측할 수 있는지, 유명인 모델에 대한 광고효과 예측모형을 생성하고 그 타당성을 검증하고자 한다.
제안 방법
Table 1의 7개 학습 데이터에 대해, 소셜 빅데이터를 통해 도출한 유명인-브랜드 이미지 키워드의 분류 기준별(개체, 역할, 집단관계, 개인 관계, 미분류) 유사도 점수를 독립변수로 하고 서베이를 통한 광고효과 점수를 종속변수로 하여 회귀모형을 도출하고, 독립변수에 해당하는 5개의 키워드 분류 기준별로 회귀계수를 산출하였다. 분석 결과, 전체 회귀모형에 대한 R 값은 0.
유명인 모델의 광고 집행 전 광고효과를 예측할 수 있는 모델링을 하기 위해서는 기존 집행 광고의 성과가 어떠했는지를 알 수 있는 종속변수가 필요하다. 가장 유용한 종속변수는 실제 행동 지표나 공신력 있는 기관에서 발표한 검증된 지표이겠지만, KAA에서 발표했던 효과 지표들이 특정 광고 모델에만 국한되어 산출되었다는 한계가 있으므로, 본 연구에서는 해당 광고에 대해 서베이를 진행하여 소비자 기억에 근거한 광고효과를 측정하여 이를 종속변수로 대체하여 활용하였다. 따라서 본 연구에서는 2가지 유형의 데이터가 분석에 활용되었는데, 하나는 과거에 유명인이 출연했던 광고물에 대한 소셜 빅데이터(독립변수)이고, 다른 하나는 각 광고물의 효과를 측정한 서베이 데이터(종속변수)이다.
우선 학습 모듈에서 생성한 광고효과 예측 모델링을 통해 2건의 광고물에 대한 예측값을 산출하고, 그중 예측값이 높게 나타난 유명인 광고를 예측 모델링에 의해 추천한다. 그리고 이 결과가 서베이를 통해 얻은 추천 결과(앞의 2건의 광고물에 대한 서베이 결과 중 광고효과가 높은 것을 추천한 것)와 일치하는지를 판별하여 분류 예측의 정확도를 산출한다. 이러한 예측의 정확도를 통해 본 예측이 얼마나 타당한지를 판단하게 되는데, 분류 예측에 대한 정확도 판단 기준은 75% 이상 예측 정확도가 산출되었을 때 예측값이 타당하다고 결론 내린다.
우선 유명인과 브랜드의 1차 연관어 중 상위 20개 키워드를 도출하고, 각 키워드에 대해 1차 연관어와 독립되게 추출한 2차 연관어 중 상위 20개 키워드를 추가로 추출하여 공통 키워드 셋(set)을 준비하였다. 그리고 이 공통 키워드가 전체 문서에서 얼마나 자주 출현했는지, 동시 노출된 횟수를 기준으로 유사도 산출 식을 도출하였다.
첫째, 유명인 모델과 브랜드 사이에 공통 키워드가 얼마나 유사한 패턴으로 나타나는지 정량화할 수 있도록 유명인-브랜드 유사도 알고리즘을 산출한다. 둘째, 유명인 모델-브랜드 이미지 유사도가 광고효과에 영향을 주는 주요 변수가 되는 가를 파악하기 위해 기계학습 방법을 통해 유명인 모델의 광고효과 예측 모델링을 실시한다.
가장 유용한 종속변수는 실제 행동 지표나 공신력 있는 기관에서 발표한 검증된 지표이겠지만, KAA에서 발표했던 효과 지표들이 특정 광고 모델에만 국한되어 산출되었다는 한계가 있으므로, 본 연구에서는 해당 광고에 대해 서베이를 진행하여 소비자 기억에 근거한 광고효과를 측정하여 이를 종속변수로 대체하여 활용하였다. 따라서 본 연구에서는 2가지 유형의 데이터가 분석에 활용되었는데, 하나는 과거에 유명인이 출연했던 광고물에 대한 소셜 빅데이터(독립변수)이고, 다른 하나는 각 광고물의 효과를 측정한 서베이 데이터(종속변수)이다.
수집된 문서에서 유의한 분석 키워드를 산출하기 위해서는 불필요한 정보를 제거하고 비정형 데이터를 정형데이터 구조로 변환하는 데이터 전처리 과정이 수반되어야 한다. 따라서 빅데이터 전처리 모듈에서는 수집된 문서에서 목적에 부합하는 분석 키워드를 추출하기 위해 형태소 분석을 통해 불필요한 정보인 가비지(garbage)를 제거하는 데이터 정제 작업을 수행하였다. 또한, 정제된 비정형 데이터를 정형 데이터로 바꾸는 분석을 하였다.
따라서, 유명인-브랜드 유사도 점수를 예측 회귀모형에 투입하기 위해서, 유사도 키워드 분류 기준으로 Table 1과 같이 ‘개체, 역할, 개인 관계, 집단관계, 미분류’의 다섯 가지 유형을 추출하였다.
유명인-브랜드 이미지 유사도로 광고효과를 예측하기 위해, 일단 유명인과 브랜드에서 공통으로 나타난 키워드를 ‘개체, 역할, 개인 관계, 집단관계, 미분류’의 이미지 유사도 분류 기준으로 유형화하여 이미지 유사도 점수를 산출하였다. 또한 이렇게 도출된 이미지 유사도가 광고효과의 예측 변수가 될 수 있는지를 알아보기 위해, 이를 독립변수로, 광고효과를 종속변수로 하는 예측 모델링을 기계학습을 실시하여 학습시켰다. 이때, 유명인 광고의 광고효과를 정량적으로 예측해 내기보다, 해당 유명인 광고가 효과가 있는지를 판단하는 분류 예측을 실시하였다.
이때, 모델의 표상적 이미지 외에 사건 맥락을 고려한 복합체적 이미지를 함께 고려하여 데이터화 하기 위해 ‘개체-역할-사건’ 구조에 근거하여 데이터를 적재하였다. 또한, 소셜데이터의 특성에 따라 복합체적 이미지는 무수하게 다양한 키워드들로 추출되기 때문에, 개별 키워드를 일반화 가능한 분류 기준으로 유형화하여 예측 모델링에 투입하였다.
따라서 빅데이터 전처리 모듈에서는 수집된 문서에서 목적에 부합하는 분석 키워드를 추출하기 위해 형태소 분석을 통해 불필요한 정보인 가비지(garbage)를 제거하는 데이터 정제 작업을 수행하였다. 또한, 정제된 비정형 데이터를 정형 데이터로 바꾸는 분석을 하였다.
본 분석에 활용된 9건의 광고물은 기계학습에 기반한 예측 모델링을 수행하기에는 부족한 분량이므로, 총 9건의 광고물에서 2건의 광고물을 예측 데이터 세트로 구성할 수 있도록 모든 경우의 수를 선정하여 데이터를 증식(총 분석 케이스 36건)하는 과정을 포함하였다.
본 예측 모듈에서는 나머지 20%의 예측 데이터(9개 광고물 중 나머지 광고물 2건에 해당하며, 모델×브랜드 최대 조합을 생성하기 위해 총 36건의 증식된 데이터를 분석에 활용)를 사용하여 위의 학습 모형으로 예측이 가능한 것인지를 검증하였다.
본 예측은 분류 예측을 기반으로 수행되었으므로, 예측 정확도는 분류 결과에 대한 정(正)·오(誤)에 대한 비율로 판단하였다.
즉, 유사도 강도를 산출하기 위해 네트워크 링크의 굵기와 거리를 고려해야 하는데, 굵기는 노출 빈도(frequency)로, 거리는 공통 키워드 도출까지의 깊이(depth)로 계산하였다. 예측모형에 투입할 독립변수를 도출하기 위해, 분류 기준별 유명인-브랜드 유사도 점수는 분류 기준 내 공통 키워드들의 유사도 점수 총합으로 계산하였고, 유명인-브랜드의 이미지 유사도 점수는 각 공통 키워드들에 대한 링크 강도의 대푯값(평균)으로 결정하였다.
요약해 보면, 학습 모듈에서는 학습 데이터 set(전체 9개 광고 중 7개의 광고)에 기반하여, 모델과 브랜드에서 공통으로 나타나는 키워드에 대해 분류 기준별로 유사도 점수를 산출한 뒤, 유명인-브랜드 이미지 유사도를 독립변수로, 광고효과를 측정한 서베이 데이터를 종속변수로 하는 광고효과 예측 모형(다중회귀모형)을 학습시켰다.
예측의 정확도를 산출하는 과정은 다음과 같다. 우선 학습 모듈에서 생성한 광고효과 예측 모델링을 통해 2건의 광고물에 대한 예측값을 산출하고, 그중 예측값이 높게 나타난 유명인 광고를 예측 모델링에 의해 추천한다. 그리고 이 결과가 서베이를 통해 얻은 추천 결과(앞의 2건의 광고물에 대한 서베이 결과 중 광고효과가 높은 것을 추천한 것)와 일치하는지를 판별하여 분류 예측의 정확도를 산출한다.
유명인-브랜드 이미지 유사도로 광고효과를 예측하기 위해, 일단 유명인과 브랜드에서 공통으로 나타난 키워드를 ‘개체, 역할, 개인 관계, 집단관계, 미분류’의 이미지 유사도 분류 기준으로 유형화하여 이미지 유사도 점수를 산출하였다.
이때, 11건의 선정된 광고물 중에서 광고 집행 전 소셜 데이터가 충분하지 않은 2개의 케이스(신규 모델이나 신규 브랜드를 대상으로 하여 소비자 여론이 충분치 않은 경우)를 제외하고 총 9건의 광고물(맥심 화이트골드, 삼성 스마트, LG 디오스 김치톡톡, 설화수, 라네즈, SK텔레콤, 삼성 지펠, 헤라, 동인비)로 최종 분석하였다.
이때, 모델의 표상적 이미지 외에 사건 맥락을 고려한 복합체적 이미지를 함께 고려하여 데이터화 하기 위해 ‘개체-역할-사건’ 구조에 근거하여 데이터를 적재하였다.
또한 이렇게 도출된 이미지 유사도가 광고효과의 예측 변수가 될 수 있는지를 알아보기 위해, 이를 독립변수로, 광고효과를 종속변수로 하는 예측 모델링을 기계학습을 실시하여 학습시켰다. 이때, 유명인 광고의 광고효과를 정량적으로 예측해 내기보다, 해당 유명인 광고가 효과가 있는지를 판단하는 분류 예측을 실시하였다. 따라서, 학습 데이터로 도출한 예측 모델링을 통해 얻은 유명인 광고의 광고효과 예측결과를 서베이 결과와 비교하여 예측의 정(正)·오(誤)를 판정한 결과, 총 36번의 분석 중에서 27번의 결과가 정확하게 일치함으로써 75.
본 예측 모듈에서는 나머지 20%의 예측 데이터(9개 광고물 중 나머지 광고물 2건에 해당하며, 모델×브랜드 최대 조합을 생성하기 위해 총 36건의 증식된 데이터를 분석에 활용)를 사용하여 위의 학습 모형으로 예측이 가능한 것인지를 검증하였다. 이때, 유명인 모델의 광고 효과 값을 정량적으로 예측해 내기보다, 해당 유명인 광고가 효과가 있는 것인지 아닌지를 파악하는 분류 예측으로 분석하였다.
이러한 연구 문제를 해결하기 위해 데이터마이닝 절차에 따라 6가지 모듈(빅데이터 수집 모듈→ 빅데이터 전처리 모듈→ 빅데이터 통합 적재 모듈→ 이미지 유사도 산출 모듈→ 광고효과 학습 모듈→ 광고효과 예측 모듈)로 빅데이터 분석을 실행하였다.
이때, 유명인-브랜드 유사도 점수를 산출하는데 연상 네트워크 이론의 기본 개념을 활용하였다. 즉, 유사도 강도를 산출하기 위해 네트워크 링크의 굵기와 거리를 고려해야 하는데, 굵기는 노출 빈도(frequency)로, 거리는 공통 키워드 도출까지의 깊이(depth)로 계산하였다. 예측모형에 투입할 독립변수를 도출하기 위해, 분류 기준별 유명인-브랜드 유사도 점수는 분류 기준 내 공통 키워드들의 유사도 점수 총합으로 계산하였고, 유명인-브랜드의 이미지 유사도 점수는 각 공통 키워드들에 대한 링크 강도의 대푯값(평균)으로 결정하였다.
해당 분류 기준은 세상에 널리 알려진 ‘유명인의 이미지’ 뿐만 아니라 ‘일반인으로서의 이미지’와 ‘사회적 역할로서의 이미지’, 그리고 ‘단체 혹은 개인 관계로 형성되는 이미지’를 추가로 포함하고 있으며, 이들은 추후 예측 모델링의 독립변수로 투입되었다.
대상 데이터
또한, 당시 자료가 최신성이 떨어진다는 단점과 선정된 유명인 모델은 공통으로 전자제품 카테고리에 국한(김연아 - 삼성 스마트에어컨 Q9000, 전지현 - 삼성 지펠 T9000, 김태희 - LG 디오스 김치톡톡) 되어 있었기 때문에, 2015~2018년도 화장품 광고에 출연했던 유명인 모델과 광고(전지현 - 헤라, 한가인 - 동인비, 김태리 - 오휘, 이성경 - 라네즈, 송혜교 - 설화수)를 추가하여, 최종적으로 총 7명의 여자 유명인 모델을 분석 대상 모델로 선정하였다. 또한, 정확한 예측력 학습을 위해 유명인 별로 ROI가 가장 높았던 광고를 추가로 선정하였다(김연아 - 맥심 화이트골드 커피믹스, 전지현 - SKT 텔레콤 LETA, 김태희 - LG 디오스 정수기 냉장고).
또한, 당시 자료가 최신성이 떨어진다는 단점과 선정된 유명인 모델은 공통으로 전자제품 카테고리에 국한(김연아 - 삼성 스마트에어컨 Q9000, 전지현 - 삼성 지펠 T9000, 김태희 - LG 디오스 김치톡톡) 되어 있었기 때문에, 2015~2018년도 화장품 광고에 출연했던 유명인 모델과 광고(전지현 - 헤라, 한가인 - 동인비, 김태리 - 오휘, 이성경 - 라네즈, 송혜교 - 설화수)를 추가하여, 최종적으로 총 7명의 여자 유명인 모델을 분석 대상 모델로 선정하였다. 또한, 정확한 예측력 학습을 위해 유명인 별로 ROI가 가장 높았던 광고를 추가로 선정하였다(김연아 - 맥심 화이트골드 커피믹스, 전지현 - SKT 텔레콤 LETA, 김태희 - LG 디오스 정수기 냉장고).
본 연구에서 소셜 빅데이터를 수집하기 위한 채널은 정제된 용어를 사용하여 수집과 분석이 용이한 온라인 뉴스 사이트로 한정하였다. 본 예측 모델링을 위해서 광고효과에 대한 공신력 있는 과거 지표들이 준비되어야 하므로, 분석 대상으로서 유명인 모델은 한국광고종합연구소(KAA)에서 실시한 광고 모델 선호도 조사 결과(2014년 5월)를 참고하여[1], 유명인 여자 모델 3명(전지현, 김연아, 김태희)을 선정하였다.
본 연구에서 소셜 빅데이터를 수집하기 위한 채널은 정제된 용어를 사용하여 수집과 분석이 용이한 온라인 뉴스 사이트로 한정하였다. 본 예측 모델링을 위해서 광고효과에 대한 공신력 있는 과거 지표들이 준비되어야 하므로, 분석 대상으로서 유명인 모델은 한국광고종합연구소(KAA)에서 실시한 광고 모델 선호도 조사 결과(2014년 5월)를 참고하여[1], 유명인 여자 모델 3명(전지현, 김연아, 김태희)을 선정하였다.
이미지 유사도 산출 모듈에서는 앞서 선정한 공통 키워드의 분류 기준에 따라 유명인-브랜드 유사도를 측정하게 된다. 우선 유명인과 브랜드의 1차 연관어 중 상위 20개 키워드를 도출하고, 각 키워드에 대해 1차 연관어와 독립되게 추출한 2차 연관어 중 상위 20개 키워드를 추가로 추출하여 공통 키워드 셋(set)을 준비하였다. 그리고 이 공통 키워드가 전체 문서에서 얼마나 자주 출현했는지, 동시 노출된 횟수를 기준으로 유사도 산출 식을 도출하였다.
데이터처리
또한, 이 규칙을 2개의 예측 사례에 적용한 결과, ‘김연아’의 ‘커피믹스’ 광고의 예측값이 ‘스마트에어컨’ 광고의 예측값보다 낮게 나타났으므로, 본 연구를 통해 ‘김연아’의 ‘커피믹스’ 광고효과가 더 낮을 것으로 추천되었다. 이런 방식으로 예측 모델링을 통해 제안된 광고물과 서베이를 통해 제안된 광고물을 최종 비교하여 본 회귀식의 예측 타당성을 검증하였다. 나머지 예측 데이터(36개의 증식된 데이터)에 대해서도 동일한 방식의 분석을 총 36번 반복하였다.
성능/효과
본 예측은 분류 예측을 기반으로 수행되었으므로, 예측 정확도는 분류 결과에 대한 정(正)·오(誤)에 대한 비율로 판단하였다. Table 2와 같이 총 36번의 분석 중에서 27번의 결과가 정확하게 일치함으로써 75.0%의 예측 정확도를 보였다. 이는 분류 정확도의 75% 기준에 부합하는 것이므로 본 모델의 예측 타당성은 높다고 하겠다.
셋째, 본 연구에서는 SNS에서의 소비자 여론 구조가 브랜드 연상 네트워크 구조와 유사하다는 점을 반영하여, 이에 대한 이론적 배경을 기반으로 유명인과 브랜드에 공통으로 출현하는 키워드의 링크 강도를 측정하여 유명인-브랜드의 실제적인 이미지 유사도를 정량화할 수 있었다. 넷째, 본 연구는 최근 빅데이터 분야에서 주목받는 기계학습 기법을 사용하여 유명인 모델의 광고효과 예측 알고리즘을 개발하고, 이를 통해 유명인 모델을 선정하기 위한 최적의 의사결정에 기여했다는 발견에서 실용적인 시사점을 찾을 수 있다.
첫째, 본 연구는 최근 관심을 받는 소셜 빅데이터를 활용하여, 유명인 모델을 대상으로 실시간 생성되는 소비자 담론에 근거한 유명인-브랜드 이미지 유사도를 산출하였다는 데서 방법론적 의의가 있다. 둘째, 유명인의 일상에서 일어나는 다양한 사건들을 서사적 구조로 여기고, 모델의 이미지를 표상적인 관점뿐만 아니라 복합체적인 관점도 포함하여 그 실체를 다차원적으로 파악하였다는데 이론적 의의를 갖는다. 셋째, 본 연구에서는 SNS에서의 소비자 여론 구조가 브랜드 연상 네트워크 구조와 유사하다는 점을 반영하여, 이에 대한 이론적 배경을 기반으로 유명인과 브랜드에 공통으로 출현하는 키워드의 링크 강도를 측정하여 유명인-브랜드의 실제적인 이미지 유사도를 정량화할 수 있었다.
따라서, 학습 데이터로 도출한 예측 모델링을 통해 얻은 유명인 광고의 광고효과 예측결과를 서베이 결과와 비교하여 예측의 정(正)·오(誤)를 판정한 결과, 총 36번의 분석 중에서 27번의 결과가 정확하게 일치함으로써 75.0%의 정확도로 예측의 타당성을 확보하였다.
또한, 이 규칙을 2개의 예측 사례에 적용한 결과, ‘김연아’의 ‘커피믹스’ 광고의 예측값이 ‘스마트에어컨’ 광고의 예측값보다 낮게 나타났으므로, 본 연구를 통해 ‘김연아’의 ‘커피믹스’ 광고효과가 더 낮을 것으로 추천되었다.
Table 1의 7개 학습 데이터에 대해, 소셜 빅데이터를 통해 도출한 유명인-브랜드 이미지 키워드의 분류 기준별(개체, 역할, 집단관계, 개인 관계, 미분류) 유사도 점수를 독립변수로 하고 서베이를 통한 광고효과 점수를 종속변수로 하여 회귀모형을 도출하고, 독립변수에 해당하는 5개의 키워드 분류 기준별로 회귀계수를 산출하였다. 분석 결과, 전체 회귀모형에 대한 R 값은 0.8891로 나타났으며, 도출된 회귀식의 통계적 유의성은 높게 나타나 광고효과 예측 의사결정 모델은 유효한 것으로 판정되었다.
둘째, 유명인의 일상에서 일어나는 다양한 사건들을 서사적 구조로 여기고, 모델의 이미지를 표상적인 관점뿐만 아니라 복합체적인 관점도 포함하여 그 실체를 다차원적으로 파악하였다는데 이론적 의의를 갖는다. 셋째, 본 연구에서는 SNS에서의 소비자 여론 구조가 브랜드 연상 네트워크 구조와 유사하다는 점을 반영하여, 이에 대한 이론적 배경을 기반으로 유명인과 브랜드에 공통으로 출현하는 키워드의 링크 강도를 측정하여 유명인-브랜드의 실제적인 이미지 유사도를 정량화할 수 있었다. 넷째, 본 연구는 최근 빅데이터 분야에서 주목받는 기계학습 기법을 사용하여 유명인 모델의 광고효과 예측 알고리즘을 개발하고, 이를 통해 유명인 모델을 선정하기 위한 최적의 의사결정에 기여했다는 발견에서 실용적인 시사점을 찾을 수 있다.
그리고 이 결과가 서베이를 통해 얻은 추천 결과(앞의 2건의 광고물에 대한 서베이 결과 중 광고효과가 높은 것을 추천한 것)와 일치하는지를 판별하여 분류 예측의 정확도를 산출한다. 이러한 예측의 정확도를 통해 본 예측이 얼마나 타당한지를 판단하게 되는데, 분류 예측에 대한 정확도 판단 기준은 75% 이상 예측 정확도가 산출되었을 때 예측값이 타당하다고 결론 내린다. 전 분석 과정은 R 3.
0%의 정확도로 예측의 타당성을 확보하였다. 즉, 유명인 모델과 브랜드의 이미지 유사도는 광고효과를 예측하는데 타당한 변수임이 입증되었으므로, SNS상의 다양한 유명인의 이미지 실체를 탐색하여 이를 기반으로 광고효과를 예측하는 것은 가능하다는 결론을 내릴 수 있다고 하겠다.
이러한 연구문제를 해결하기 위해, 다음과 같은 두 단계의 절차를 거쳐 분석 모형을 설계하였다. 첫째, 유명인 모델과 브랜드 사이에 공통 키워드가 얼마나 유사한 패턴으로 나타나는지 정량화할 수 있도록 유명인-브랜드 유사도 알고리즘을 산출한다. 둘째, 유명인 모델-브랜드 이미지 유사도가 광고효과에 영향을 주는 주요 변수가 되는 가를 파악하기 위해 기계학습 방법을 통해 유명인 모델의 광고효과 예측 모델링을 실시한다.
후속연구
셋째, 본 연구의 분석 대상으로 선정한 유명인은 일부 중복 출연이 통제되지 못한 상황에서 분석에 투입되었는데, 중복 출연 케이스를 좀 더 엄격하게 통제하게 되면 유명인 효과에 대한 객관성을 확보하는 데 도움이 될 것으로 기대된다. 넷째, 본 예측 모델링에 투입된 독립변수로서의 유명인-브랜드 이미지 유사도 분류 기준은 다소 부족한 데이터 세트로 인해 유명인-브랜드에 대한 심층적 이미지 구조를 도출하는데 다소 한계가 있었으므로, 향후 연구에서 다양한 소셜미디어에서 형성되는 사회적 담론을 활용한다면 좀 더 의미 있는 예측 변수 개발이 가능할 것으로 판단된다.
첫째, 본 연구에서 활용한 데이터는 온라인 뉴스 사이트에 한정되어 있지만, 소비자의 진성 여론이 다양한 소셜미디어에서 생성되고 있으므로 분석 채널을 확대하여 데이터를 수집하는 노력이 필요하겠다. 둘째, 본 연구에서 사용한 예측 기준변수로 서베이를 통한 광고효과 점수를 활용하였으나, 좀 더 공신력 있는 효과 지표를 확보하면 예측 모델링의 신뢰도를 더 높일 수 있을 것으로 예상된다. 셋째, 본 연구의 분석 대상으로 선정한 유명인은 일부 중복 출연이 통제되지 못한 상황에서 분석에 투입되었는데, 중복 출연 케이스를 좀 더 엄격하게 통제하게 되면 유명인 효과에 대한 객관성을 확보하는 데 도움이 될 것으로 기대된다.
따라서, 유명인의 이미지 연구에서 이미지를 고정된 형태의 ‘표상’으로 보는 것을 넘어, 생활 맥락 속에서 변화무쌍하게 나타나는 ‘복합체’로서의 측면을 고려한 새로운 접근이 필요하다고 하겠다.
둘째, 본 연구에서 사용한 예측 기준변수로 서베이를 통한 광고효과 점수를 활용하였으나, 좀 더 공신력 있는 효과 지표를 확보하면 예측 모델링의 신뢰도를 더 높일 수 있을 것으로 예상된다. 셋째, 본 연구의 분석 대상으로 선정한 유명인은 일부 중복 출연이 통제되지 못한 상황에서 분석에 투입되었는데, 중복 출연 케이스를 좀 더 엄격하게 통제하게 되면 유명인 효과에 대한 객관성을 확보하는 데 도움이 될 것으로 기대된다. 넷째, 본 예측 모델링에 투입된 독립변수로서의 유명인-브랜드 이미지 유사도 분류 기준은 다소 부족한 데이터 세트로 인해 유명인-브랜드에 대한 심층적 이미지 구조를 도출하는데 다소 한계가 있었으므로, 향후 연구에서 다양한 소셜미디어에서 형성되는 사회적 담론을 활용한다면 좀 더 의미 있는 예측 변수 개발이 가능할 것으로 판단된다.
더불어 빅데이터 분석에 대한 정교함을 높이기 위해 다음과 같은 후속 보완 연구들이 필요하다고 본다. 첫째, 본 연구에서 활용한 데이터는 온라인 뉴스 사이트에 한정되어 있지만, 소비자의 진성 여론이 다양한 소셜미디어에서 생성되고 있으므로 분석 채널을 확대하여 데이터를 수집하는 노력이 필요하겠다. 둘째, 본 연구에서 사용한 예측 기준변수로 서베이를 통한 광고효과 점수를 활용하였으나, 좀 더 공신력 있는 효과 지표를 확보하면 예측 모델링의 신뢰도를 더 높일 수 있을 것으로 예상된다.
이상으로 소셜 빅데이터를 이용한 유명인 모델의 광고 효과 모델링은 광고 모델에 관한 연구 분야에 새로운 지평을 열어주었다는 점에서 학문적 시사점을 갖는다. 하지만, 빅데이터 분석 방법에 근본적으로 내포된 내적 타당성 문제와 유용한 결과 도출에 이르기까지 많은 과거 데이터 확보가 필요하다는 비효율성의 문제는 앞으로 빅데이터 연구가 진화·발전하는데 있어서 극복해야 할 과제로 남아 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
광고 모델은 광고에 있어서 어떤 요인인가?
광고 모델은 광고효과를 좌우하는 핵심 구성 요인이면서 광고비의 많은 부분을 차지하는 요소이다[1]. 지금까지 연구자들은 유명인이 가지고 있는 이미지와 브랜드 이미지의 적합성을 주요 연구주제로 다루었으나[2], 실제로 유명인 모델과 브랜드의 이미지 적합성에 대한 실체가 무엇인지, 어느 정도로 적합해야 하는지, 그리고 이미지 적합성을 고려하여 유명인을 선정했을 때 실제로 광고효과를 담보할 수 있을지에 대한 근거들은 여전히 부족한 실정이다.
유명인(celebrity) 모델은 무엇인가?
유명인(celebrity) 모델은 일반적으로 특정 분야에서의 성공을 기반으로 대중들에게 이름을 널리 알린 인물을 의미한다[3]. 유명인 모델에는 가상의 인물도 모두 포함되는데, 최근에는 SNS(Social Network Service)상에서 막대한 팔로워(follower)를 보유하면서 트렌드를 이끌고 유명세를 얻고 있는 인플루언서(influencer)도 유명인 모델에 속한다고 하겠다.
유명인 모델이 가진 이미지와 모델이 광고하는 브랜드 이미지에 대한 기존 연구의 문제점은 무엇인가?
이러한 유명인 모델이 가진 이미지와 모델이 광고하는 브랜드 이미지 간의 유사도가 높을수록 광고효과가 높아진다는 연구 결과들이 있다[4]. 하지만 기존의 연구들은 브랜드 이미지를 측정하는 데 있어서 사전에 형성해 놓은 이미지 셋(set)을 설문 조사를 통해 평가하는 방식이기 때문에 측정에 한계를 갖는다[5]. 또한, 오늘날같이 SNS 커뮤니케이션이 활발한 쌍방향 네트워크 시대에는 고정된 ‘표상으로서의 이미지’ 외에 서사적 맥락을 고려한 ‘복합체로서의 이미지’로 유명인 모델과 브랜드 이미지를 확장해서 보는 접근이 필요하다고 하겠다.
참고문헌 (15)
W. S. Kyeong. (2014. July). Mode's double appearances and advertising effects, KAA Special Report, July+August, 10-13.
C. Amos, G. Holms & D. Strutton. (2008). Exploring the relationship between celebrity endorser effects and advertising effectiveness. International Journal of Advertising, 27(2), 209-234.
H. H. Friedman & L. Friedman. (1979). Endorser effectiveness by product type. Journal of Advertising Research, 19(5), 63-71.
I. Y. Nam. (2002). The degree of match-up and celebrity endorser's advertising effectiveness : considering various product types. Korean Journal of Broadcasting and Telecommunication Studies, 16(1), 171-199.
C. R. Knott & M. St. James. (2004). An alternate approach to developing a total celebrity endorser rating model using the analytic hierarchy process. International Transactions in Operational Research, 11, 87-95.
J. D. Roedder, L. Barbara, K. Kim & A. B. Mong. (2006). Brand concept maps: a methodology for identifying brand association networks. Journal of Marketing Research, 43(November), 549-563.
J. R. Anderson & G. H. Bower. (1980). Human Associative Memory: A Brief Edition. Hillsdale, N.J.: L. Erlbaum Associates.
D. A. Aaker. (1996). Building strong brands. New York: The Free Press.
K. L. Keller, S. Brian & T. Alice. (2002). Three Questions You Need to Ask About Your Brand, Harvard Business Review, September, 81-86.
K. H. Choi & J. A. Yoo. (2015). A reviews on the social network analysis using R. Journal of The Korea Convergence Society, 6(1), 77-83. DOI : 10.15207/JKCS.2015.6.1.077
M. J. Sirgy. (1982). Self-image/product image congruity and advertising strategy. Development in Marketing Science, 5(February), 129-13.
A. Labrinidis & H. Jagadish. (2012). Challenges and opportunities with big data. Proceedings of the LDB Endowment, 5(12), 2032-2033.
H. W. Byeon. (2015). The factors of participating in a smoking cessation program using integrated method of decision tree and neural network algorithm. Journal of The Korea Convergence Society, 6(2), 25-30. DOI : 10.15207/JKCS.2015.6.2.025
M. Che, S. Mao & Y. Liu. (2014). Big Data: ASurvey. The journal Mobile Networks and Applications, 19, 171-209.
P. Russom. (2011). Big data analytics. TDWI best practices report [Online], fourth quarter. https://vivomente.com/wp-content/uploads/2016/04/big-data-analytics-white-paper.pdf
※ AI-Helper는 부적절한 답변을 할 수 있습니다.