코로나 이전과 이후의 4차 산업혁명과 광고의 뉴스기사 분석 : LDA와 Word2vec을 중심으로 News Article Analysis of the 4th Industrial Revolution and Advertising before and after COVID-19: Focusing on LDA and Word2vec원문보기
4차 산업혁명이란 인공지능(AI), 사물인터넷(IoT), 로봇기술, 드론, 자율주행과 가상현실(VR) 등 정보통신 기술이 주도하는 차세대 산업혁명을 말하는 것으로, 광고 산업 발전에도 큰 영향을 미쳤다. 그러나 지금 전세계는 코로나 확산 방지를 위하여, 비접촉, 비대면 생활환경으로 급속도로 빠르게 변화하고 있다. 이에 따라 4차 산업혁명과 광고의 역할도 변화하고 있다. 따라서 본 연구에서는 코로나 19 이전과 이후의 4차산업 혁명과 광고의 변화를 살펴보기 위해 빅카인즈를 활용해서 텍스트 분석을 하였다. 코로나 19 이전인 2019년과 코로나 19 이후인 2020년을 비교하였다. LDA토픽 모형 분석과 딥러닝 기법인 Word2vec을 통해 주요 토픽과 문서분류를 하였다. 연구결과 코로나19 이전에는 정책, 콘텐츠, AI 등이 나타났으나, 코로나 이후에는 데이터를 활용한 금융, 광고, 배달 등으로 점차 영역이 확장되며, 더불어 인재양성 교육이 중요한 이슈로 나타난 것을 알 수 있었다. 또한, 코로나 19 이전에는 4차 산업혁명 기술과 관련된 광고를 활용하는 것이 주류를 이루었다면, 코로나 19 이후에는 참여, 협력, 일상 필요 등 좀 더 적극적으로 첨단기술 자체에 대한 교육과 인재양성 등에 대한 키워드가 두드러지게 나타나고 있다. 따라서 이러한 연구결과는 코로나 19 이후에 4차 산업혁명에서 광고의 나아갈 방향을 제시하면서, 이에 필요한 이론적, 실무적으로 적용할 수 있는 다각적인 전략을 제시하는 데 의의가 있다.
4차 산업혁명이란 인공지능(AI), 사물인터넷(IoT), 로봇기술, 드론, 자율주행과 가상현실(VR) 등 정보통신 기술이 주도하는 차세대 산업혁명을 말하는 것으로, 광고 산업 발전에도 큰 영향을 미쳤다. 그러나 지금 전세계는 코로나 확산 방지를 위하여, 비접촉, 비대면 생활환경으로 급속도로 빠르게 변화하고 있다. 이에 따라 4차 산업혁명과 광고의 역할도 변화하고 있다. 따라서 본 연구에서는 코로나 19 이전과 이후의 4차산업 혁명과 광고의 변화를 살펴보기 위해 빅카인즈를 활용해서 텍스트 분석을 하였다. 코로나 19 이전인 2019년과 코로나 19 이후인 2020년을 비교하였다. LDA토픽 모형 분석과 딥러닝 기법인 Word2vec을 통해 주요 토픽과 문서분류를 하였다. 연구결과 코로나19 이전에는 정책, 콘텐츠, AI 등이 나타났으나, 코로나 이후에는 데이터를 활용한 금융, 광고, 배달 등으로 점차 영역이 확장되며, 더불어 인재양성 교육이 중요한 이슈로 나타난 것을 알 수 있었다. 또한, 코로나 19 이전에는 4차 산업혁명 기술과 관련된 광고를 활용하는 것이 주류를 이루었다면, 코로나 19 이후에는 참여, 협력, 일상 필요 등 좀 더 적극적으로 첨단기술 자체에 대한 교육과 인재양성 등에 대한 키워드가 두드러지게 나타나고 있다. 따라서 이러한 연구결과는 코로나 19 이후에 4차 산업혁명에서 광고의 나아갈 방향을 제시하면서, 이에 필요한 이론적, 실무적으로 적용할 수 있는 다각적인 전략을 제시하는 데 의의가 있다.
The 4th industrial revolution refers to the next-generation industrial revolution led by information and communication technologies such as artificial intelligence (AI), Internet of Things (IoT), robot technology, drones, autonomous driving and virtual reality (VR) and it also has made a significant...
The 4th industrial revolution refers to the next-generation industrial revolution led by information and communication technologies such as artificial intelligence (AI), Internet of Things (IoT), robot technology, drones, autonomous driving and virtual reality (VR) and it also has made a significant impact on the development of the advertising industry. However, the world is rapidly changing to a non-contact, non-face-to-face living environment to prevent the spread of COVID 19. Accordingly, the role of the 4th industrial revolution and advertising is changing. Therefore, in this study, text analysis was performed using Big Kinds to examine the 4th industrial revolution and changes in advertising before and after COVID 19. Comparisons were made between 2019 before COVID 19 and 2020 after COVID 19. Main topics and documents were classified through LDA topic model analysis and Word2vec, a deep learning technique. As the result of the study showed that before COVID 19, policies, contents, AI, etc. appeared, but after COVID 19, the field gradually expanded to finance, advertising, and delivery services utilizing data. Further, education appeared as an important issue. In addition, if the use of advertising related to the 4th industrial revolution technology was mainstream before COVID 19, keywords such as participation, cooperation, and daily necessities, were more actively used for education on advanced technology, while talent cultivation appeared prominently. Thus, these research results are meaningful in suggesting a multifaceted strategy that can be applied theoretically and practically, while suggesting the future direction of advertising in the 4th industrial revolution after COVID 19.
The 4th industrial revolution refers to the next-generation industrial revolution led by information and communication technologies such as artificial intelligence (AI), Internet of Things (IoT), robot technology, drones, autonomous driving and virtual reality (VR) and it also has made a significant impact on the development of the advertising industry. However, the world is rapidly changing to a non-contact, non-face-to-face living environment to prevent the spread of COVID 19. Accordingly, the role of the 4th industrial revolution and advertising is changing. Therefore, in this study, text analysis was performed using Big Kinds to examine the 4th industrial revolution and changes in advertising before and after COVID 19. Comparisons were made between 2019 before COVID 19 and 2020 after COVID 19. Main topics and documents were classified through LDA topic model analysis and Word2vec, a deep learning technique. As the result of the study showed that before COVID 19, policies, contents, AI, etc. appeared, but after COVID 19, the field gradually expanded to finance, advertising, and delivery services utilizing data. Further, education appeared as an important issue. In addition, if the use of advertising related to the 4th industrial revolution technology was mainstream before COVID 19, keywords such as participation, cooperation, and daily necessities, were more actively used for education on advanced technology, while talent cultivation appeared prominently. Thus, these research results are meaningful in suggesting a multifaceted strategy that can be applied theoretically and practically, while suggesting the future direction of advertising in the 4th industrial revolution after COVID 19.
또한, 토픽 모델링 연구에서는 단어 빈도수 및 단순 토픽 모델링 기법만 사용한 사례가 대부분이었다. 따라서 본 연구에서는 LDA 토픽 모형분석과 Word2Vec 딥러닝 기법을 사용하여 기사들의 주요 토픽과 주요 토픽의 특정 키워드와 연관된 단어들을 찾아 코로나 19 이전과 이후에 4차 산업혁명에서 광고계의 변화와 핵심 키워드를 파악하고자 한다.
제안 방법
아래의 표를 통해 확인해 보자. Word2vec 연관키워드 분석에서 광고에 관한 연관키워드 분석을 했다. 코로나 이전 “광고”와 상위 10개 연관 키워드들은 매체, 공익, 독과점.
분석 자료기사에는 제목과 내용에 “4차 산업혁명”과 “광고”라는 단어가 모두 포함된 기사를 추출하였다. 먼저 수집된 기사 데이터들을 이용해 빈도분석, 워드 클라우드를 통해 주요 단어들을 파악한 후, 대표적인 토픽 모델링 기법인 LDA 토픽모형 분석과 단어 임 베딩 알고리즘인 Wor2vec 딥러닝 기법을 사용하여 기사들의 주요 토픽과 주요 토픽의 특정 키워드와 연관된 단어들을 찾아 4차 산업혁명에서 광고계의 변화와 키워드를 파악하고자 하였다.
본 연구는 4차 산업혁명과 광고의 변화를 종합적으로 분석하여 향후 4차 산업혁명과 광고가 진행될 방향을 더 구체적으로 예측하기 위해 단순 빈도수를 활용한 분석뿐만 아니라 대표적인 모델링 기법인 LDA를 활용하여 토픽을 도출하고 Word2vec을 이용하여 세부적으로 키워드를 도출하는 단계를 거쳤다. 이 결과를 바탕으로 코로나 전과 후를 나누어서 살펴봄으로써 코로나 이후의 광고 추세변화를 통한 동향을 파악하고, 관련 연구 및 분야별 미래 정책에 대한 방향성을 제시하자 한다.
본 연구는 코로나 이전과 이후의 4차 산업혁명에 관한 광고의 변화를 알아보기 위해 연구 자료인 빅 카인즈를 분석하였다. 빅카인즈는 종합일간지, 경제지, 지역일간지, 방송사 등을 포함한 최대 규모의 기사 DB에 빅데이터 분석기술을 접목해 만든 새로운 뉴스 분석 서비스이다.
본 연구는 4차 산업혁명과 광고의 변화를 종합적으로 분석하여 향후 4차 산업혁명과 광고가 진행될 방향을 더 구체적으로 예측하기 위해 단순 빈도수를 활용한 분석뿐만 아니라 대표적인 모델링 기법인 LDA를 활용하여 토픽을 도출하고 Word2vec을 이용하여 세부적으로 키워드를 도출하는 단계를 거쳤다. 이 결과를 바탕으로 코로나 전과 후를 나누어서 살펴봄으로써 코로나 이후의 광고 추세변화를 통한 동향을 파악하고, 관련 연구 및 분야별 미래 정책에 대한 방향성을 제시하자 한다. 먼저 4차 산업혁명 이전에 광고와의 관계에 대하여 분석하고자 다음과 같은 연구문제를 제시하였다.
분석에는 R 프로그램을 사용하였고 형태소 분석에는 NLP4kec 패키지를 사용하였다. 형태소 분석 순서는 먼저 빈도 분석과 워드 클라우드 분석을 하였고(1단계 분석), 다음으로 LDA 토픽모형 분석을 하였으며(2단계 분석), 마지막으로 Word2Vec을 사용하여 유사도 분석과 연관 네트워크 분석을 실시하였다(3단계 분석). 이를 통해서 코로나 이전과 이후의 4차 산업혁명과 광고의 동향을 파악할 수 있었으며, 4차 산업혁명과 광고와 관련된 연구 및 미래 정책에 대한 방향성을 제시할 수 있을 것으로 기대된다.
대상 데이터
분석 기간은 코로나 이전인 2019년과 코로나 이후인 2020년을 각각 분석하였다. 2019년에는 758건, 2020년은 536건으로 총 1,294건의 관련 기사를 수집하였다. 분석 자료기사에는 제목과 내용에 “4차 산업혁명”과 “광고”라는 단어가 모두 포함된 기사를 추출하였다.
본 연구 데이터는 빅카인즈 서비스를 이용해 관련 기사를 수집하였으며 분석 데이터 수집 기준에는 기사 제목과 내용에 ‘4차 산업혁명’과 ‘광고’라는 단어가 모두 포함된 기사를 추출하였다
본 연구는 국내의 빅카인즈 데이터만을 수집하여 분석을 진행하였다. 이는 광고와 연관된 4차 산업혁명에 대한 국내의 흐름만을 살펴보았으므로, 해외의 흐름을 파악할 수 없다는 한계점이 있다.
본 연구는 코로나 이전과 이후의 4차 산업혁명에 관한 광고 트렌드의 변화를 알아보기 위해 코로나 발생이 전인 2019년과 코로나 발생 이후인 2020년을 분석 기간으로 수집하였다. 본 연구 데이터는 빅카인즈 서비스를 이용해 관련 기사를 수집하였으며 분석 데이터 수집 기준에는 기사 제목과 내용에 ‘4차 산업혁명’과 ‘광고’라는 단어가 모두 포함된 기사를 추출하였다.
빅카인즈는 종합일간지, 경제지, 지역일간지, 방송사 등을 포함한 최대 규모의 기사 DB에 빅데이터 분석기술을 접목해 만든 새로운 뉴스 분석 서비스이다. 분석 기간은 코로나 이전인 2019년과 코로나 이후인 2020년을 각각 분석하였다. 2019년에는 758건, 2020년은 536건으로 총 1,294건의 관련 기사를 수집하였다.
데이터처리
먼저, 수집된 기사 데이터들을 이용해 빈도분석, 워드 클라우드를 통해 주요 단어들을 파악한 후, LDA 토픽 모형분석과 Word2vec 딥러닝 기법을 사용하여 기사들의 주요 토픽과 주요 토픽의 특정 키워드와 연관된 단어들을 찾아 4차 산업혁명에서 광고계의 변화와 핵심 키워드를 파악하고자 한다. 분석 순서는 아래와 같다.
본 연구는 먼저 비정형 데이터를 수집하였다. 분석에는 R 프로그램을 사용하였고 형태소 분석에는 NLP4kec 패키지를 사용하였다. 형태소 분석 순서는 먼저 빈도 분석과 워드 클라우드 분석을 하였고(1단계 분석), 다음으로 LDA 토픽모형 분석을 하였으며(2단계 분석), 마지막으로 Word2Vec을 사용하여 유사도 분석과 연관 네트워크 분석을 실시하였다(3단계 분석).
본 연구는 먼저 비정형 데이터를 수집하였다. 분석에는 R 프로그램을 사용하였고 형태소 분석에는 NLP4kec 패키지를 사용하였다. 형태소 분석 순서는 먼저 빈도 분석과 워드 클라우드 분석을 하였고(1단계 분석), 다음으로 LDA 토픽모형 분석을 하였으며(2단계 분석), 마지막으로 Word2Vec을 사용하여 유사도 분석과 연관 네트워크 분석을 실시하였다(3단계 분석).
이론/모형
본 연구는 먼저 비정형 데이터를 수집하였다. 분석에는 R 프로그램을 사용하였고 형태소 분석에는 NLP4kec 패키지를 사용하였다. 형태소 분석 순서는 먼저 빈도 분석과 워드 클라우드 분석을 하였고(1단계 분석), 다음으로 LDA 토픽모형 분석을 하였으며(2단계 분석), 마지막으로 Word2Vec을 사용하여 유사도 분석과 연관 네트워크 분석을 실시하였다(3단계 분석).
성능/효과
기술 토픽에서는 미디어 서비스 개발로 2019년은 4차 산업혁명에 따른 정부의 규제와 혁신을 위한 AI를 활용한 미디어 서비스에 중점을 둔 것을 생각해 볼 수 있다. 마지막으로 교육 토픽에서는 방송, 신문, 미디어, 대학원, 광고 등의 키워드를 통해서 학생 교육과 인재양성과 같은 이슈들이 중점을 이루었다는 것을 알 수 있으며, 4차 산업혁명에 관련 기술들을 교육, 양성하는 움직임을 볼 수 있다.
3D 프린팅은 삼차원 형상을 구현하기 위한 전자적 정보(삼차원 도면)를 자동화된 출력장치를 통하여 입체화하는 활동을 의미하는데, 완제품, 부품, 건축, 의약품, 장기 등 다양한 분야에서 활용될 것으로 예상한다. 스포츠, 엔터테인먼트 분야에 4차 산업혁명기술과 관련된 3D 프린팅 기술 등이 광고와 유사도가 높은 것을 볼 수 있다. 위의 분석으로 보았을 때 2019 년도에는 캠페인, 영화 광고가 SNS와 유튜브에 많이 나왔다면, 2020년도에는 4차 산업혁명에 인재양성 교육을 위한 관련학과의 증가와 스포츠, 엔터테인먼트 분야에서도 4차 산업혁명 관련 기술이 광고에 많이 활용된 것을 볼 수 있다.
스포츠, 엔터테인먼트 분야에 4차 산업혁명 기술과 관련된 3D 프린팅 기술 등이 광고와 유사도가 높은 것을 볼 수 있다. 위의 분석으로 보았을 때 2019년도에는 캠페인, 영화 광고가 SNS와 유튜브에 많이 나왔다면, 2020년도에는 4차 산업혁명에 인재양성 교육을 위한 관련학과의 증가와 스포츠, 엔터테인먼트 분야에서도 4차 산업혁명 관련 기술이 광고에 많이 활용되고 있는 것을 볼 수 있다. 위에서 파악된 키워드(“4차 산업혁명”, “광고”) 간의 코사인 유사도를 활용해서 두 가지 키워드를 이어주는 단어들을 보며 조금 더 직접적인 흐름을 파악할 수 있게 연관네트워크를 만들어 보았다.
코로나 이전과 이후에 나타난 토픽은 PEST 즉 정치적(P : Political), 경제적(E:Economic), 사회적(S:Social), 기술적(T:Technological) 및 교육적(E:Educational)으로 구분할 수 있었다. 먼저 정치 토픽에서는 4차 산업혁명 관련 벤처기업들이 늘어나면서 생겨나는 규제에 대한 정부의 움직임을 파악할 수 있다.
후속연구
아울러 코로나 발생 시점에 맞춰 연구를 하다 보니, 코로나 이전과 이후를 1년씩만 연구하였는데, 만일 코로나 사태가 길어지면 더 많은 자료를 찾아서 연구할 수 있을 것이다. 또한, 이 연구는 빅데이터를 이용한 정량연구이므로 4차 산업혁명과 광고와 연관된 전문가들을 대상으로 한 심층연구 및 질적 연구가 지속해서 이루어져야 할 것이다.
이에 추후 연구에서는 해외의 뉴스 기사 데이터까지 수집하여 해외와 국내의 4차 산업혁명과 연관된 광고의 흐름을 비교하여 예측하는 연구가 필요하다. 아울러 코로나 발생 시점에 맞춰 연구를 하다 보니, 코로나 이전과 이후를 1년씩만 연구하였는데, 만일 코로나 사태가 길어지면 더 많은 자료를 찾아서 연구할 수 있을 것이다. 또한, 이 연구는 빅데이터를 이용한 정량연구이므로 4차 산업혁명과 광고와 연관된 전문가들을 대상으로 한 심층연구 및 질적 연구가 지속해서 이루어져야 할 것이다.
본 연구는 국내의 빅카인즈 데이터만을 수집하여 분석을 진행하였다. 이는 광고와 연관된 4차 산업혁명에 대한 국내의 흐름만을 살펴보았으므로, 해외의 흐름을 파악할 수 없다는 한계점이 있다. 이에 추후 연구에서는 해외의 뉴스 기사 데이터까지 수집하여 해외와 국내의 4차 산업혁명과 연관된 광고의 흐름을 비교하여 예측하는 연구가 필요하다.
형태소 분석 순서는 먼저 빈도 분석과 워드 클라우드 분석을 하였고(1단계 분석), 다음으로 LDA 토픽모형 분석을 하였으며(2단계 분석), 마지막으로 Word2Vec을 사용하여 유사도 분석과 연관 네트워크 분석을 실시하였다(3단계 분석). 이를 통해서 코로나 이전과 이후의 4차 산업혁명과 광고의 동향을 파악할 수 있었으며, 4차 산업혁명과 광고와 관련된 연구 및 미래 정책에 대한 방향성을 제시할 수 있을 것으로 기대된다.
이는 광고와 연관된 4차 산업혁명에 대한 국내의 흐름만을 살펴보았으므로, 해외의 흐름을 파악할 수 없다는 한계점이 있다. 이에 추후 연구에서는 해외의 뉴스 기사 데이터까지 수집하여 해외와 국내의 4차 산업혁명과 연관된 광고의 흐름을 비교하여 예측하는 연구가 필요하다. 아울러 코로나 발생 시점에 맞춰 연구를 하다 보니, 코로나 이전과 이후를 1년씩만 연구하였는데, 만일 코로나 사태가 길어지면 더 많은 자료를 찾아서 연구할 수 있을 것이다.
이러한 연구결과를 바탕으로 포스트 코로나 시대 비접촉, 비대면 생활환경에서 4차 산업혁명 시대에서 광고의 발전 방향을 다음과 같이 제시하고자 한다. 첫째, 국가적 차원에서 제4차 산업혁명 환경과 광고에 대한 인프라 구축이 필요하다. 중장기적 비전이나 전략 수립 시 4차 산업혁명을 고려한 미래 변화를 예측하는 노력이 필요하다.
참고문헌 (31)
김진하, "제4차 산업혁명시대 미래사회 변화에 대한 전략적 대응 방안 모색," KISTEP INI. 제15권, 제8호, pp.45-58, 2016.
김병희, 광고산업과 PR 산업의 변화, 김병희 외 공저, 디지털 변화 속 광고 PR 산업, 한국광고홍보학회 편, 서울:학지사, 2021.
J. Gardner and K. Lehnert, "What's New about New Media? How Multi-Channel Network with Content Creators," Business Horizons, Vol.59, No.3, pp.293-302, 2016.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.