본 논문에서는 드라마의 시청률에 영향을 미치는 요소가 무엇인지를 파악하기 위해 정형화된 데이터와 비정형화된 데이터를 분석하기 위한 내용이다. 정형화된 데이터 수집은 각 방송사의 드라마 정보, 인물정보, 방송정보, 시청률정보라는 4가지 영역에서 총 19가지항목을 수집하였다. 비정형데이터를 수집하기 위해 각 방송사에서 드라마별로 운영되고 있는 게시판과 방영전블로그와 방영후블로그로부터 크롤링기법을 이용하여 수집하였다. 수집된 데이터로부터 방송사별 드라마 방영시간대, 방영시작시기, 장르, 방영요일에 따른 차이를 비교한 결과 방송사별 서로 유사한 것으로 나타났다.
본 논문에서는 드라마의 시청률에 영향을 미치는 요소가 무엇인지를 파악하기 위해 정형화된 데이터와 비정형화된 데이터를 분석하기 위한 내용이다. 정형화된 데이터 수집은 각 방송사의 드라마 정보, 인물정보, 방송정보, 시청률정보라는 4가지 영역에서 총 19가지항목을 수집하였다. 비정형데이터를 수집하기 위해 각 방송사에서 드라마별로 운영되고 있는 게시판과 방영전블로그와 방영후블로그로부터 크롤링기법을 이용하여 수집하였다. 수집된 데이터로부터 방송사별 드라마 방영시간대, 방영시작시기, 장르, 방영요일에 따른 차이를 비교한 결과 방송사별 서로 유사한 것으로 나타났다.
In this paper, we analyze contents of formal and non - standardized data to understand what factors affect the ratings of drama. The formalized data collection collected 19 items from the four areas of drama information, person information, broadcasting information, and audience rating information o...
In this paper, we analyze contents of formal and non - standardized data to understand what factors affect the ratings of drama. The formalized data collection collected 19 items from the four areas of drama information, person information, broadcasting information, and audience rating information of each broadcasting company. In order to collect unstructured data, crawling techniques were used to collect bulletin boards, pre - broadcast blogs and post - broadcast blogs for each drama. From the collected data, it was found that the differences according to broadcasting time, the start time, genre, and day of broadcasting were similar among broadcasting companies.
In this paper, we analyze contents of formal and non - standardized data to understand what factors affect the ratings of drama. The formalized data collection collected 19 items from the four areas of drama information, person information, broadcasting information, and audience rating information of each broadcasting company. In order to collect unstructured data, crawling techniques were used to collect bulletin boards, pre - broadcast blogs and post - broadcast blogs for each drama. From the collected data, it was found that the differences according to broadcasting time, the start time, genre, and day of broadcasting were similar among broadcasting companies.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
그로인해 이 드라마의 성공 요인이 사회적, 문화적, 경제적 변화 요인으로까지 자리 잡을 수 있다. 본 논문에서는 드라마의 성공을 판단할 수 있는 시청률에 영향을 미치는 핵심 요소인 연관어를 분석하고자 한다.[1][2]
제안 방법
드라마의 시청률에 영향을 미치는 연관어를 분석하기 위해 본 논문에서는 각 방송사별 드라마의 게시판 글과 방영전 드라마 블로그의 글 그리고 방영후 드라마 블로그의 글을 분석하여 진행한다. 그림3은 드라마의 어휘의 출현빈도를 분석하고 모든 드라마에서 출현되는 어휘만을 추출하여 출현빈도와 시청률과의 상관관계를 분석해 총 7개의 연관어를 도출한다.
대상 데이터
이러한 시청률 지표 산출을 위해서는 기존에 시청률이 높았던 드라마에서 그에 영향을 주는 요소가 무엇인지를 먼저 분석해 보아야 된다. 먼저 분석을 위해 그림 1과 같이 드라마 정보, 인물정보, 방송정보, 시청률 정보와 같은 정형데이터와 각 드라마 게시판과 방영전 블로그와 방영후 블로그로부터 비정형데이터를 수집한다.
성능/효과
데이터 분석을 위한 드라마정보, 인물정보, 방송정보, 시청률 정보에 대한 데이터를 분석한 결과 방송사 간의 특성이 거의 비슷하다는 것을 알 수 있다. 그림 2에서 보는 것과 같이 드라마 방영 시간대, 방영시작시기, 장르, 방영요일에 따른 차이를 카이제곱을 이용하여 비교 분석한 결과 방송사별 유사분포 값이 큰 차이를 보이지 않는 것을 알 수 있다.
본 논문에서는 데이터 분석을 통해 드라마시청률과의 관련 요인으로 첫회 시청률, 방영개월수, 방영 시간대, 방영 요일인 것을 알게 되었고, SNS 비정형데이터 크롤링을 통해 연관어 분석을 시행한 결과 7개의 연관어를 찾을 수 있었다. 이는 드라마의 성공여부를 예측할 수 있는 주요 요소로 추후 광고주의 광고선택에 활용될 수 있을 것으로 보인다.
후속연구
본 논문에서는 데이터 분석을 통해 드라마시청률과의 관련 요인으로 첫회 시청률, 방영개월수, 방영 시간대, 방영 요일인 것을 알게 되었고, SNS 비정형데이터 크롤링을 통해 연관어 분석을 시행한 결과 7개의 연관어를 찾을 수 있었다. 이는 드라마의 성공여부를 예측할 수 있는 주요 요소로 추후 광고주의 광고선택에 활용될 수 있을 것으로 보인다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.