전통적인 미디어에서는 생각하지 못했던 많은 뉴스들이 지금 이 시간에도 폭포수처럼 쏟아지고 있다. 이 뉴스 데이터들은 이제는 작은 데이터가 아닌 빅 데이터로 성장하였다. 그 속에 있는 의미를 분석해 볼 필요성이 있다.
본 연구는 국내 80%에 가까운 점유율을 자랑하는 포털 사이트 네이버의 정치 뉴스를 제 19대 국회의원 후보 등록 기간부터 시작하여 실제 선거가 시행된 전날까지 뉴스를 ...
전통적인 미디어에서는 생각하지 못했던 많은 뉴스들이 지금 이 시간에도 폭포수처럼 쏟아지고 있다. 이 뉴스 데이터들은 이제는 작은 데이터가 아닌 빅 데이터로 성장하였다. 그 속에 있는 의미를 분석해 볼 필요성이 있다.
본 연구는 국내 80%에 가까운 점유율을 자랑하는 포털 사이트 네이버의 정치 뉴스를 제 19대 국회의원 후보 등록 기간부터 시작하여 실제 선거가 시행된 전날까지 뉴스를 크롤링을 하여 뉴스 속에서 언급된 국회의원 후보들의 이름의 횟수를 데이터마이닝을 통해서 추출하여, 득표율과 당선율에 어떤 영향을 주었는지 통계적으로 분석하고 그에 따른 선거 예측 모형을 만들어 일반 유권자들도 비용을 들이지 않고 쉽게 선거 예측을 만들어 보는데 목적이 있다.
종속변수인 득표율과 당선율을 대상으로 통제변수로 선행 연구에서 선거에 영향력을 가지고 있다고 보고 되는 성별, 나이, 학력, 재산, 정당을 통제변수로 사용하여 설명변수인 네이버 뉴스에 언급된 후보들의 횟수에 대해 설명하였다.
연구 결과에 따르면, 네이버 뉴스에 언급된 후보들의 이름 횟수가 당선율과 득표율에 통계적으로 유의하게 영향력을 가지고 있으며, 선거에서 후보에 대한 인지도가 유권자들에게 어떻게 영향을 미치는지 간접적으로 분석할 수 있었다.
후보의 지명도와 지역이 가지고 있는 정당 효과만을 가지고 정확한 선거예측은 할 수 없지만, 어느 정도 어떤 후보가 당선될 수 있을지는 분석되었다.
전통적인 미디어에서는 생각하지 못했던 많은 뉴스들이 지금 이 시간에도 폭포수처럼 쏟아지고 있다. 이 뉴스 데이터들은 이제는 작은 데이터가 아닌 빅 데이터로 성장하였다. 그 속에 있는 의미를 분석해 볼 필요성이 있다.
본 연구는 국내 80%에 가까운 점유율을 자랑하는 포털 사이트 네이버의 정치 뉴스를 제 19대 국회의원 후보 등록 기간부터 시작하여 실제 선거가 시행된 전날까지 뉴스를 크롤링을 하여 뉴스 속에서 언급된 국회의원 후보들의 이름의 횟수를 데이터마이닝을 통해서 추출하여, 득표율과 당선율에 어떤 영향을 주었는지 통계적으로 분석하고 그에 따른 선거 예측 모형을 만들어 일반 유권자들도 비용을 들이지 않고 쉽게 선거 예측을 만들어 보는데 목적이 있다.
종속변수인 득표율과 당선율을 대상으로 통제변수로 선행 연구에서 선거에 영향력을 가지고 있다고 보고 되는 성별, 나이, 학력, 재산, 정당을 통제변수로 사용하여 설명변수인 네이버 뉴스에 언급된 후보들의 횟수에 대해 설명하였다.
연구 결과에 따르면, 네이버 뉴스에 언급된 후보들의 이름 횟수가 당선율과 득표율에 통계적으로 유의하게 영향력을 가지고 있으며, 선거에서 후보에 대한 인지도가 유권자들에게 어떻게 영향을 미치는지 간접적으로 분석할 수 있었다.
후보의 지명도와 지역이 가지고 있는 정당 효과만을 가지고 정확한 선거예측은 할 수 없지만, 어느 정도 어떤 후보가 당선될 수 있을지는 분석되었다.
A lot of news we did not think in the traditional media is falling in cataracts even now. These news data have grown as big data, not small data. Therefore, we need to analyze meanings in them. This study aims even ordinary voters can make prediction of election easily without cost, by crawling poli...
A lot of news we did not think in the traditional media is falling in cataracts even now. These news data have grown as big data, not small data. Therefore, we need to analyze meanings in them. This study aims even ordinary voters can make prediction of election easily without cost, by crawling political news on NAVER, a portal site boasting the share of almost 80% in the domestic market, starting from the day of registering as a candidate for the 19th National Assembly until the day before the election, by extracting the number of names of candidates mentioned in news through data-mining, by statistically analyzing what effects they had on the ratio of the earned votes and the ratio of winning the election and by making a prediction model of election.
Targeting the dependent variables the ratio of the earned votes and the ratio of winning the election, this study explained the explanatory variable, the number of names mentioned in NAVER new, by using as control variables gender, age, academic background and party, which were reported in precedent studies that they had an influence on the election.
According to the study results, this study could indirectly analyze what statistically significant influence the number of names mentioned in NAVER news had on the ratio of the earned votes and the ratio of winning the election, and what influence the awareness of candidates had on voters in the election.
Although it could not make a correct prediction of election only with awareness of candidates and effects of parties in a certain region, it could analyze somewhat which candidate would be elected.
A lot of news we did not think in the traditional media is falling in cataracts even now. These news data have grown as big data, not small data. Therefore, we need to analyze meanings in them. This study aims even ordinary voters can make prediction of election easily without cost, by crawling political news on NAVER, a portal site boasting the share of almost 80% in the domestic market, starting from the day of registering as a candidate for the 19th National Assembly until the day before the election, by extracting the number of names of candidates mentioned in news through data-mining, by statistically analyzing what effects they had on the ratio of the earned votes and the ratio of winning the election and by making a prediction model of election.
Targeting the dependent variables the ratio of the earned votes and the ratio of winning the election, this study explained the explanatory variable, the number of names mentioned in NAVER new, by using as control variables gender, age, academic background and party, which were reported in precedent studies that they had an influence on the election.
According to the study results, this study could indirectly analyze what statistically significant influence the number of names mentioned in NAVER news had on the ratio of the earned votes and the ratio of winning the election, and what influence the awareness of candidates had on voters in the election.
Although it could not make a correct prediction of election only with awareness of candidates and effects of parties in a certain region, it could analyze somewhat which candidate would be elected.
주제어
#선거
#득표율
#당선율
#선거 예측 모형
#인터넷 뉴스 빅데이터
#election
#the ratio of the earned votes
#the ratio of winning the election
#prediction model of election
#internet news big data
학위논문 정보
저자
서찬웅
학위수여기관
연세대학교 정보대학원
학위구분
국내석사
학과
빅데이터전공
지도교수
이준기
발행연도
2016
총페이지
vi, 45장
키워드
선거,
득표율,
당선율,
선거 예측 모형,
인터넷 뉴스 빅데이터,
election,
the ratio of the earned votes,
the ratio of winning the election,
prediction model of election,
internet news big data
※ AI-Helper는 부적절한 답변을 할 수 있습니다.