$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

효과적인 가짜 뉴스 탐지를 위한 텍스트 분석과 네트워크 임베딩 방법의 비교 연구
A Comparative Study of Text analysis and Network embedding Methods for Effective Fake News Detection 원문보기

디지털융복합연구 = Journal of digital convergence, v.17 no.5, 2019년, pp.137 - 143  

박성수 (성균관대학교 경영대학) ,  이건창 (성균관대학교 글로벌경영학과)

초록
AI-Helper 아이콘AI-Helper

가짜 뉴스는 소셜 미디어와 같이 사용자가 상호작용하는 미디어 플랫폼에서 정보가 빠른 속도로 확산되는 이점을 가지는 오류 정보(misinformation)의 한 형태이다. 최근 가짜 뉴스의 증가로 인해 사회적으로 많은 문제가 발생하고 있다. 본 논문에서는 이러한 가짜 뉴스를 탐지하는 방법을 제안한다. 이전의 가짜 뉴스 탐지는 텍스트 분석을 사용한 연구가 주로 수행되었다. 본 연구는 소셜 미디어의 뉴스가 확산되는 네트워크에 초점을 두고, 네트워크 임베딩 방법인 DeepWalk 로 자질을 생성하고 로지스틱 회귀분석을 사용하여 가짜 뉴스를 분류한다. 인터넷에 공개된 뉴스 211개와 120만개의 뉴스 확산 네트워크 데이터를 사용한 가짜 뉴스 탐지에 대한 실험을 수행하였다. 연구 결과 텍스트 분석에 비하여 네트워크 임베딩을 사용한 가짜 뉴스 탐지의 정확도가 최소 1.7%에서 최대 10.6% 더 높게 나타났다. 또한, 텍스트 분석과 네트워크 임베딩을 결합한 가짜 뉴스 탐지는 네트워크 임베딩에 비해 정확도의 상승이 나타나지 않았다. 본 연구의 결과는 기업이나 조직은 온라인 상에서 확산되는 가짜 뉴스 탐지에 효과적으로 활용될 수 있다.

Abstract AI-Helper 아이콘AI-Helper

Fake news is a form of misinformation that has the advantage of rapid spreading of information on media platforms that users interact with, such as social media. There has been a lot of social problems due to the recent increase in fake news. In this paper, we propose a method to detect such false n...

주제어

표/그림 (5)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 가짜 뉴스가 비사실적 주장을 뒷받침하기 위해 다른 맥락의 진짜 증거를 인용하는 경우, 텍스트 분석만으로 가짜 뉴스 탐지는 충분한 성과를 내기 어렵다. 따라서, 본 연구는 가짜 뉴스의 탐지에 초점을 두고, 최근 활발한 연구가 이루어지는 네트워크 임베딩 방법을 적용한 가짜뉴스 탐지 방법에 대한 다음과 같은 연구 문제(Research Question)를 다룬다.
  • 네트워크 임베딩 연구는 컴퓨터 과학 분야에서 활발하게 많은 연구가 이루어지고 있으나 연구용 데이터를 벗어나 실제 데이터의 활용과 적용에 대한 연구는 극히 적은 실정이다. 본 연구는 네트워크 임베딩을 실제 데이터에 적용하고 효율적인 가짜 뉴스 탐지가 가능함을 실증 결과로 제시하였다. 둘째, 텍스트 분석 위주의 연구가 이루어지는 가짜 뉴스 탐지 분야에 대해 네트워크 분석을 통한 새로운 방향을 제시하였다.
  • 최근까지 가짜 뉴스를 탐지하는 다양한 방법이 연구되었지만 더욱 정교하고 다양하게 변화하는 환경에 적응 가능한 가짜 뉴스 탐지 방법에 대한 연구가 필요하다. 본 연구는 네트워크를 벡터 공간에 표현하는 네트워크 임베딩을 사용한 가짜 뉴스 탐지 방법으로 효율적인 가짜 뉴스 탐지 방법을 실증한다.
  • 본 연구는 효율적인 소셜 네트워크와 같은 온라인에서 급속도로 증가하는 가짜 뉴스에 대한 탐지 방법을 제시하는 목적한다. 이를 위해 최근 활발한 연구가 수행되는 네트워크 임베딩을 가짜 뉴스 탐지에 적용하였다.
  • 본 연구의 목적인 텍스트와 네트워크 임베딩 방법을 결합한 가짜 뉴스 탐지를 위해 소셜 네트워크 상에 전파되는 사실이 입증되지 않는 가짜 뉴스 및 루머를 수집한다. 소셜 네트워크인 트위터에서 가짜 뉴스와 관련된 키워드를 언급하는 트윗과 트위터리안의 리트윗 관계를 추출한다.

가설 설정

  • 가짜 뉴스의 광범위한 확산은 개인과 사회에 심각한 부정적인 영향을 미친다. 첫째, 가짜 뉴스는 뉴스 생태계의 균형을 깨뜨리게 된다. 예를 들어, 가장 인기 있는 가짜 뉴스가 2016년 미국 대통령 선거에서 가장 인기 있는 정통 주류 뉴스보다 페이스 북에서 훨씬 더 널리 퍼져 나갔다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
본 연구에서 정의하는 가짜뉴스란? 본 연구는 가짜뉴스를 다음과 같이 정의한다. 가짜 뉴스는 “소셜 미 디어와 같이 사용자가 상호작용하는 미디어 플랫폼에서 정보가 빠른 속도로 확산되는 이점을 가지는 오류 정보 (misinformation)의 한 형태”이다.
가짜 뉴스 탐지가 어려운 이유는? 이러한 가짜 뉴스를 빠르게 탐지하고 확산을 방지하는 것이 중요한 이슈이지만 현재까지 명확한 방법을 제시하는 연구는 찾아보기 어렵다. 가짜 뉴스 탐지가 어려운 것은 가짜 뉴스의 주제, 스타일 및 미디어 플랫폼 측면에서 다양한 방법으로 진실을 왜곡하면서 동시에 진짜 정보를 가리기 때문이다. 가짜 뉴스가 비사실적 주장을 뒷받침하기 위해 다른 맥락의 진짜 증거를 인용하는 경우, 텍스트 분석만으로 가짜 뉴스 탐지는 충분한 성과를 내기 어렵다.
전통적인 네트워크 표현이 대규모 네트워크 처리 및 분석에서 도달한 한계점은 무엇인가? 전통적인 네트워크 표현은 오늘날 대규모 네트워크 처리 및 분석에서 한계에 도달하였다. 전통적인 표현에서 간선 세트를 사용하여 명시적인 관계를 표현하는 것이 가장 큰 한계점이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (17)

  1. H. Allcott & M. Gentzkow. (2017). "Social media and fake news in the 2016 election". Journal of Economic Perspectives, 31(2), 211-236. DOI: 10.1257/jep.31.2.211 

  2. N. J. Conroy, V. L. Rubin & Y. Chen. (2015). "Automatic deception detection: methods for finding fake news". Proceedings of the Association for Information Science and Technology, 52(1), 1-11. 

  3. E. Mustafaraj & P. T. Metaxas. (2017). "The fake news spreading plague: Was it preventable?". Proceedings of the 2017 ACM on Web Science Conference, 235-239. 

  4. M. Potthast, J. Kiesel, K. Reinartz, J. Bevendorff & B. Stein. (2018). "A stylometric inquiry into hyperpartisan and fake news". Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (ACL'18), 231-240 

  5. J. Tang, Y. Chang, & H. Liu. (2014). "Mining social media with social theories: A survey". ACM SIGKDD Explorations Newsletter. 15(2), 20-29. 

  6. V. L. Rubin, Y. Chen & N. J. Conroy. (2015). "Deception detection for news: Three types of fakes". Proceedings of the Association for Information Science and Technology, 52(1), 1-11. 

  7. B. D. Horne & S. Adali. (2017). "This just in: Fake news packs a lot in title, uses simpler, repetitive content in text body, more similar to satire than real news". Proceedings of AAAI, 1-9. 

  8. H. Ahmed, I. Traore & S. Saad. (2017). "Detection of online fake news using n-gram analysis and machine learning techniques". International Conference on Intelligent, Secure, and Dependable Systems in Distributed and Cloud Environments, 127-138. 

  9. Z. Jia, L. Zhao & N. Zhou.. (2017). "The research on fraud group mining which based on social network analysis". IEEE International Conference on Computer and Communications Analysis, 2387-2391. 

  10. Z. Jin, J. Cao, Y. Zhang & J. Luo. (2016). "News Verification by Exploiting Conflicting Social Viewpoints in Microblogs". Proceedings of AAAI, 2972-2978. 

  11. E. Tacchini, G. Ballarin, M. L. Della Vedova, S. Moret, & L. de Alfaro. (2017). "Some like it hoax: Automated fake news detection in social networks," CEUR Workshop Proceedings (1960), 1-12. 

  12. N. Ruchansky, S. Seo & Y. Liu. "CSI: A hybrid deep model for fake news detection". Proceedings of the 2017 ACM on Conference on Information and Knowledge Management (CIKM '17), 797-806. 

  13. S. Kwon, M. Cha, K. Jung, W. Chen & Y. Wang. (2013). "Prominent features of rumor propagation in online social media". IEEE 13th International Conference on Data Mining, 1103-1108. 

  14. T. Mikolov, K. Chen, G. Corrado & J. Dean. (2013). "Efficient Estimation of Word Representations in Vector Space". Proceedings of Workshop at ICLR, 1-12. 

  15. B. Perozzi, R. Al-Rfou & S. Skiena. (2014). "DeepWalk: Online learning of social representations". Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '14), 701-710. 

  16. A. Grover & J. Leskovec. (2016). "Node2Vec: Scalable feature learning for networks". Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '16), 855-864. 

  17. K. Shu, S. Wang & H. Liu. (2019). "Exploiting tri-relationship for fake news detection". Proceedings of 12th ACM International Conference on Web Search and Data Mining (WSDM 2019), arXiv:1712.07709. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로