$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

형태소 분석을 통한 악성 댓글 필터링 방안
A Filtering Method of Malicious Comments Through Morpheme Analysis 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.21 no.9, 2021년, pp.750 - 761  

하예람 (사상경찰서) ,  천준석 (부산대학교 정보융합공학과) ,  왕인서 (부산대학교 정보융합공학과) ,  박민욱 ((주)유시스) ,  우균 (부산대학교 정보융합공학과)

초록
AI-Helper 아이콘AI-Helper

인터넷 기사에 대한 댓글은 토론 및 소통 등 긍정적 효과도 있지만, 악성 댓글은 사람의 목숨을 앗아가는 정도로 심각한 문제이다. 이런 측면에서 악성 댓글을 자동으로 검출하는 것은 중요한 문제이다. 그러나 현재 채택되고 있는 금칙어 바탕의 댓글 필터 방안은, 특히 한글 댓글의 경우 효과적이지 못한 실정이다. 이 논문에서는 형태소 분석을 통해 비속어 형태소와 존대어 형태소를 구별함으로써 댓글 필터링을 수행하는 방법을 제안한다. 이들 두 형태소를 바탕으로 댓글 건전도를 계산하고, 또한 건전도를 바탕으로 한 댓글 충격량 계산방법을 여럿 제안한다. 악성 댓글을 대상으로 한 실험을 수행한 결과, 포털에서 수행되고 있는 클린봇보다 재현율이 37.93% 포인트 개선되었으며 F-지수 값은 47.66 포인트 개선된 것으로 나타났다. 이 결과에 따르면, 형태소 분석을 기초로 한 새로운 필터 방법이 금칙어를 바탕으로 한 방법의 좋은 대안이 될 수 있을 것으로 기대된다.

Abstract AI-Helper 아이콘AI-Helper

Even though the replying comments on Internet articles have positive effects on discussions and communications, the malicious comments are still the source of problems even driving people to death. Automatic detection of malicious comments is important in this respect. However, the current filtering...

주제어

표/그림 (16)

AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 이 논문에서는 온라인 포털 사이트의 뉴스 기사에 대한 악성 댓글을 필터링하는 방법에 대해 제안하고 실험 결과를 제시하였다. 구체적으로 악성 댓글을 필터링하기 위한 시스템을 제안하고 이 시스템을 기반으로 여러 가지 실험을 수행하였다.
  • 이 논문은 뉴스 사이트의 악성 댓글을 필터링하기 위해 댓글의 속성 및 어조의 특성을 파악하여 비속어의 강도에 따른 심층적인 비속어 필터링 방법을 제안한다. 먼저 뉴스 포털(네이버 뉴스)의 기사별 댓글을 수집하여 댓글 길이별로 악성 댓글 분포를 조사하였다.

가설 설정

  • 여기에서는 댓글 길이별로 악성 댓글 분포도가 차이가 있는지를 확인하였다. 앞에서 우리는 댓글 길이가 길면 악성 댓글이 있을 확률이 높다고 가정하였다. 실험을 위해 2021년 6월 1일 하루 동안 업로드되는 네이버 기사를 분야별로 댓글을 수집하였다.
본문요약 정보가 도움이 되었나요?

참고문헌 (28)

  1. 연합뉴스, "네이버.카카오 스포츠뉴스 댓글 잠정 중단...'선수 고통 심각'(종합)," https://www.yna.co.kr/view/AKR20200807067551017. 

  2. 박문서, "인터넷 익명성과 전자상거래," 한국통상정보학회, Vol.4, No.2, pp.201-222, 2002. 

  3. 헌법재판소, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 제44조의5 제1항 제2호 등 위헌확인, https://law.go.kr/헌재결정례/(2010헌마47,20120823). 

  4. 경찰청, 전체 사이버범죄 발생.검거 현황, https://www.police.go.kr/www/open/publice/publice0204.jsp. 

  5. 방송통신심의위원회, "인터넷 내용 등급 서비스란?," http://www.safenet.ne.kr/dstandard.do. 

  6. 이윤정, 지정훈, 우균, 조환규, "인터넷 게시물의 댓글분석 및 시각화," 한국콘텐츠학회논문지, 제9권, 제7호, pp.45-56, 2009. 

  7. 김영일, 김영준, 김영진, 김경일, "악성 댓글의 특성: 한국어와 영어의 인터넷 뉴스 댓글 비교," 한국콘텐츠학회논문지, 제19권, 제1호, pp.548-558, 2019. 

  8. liwc.wpengine.com, Linguistic Inquiry and Word Count, http://liwc.wpengine.com/. 

  9. 이창환, 심정미, 윤애선, "언어적 특성을 이용한 '심리학적 한국어 글분석 프로그램(KLIWC)' 개발 과정에 대한 고찰," 한국인지과학회, 제16권, 제2호, pp.93-121, 2005. 

  10. S. E. Robertson, Term specificity, letter to the editor], 1972. 

  11. S. E. Robertson, "Documentation Note: Specificity and Weighted Retrieval," Journal of Documentation, Vol.30, No.1, pp.41-46 1974. 

  12. S. E. Robertson, "The probability ranking principle in information retrieval," Journal of Documentation, Vol.33, No.4, pp.294-340, 1977. 

  13. 김묘실, 강승식, "SVM을 이용한 악성 댓글 판별 시스템의 설계 및 구현," 한국정보과학회 언어공학연구회 학술대회, pp. 285-289, 2006. 

  14. Thorsten Joachims, SVMLight: Support Vector Machine, https://www.cs.cornell.edu/people/tj/svm_light/. 

  15. G. E. Sims, S. Jun, G. A. Wu, and S. Kim, "Alignment-free genome comparison with feature frequency profiles (FFP) and optimal resolutions," Proceedings of the National Academy of Sciences, Vol.106, No.8, pp.2677-2682, 2009. 

  16. 김현정, 윤영미, 이병문, "향상된 FFP(Feature Frequency Profile)을 활용한 악성 댓글의 판별시스템," 한국정보기술학회논문지, 제9권, 제1호, pp.207-216, 2011. 

  17. 홍진주, 인터넷 악성댓글 탐지 기법, 숭실대학교 소프트웨어특성화대학원, 석사학위논문, 2016. 

  18. 여론집중도조사위원회, 2016~2018 뉴스 이용집중도 조사 결과 발표, 문화체육관광부, 2018. 

  19. K. Reitz, Requests: HTTP for Humans TM , https://docs.python-requests.org/en/master. 

  20. L. Richardson, Beautiful Soup Documentation, https://www.crummy.com/software/BeautifulSoup/bs4/doc. 

  21. J. Huggins, SeleniumHQ Browser Automation, https://www.selenium.dev. 

  22. 하예람, 박민욱, 우균, "비속어와 높임말의 분포를 고려한 인터넷 뉴스 댓글 분석," 2019년 한국정보과학회종합학술대회, 제9권, 제1호, pp.509-513, 2019. 

  23. 박은정, 조성준, "KoNLPy: 쉽고 간결한 한국어 정보처리 파이썬 패키지," 한글 및 한국어 정보처리 학술대회 논문집, 제26회, 2014. 

  24. 꼬꼬마 형태소 분석기, http://kkma.snu.ac.kr. 

  25. 한국게임산업진흥원, 게임언어 건전화 지침서 연구 - 게임 내 채팅언어의 표준화를 중심으로-,2008. 

  26. 안태형, "악성 댓글의 범위와 유형," 우리말연구, 제32권, pp.109-131, 2013. 

  27. 하예람, 비속어 분포를 고려한 뉴스 댓글 필터링 방법, 부산대학교, 석사학위논문, 2020. 

  28. 정현정, "네이버.카카오 욕설 DB 합친다. 중소 커뮤니티에도 제공," 전자신문, https://m.etnews.com/20210718000047. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로