$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

Lifelong Machine Learning 기반 스팸 메시지 필터링 방법
A Method for Spam Message Filtering Based on Lifelong Machine Learning 원문보기

전기전자학회논문지 = Journal of IKEEE, v.23 no.4, 2019년, pp.1393 - 1399  

안연선 (Dept. of Software, Gachon University) ,  정옥란 (Dept. of Software, Gachon University)

초록
AI-Helper 아이콘AI-Helper

인터넷의 급속한 성장으로 데이터의 송수신의 편리성과 비용이 들지 않는다는 장점 때문에 매일 수백만 건의 무차별적인 광고성 스팸 문자와 메일이 발송되고 있다. 아직은 스팸 단어나 스팸 번호를 차단하는 방법을 주로 사용하지만, 기계 학습이 떠오름에 따라 스팸을 필터링하는 방법에 대해 다양한 방식으로 활발히 연구되고 있다. 그러나 스팸에서만 등장하는 단어나 패턴은 스팸 필터링 시스템에 의해 걸러지지 않기 위해 지속적으로 변화하고 있기 때문에, 기존 기계 학습 메커니즘으로는 새로운 단어와 패턴을 감지, 적응할 수 없다. 최근 이러한 기존 기계 학습의 한계점을 극복하기 위해 기존의 지식을 활용하여 새로운 지식을 지속적으로 학습하도록 하는 Lifelong Learning(이하 LL)의 개념이 대두되었다. 본 논문에서는 문서 분류에 가장 많이 사용되는 나이브 베이즈와 Lifelong Machine Learning(이하 LLML)의 앙상블 기법을 이용한 스팸 메시지 필터링 방법을 제안한다. 우리는 기존 스팸 필터링 시스템에 가장 많이 사용되는 나이브 베이즈와, LLML 모델 중 ELLA를 적용하여 LL의 성능을 검증한다.

Abstract AI-Helper 아이콘AI-Helper

With the rapid growth of the Internet, millions of indiscriminate advertising SMS are sent every day because of the convenience of sending and receiving data. Although we still use methods to block spam words manually, we have been actively researching how to filter spam in a various ways as machine...

주제어

표/그림 (5)

AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 이러한 현안을 해결하기 위해, 본 논문에서는 LLML을 기반으로 스팸을 필터링하는 방법에 대해 제안한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
무차별적인 광고성 메일인 스팸 메일의 문제점은? 일반 사용자들은 이러한 스팸 메일이나 문자를 지우고 정리하는 데만 적지 않은 시간을 소요하고, 네트워크상에서도 엄청난 양의 패킷이 낭비되면서 스팸이 사회문제로 부각되었다. 이러한 문제를 해결하기 위해 정보통신부에서는 ‘정보통신망 이용촉진 및 정보보호 등에 관한 법률 시행령 및 시행규칙 개정안’을 마련해 두었으며, KISA에서는 불법 스팸대응 시스템을 통해 대책을 마련하고 서비스하고 있다.
광고성 스팸 문자와 메일이 무차별적으로 발송되는 이유는? 인터넷의 급속한 성장으로 데이터의 송수신의 편리성과 비용이 들지 않는다는 장점 때문에 매일 수백만 건의 무차별적인 광고성 스팸 문자와 메일이 발송되고 있다. 아직은 스팸 단어나 스팸 번호를 차단하는 방법을 주로 사용하지만, 기계 학습이 떠오름에 따라 스팸을 필터링하는 방법에 대해 다양한 방식으로 활발히 연구되고 있다.
스팸 메일이란? 이 때문에 기업에서는 여전히 업무용 커뮤니케이션 수단으로써 이메일 사용이 거의 절대적이다. 하지만 송수신의 편리성과 비용이 들지 않는다는 장점으로, 많은 업체들이 무차별적인 광고성 메일을 발송하고 있다. 이를 스팸 메일이라고 불리며, 메일 뿐만 아니라 일반 우편, 게시판, 문자 메시지, 전화, SNS 쪽지 기능 등 여러 수단을 통해 수신되고 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (11)

  1. JM Gomez Hidalgo, GC Bringas, EP Sanz, and FC Garcia, "Content based SMS spam filtering," Proceedings of the 2006 ACM symposium on Document engineering, pp.107-114, 2006. DOI: 10.1145/1166160.1166191 

  2. Andrew McCallum and Kamal Nigam, "A Comparison of Event Models for Naive Bayes Text Classification," AAAI-98 on learning for text categorization, 1998. 

  3. Le Zhang, Jingbo Zhu, and Tianshun Yao, "An Evaluation of statistical spam filtering techniques," ACM Transaction on Asian Language Information Processing, pp.243-269, 2006. DOI: 10.1145/1039621.1039625 

  4. Vangelis Metsis, "Spam Filtering with Naive Bayes-Which Naive Bayes?," CEAS, 2006. 

  5. Zhiyuan Chen and Bing Liu, "Lifelong Machine Learning, Second Edition," Morgan & Claypool publishers, 2018. 

  6. Zhiyuan Chen, Nianzu Ma, and Bing Liu, "Lifelong learning for sentiment classification," ACL, pp 750-756, 2015. 

  7. Ion Androutsopoulos and John Koutsias, "An Evaluation of Naive Bayesian Anti-Spam Filtering," ECML, pp.9-17, 2000. 

  8. Abhishek Kumar and Hal Daume III, "Learning Task Grouping and Overlap in Multi-Task Learning," arXiv:1206.6417, 2012. 

  9. P Ruvolo and E Eaton, "ELLA: An efficient lifelong learning algorithm," ICML, 2013. 

  10. Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean, "Efficient Estimation of word Representations in Vector Space," arXiv:1301.3781 v3, 2013. 

  11. Quoc Le, Toman Milokov, "Distributed Representations of Sentences and Documents," Proc. of the 31st ICML, 2014. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로