$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

머신러닝 기반 보안데이터 분석 연구 원문보기

情報保護學會誌 = KIISC review, v.29 no.3, 2019년, pp.6 - 13  

이식 (국민대학교 컴퓨터공학과) ,  김동훈 (국민대학교 컴퓨터공학과) ,  조영훈 (국민대학교 컴퓨터공학과) ,  명준우 (국민대학교 컴퓨터공학과) ,  문다민 (국민대학교 컴퓨터공학과) ,  이재구 (국민대학교 컴퓨터공학과) ,  윤명근 (국민대학교 컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

최근 머신러닝 기술이 비약적으로 발전하고 있다. 하드웨어 성능이 향상되고 머신러닝 활용 도구가 오픈소스로 사용 편리하게 개발되어 대중화됨으로써 보안데이터 분석 분야에서도 머신러닝을 이용한 기술 개발이 활발히 진행되고 있다. 본 논문에서는 보안 분야의 악성코드 데이터와 보안관제 로그 데이터를 주요 대상으로 머신러닝 기술을 적용할 때 고려되어야 할 기술적 사항들과 최신 연구 동향, 데이터 셋 특징, 그리고 머신러닝 기반의 보안데이터 분석 기술의 기대 효과 및 현재 기술의 한계점 등을 다루도록 한다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 보안데이터 중 악성코드와 보안관제 로그 분석을 위하여 머신러닝과 딥러닝을 이용하는 최근 연구 동향과 국내외 주요 데이터 분석대회 동향을 소개했다. 보안데이터 분석은 학문적으로나 실용적으로 사이버보안에 있어서 중요한 영역이었으며, 인공지능 기술이 결합 되었을 때 가장 크게 발전할 수 있는 영역이기도 하다.
  • 본 논문에서는 최근 머신러닝 기술을 이용한 보안데 이터 분석 분야의 연구 동향을 소개한다. 주요 연구 논문과 보안데이터 분석 대회를 소개한다.
  • 머신러닝을 데이터 분석 기술로서 사용할 때는 머신 러닝 알고리즘 및 모델 최적화 기술만큼이나 데이터의 특성을 분석하는 것이 중요하다. 본 논문에서는 최근 악성코드 데이터의 특징을 소개하고 이러한 특징이 데이터 분석에 어떤 영향을 미치는지 살펴본다.
  • 본 논문에서는 최근 머신러닝 기술을 이용한 보안데 이터 분석 분야의 연구 동향을 소개한다. 주요 연구 논문과 보안데이터 분석 대회를 소개한다. 그리고 주요 머신러닝 알고리즘과 보안데이터 분석에서 이용할 때의 주요 고려사항들을 다룬다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
머신러닝 기반 악성코드 분석 연구 중 악성과 정상을 분류하는 문제에서는 일반적으로 정상 파일이 악성 파일보다 구하기 어려운 경우가 많은데, 이를 해결할 수 있는 방법으로 무엇이 있는가? 악성과 정상을 분류하는 문제에서는 일반적으로 정상 파일이 악성 파일보다 구하기 어려운 경우가 많다. 이 문제를 해결하기 위해서 부족한 파일을 확보된 데이터로부터 생성해내는 머신러닝 분야의 데이터 증강(data augmentation) 기술을 도입하여 사용할 수 있다[2]. 다른 대안으로는 카스퍼스키 보고서에서 소개된 방식처럼 일차적으로 악성코드들을 대분류해놓고 분류된 그룹별로 악성과 정상을 판별해주는 이진 분류기를 학습시키는 방식을 고려할 수 있다[15]. [그림 3]는 카스 퍼스키의 머신러닝 기반 악성코드 탐지 전략을 보여준다.
머신러닝을 이용한 보안데이터 분석은 어떤 과정을 통해 이루어지는가? 머신러닝을 이용한 보안데이터 분석 과정은 데이터 수집, 가공, 피처추출, 학습모델 구현 및 검증, 테스트 과정으로 이루어진다([그림 1] 참고). 딥러닝은 이 중에서 피처추출 부분을 자동으로 해준다는 장점이 있으며, 특히 원본 데이터(raw data)만을 입력으로 주면 알아서 피처추출과 학습까지 자동으로 완료해주는 경우를 E2E 딥러닝(end-to-end deep learning)이라고 한다.
보안관제 로그의 특징은 무엇인가?  보안관제 로그의 특징은 발생한 이벤트 중 정탐(true positive)의 비율이 전체 로그 대비 매우 적으며, 오탐 (false positive) 발생이 매우 많다는 점이다. 과거 보안 관제 로그 분석 연구는 정탐 비율을 높이고 오탐 비율을 낮추는 것을 주요 목표로 하였으며, 대다수의 보안관제 로그 분석을 수행하는 실무 기관에서는 발생한 공격 탐지 이벤트들을 내부적으로 한 번 더 거르는 규칙들을 보유하고 있다.
질의응답 정보가 도움이 되었나요?

저자의 다른 논문 :

LOADING...

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로