이태진
/ 서울특별시 송파구 문정로 **, ***동 ****호(문정동, 문정푸르지오아파트)
황찬웅
/ 경기도 시흥시 중심상가로 *** 계룡*차아파트 ***동 ***호
김효식
/ 경기도 평택시 안중읍 안현로서*길 **, 서광미소마을 ***동 ****호
출원인 / 주소
호서대학교 산학협력단 / 충청남도 아산시 배방읍 호서로**번길 ** (호서대학교)
대리인 / 주소
조경화
심사청구여부
있음 (2020-12-01)
심사진행상태
등록결정(일반)
법적상태
등록
초록▼
본 발명에 따른 DGA 생성 도메인 탐지 및 분류 방법은, TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하고, 순서번호 벡터 요소와 대응하는 원 핫 벡터와 치환하여 이미지의 표현으로 나타내며, 원 핫 벡터는 68개의 문자와 식별할 수 없는 문자 1개를 포함한 69개의 문자에 대한 순서번호와, 패딩을 표현할 순서번호 0을 추가한 70개의 순서번호를 사용하여, 70개 순서번호에 대응하는 69 길이의 원 핫 벡터이고, 여기서 0번 순서번호는 0으로 채워진 제로벡터이고, 순서번호 1 내지 69는 각 순서에 맞는 벡터요소가 1
본 발명에 따른 DGA 생성 도메인 탐지 및 분류 방법은, TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하고, 순서번호 벡터 요소와 대응하는 원 핫 벡터와 치환하여 이미지의 표현으로 나타내며, 원 핫 벡터는 68개의 문자와 식별할 수 없는 문자 1개를 포함한 69개의 문자에 대한 순서번호와, 패딩을 표현할 순서번호 0을 추가한 70개의 순서번호를 사용하여, 70개 순서번호에 대응하는 69 길이의 원 핫 벡터이고, 여기서 0번 순서번호는 0으로 채워진 제로벡터이고, 순서번호 1 내지 69는 각 순서에 맞는 벡터요소가 1로 표현되는 벡터이다. TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하기 전에, 도메인주소가 전처리되며, 상기 전처리는 먼저, 도메인주소의 문자열을 문자 단위로 분할하고, 분할된 각 문자에 대응하는 순서번호에 맞게 문자가 치환되며, 치환된 순서번호 벡터의 길이가 100보다 짧으면 패딩 순서번호 0번을 붙여 길이 100으로 만들고, 만약 순서벡터의 길이가 100보다 길면 초과된 순서번호를 벡터를 잘라낸다. Text CNN에서 콘볼루션 과정은 콘볼루션 레이어와 맥스풀링 레이어의 반복으로 이루어지며, 콘볼루션 레이어는 입력된 벡터에 대해 정해진 크기의 필터를 이용하여 합성곱을 진행하며, 맥스풀링 레이어는 입력된 벡터의 국소영역에서 최대값만을 보존하여 벡터의 크기를 축소하며, 콘볼루션 과정을 통해 얻은 벡터를 한 줄의 벡터(풀 레이어)로 변환하여, 512, 512, 100 그리고 20 의 노드를 가지는 레이어들로 구성된 ANN을 통해서 DGA 탐지 및 분류 수행한다. 학습된 모델로부터 ANN구조의 3번째 레이어를 추출한 100개의 특징정보와 도메인 주소의 문자열 정보로부터 알 수 있는 정보를 8개의 특징정보를 합한 108개의 특징정보를 입력으로 하는 LightGbm 모델을 이용한 DGA 탐지 및 분류한다.
대표청구항▼
DGA 생성 도메인 탐지 및 분류 방법에 있어서,TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하고, 순서번호 벡터 요소와 대응하는 원 핫 벡터와 치환하여 이미지의 표현으로 나타내고,상기 원 핫 벡터는 68개의 문자와 식별할 수 없는 문자 1개를 포함한 69개의 문자에 대한 순서번호와, 패딩을 표현할 순서번호 0을 추가한 70개의 순서번호를 사용하여, 70개 순서번호에 대응하는 69 길이의 원 핫 벡터이고, 여기서 0번 순서번호는 0으로 채워진 제로벡터이고, 순서번호 1 내지 69는 각 순서에 맞는 벡터요소가 1로 표현
DGA 생성 도메인 탐지 및 분류 방법에 있어서,TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하고, 순서번호 벡터 요소와 대응하는 원 핫 벡터와 치환하여 이미지의 표현으로 나타내고,상기 원 핫 벡터는 68개의 문자와 식별할 수 없는 문자 1개를 포함한 69개의 문자에 대한 순서번호와, 패딩을 표현할 순서번호 0을 추가한 70개의 순서번호를 사용하여, 70개 순서번호에 대응하는 69 길이의 원 핫 벡터이고, 여기서 0번 순서번호는 0으로 채워진 제로벡터이고, 순서번호 1 내지 69는 각 순서에 맞는 벡터요소가 1로 표현되는 벡터이고,TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하기 전에, 도메인주소가 전처리되며, 상기 전처리는 먼저, 도메인주소의 문자열을 문자 단위로 분할하고, 분할된 각 문자에 대응하는 순서번호에 맞게 문자가 치환되며, 치환된 순서번호 벡터의 길이가 100보다 짧으면 패딩 순서번호 0번을 붙여 길이 100으로 만들고, 만약 순서벡터의 길이가 100보다 길면 초과된 순서번호를 잘라내는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류하는 방법.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.