$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

Splunk 플랫폼을 활용한 유해 정보 탐지를 위한 빅데이터 분석 시스템 설계
Design of Splunk Platform based Big Data Analysis System for Objectionable Information Detection 원문보기

한국정보전자통신기술학회논문지 = Journal of Korea institute of information, electronics, and communication technology, v.11 no.1, 2018년, pp.76 - 81  

이협건 (Department of Data Analysis, Seoul Gangseo Campus of Korea Polytech) ,  김영운 (Department of Data Analysis, Seoil University) ,  김기영 (Department of Computer, Soongsil University) ,  최종석 (Department of Computer, Soongsil University)

초록
AI-Helper 아이콘AI-Helper

미래 경제 성장 동력으로 부상하고 있는 사물인터넷은 이미 생활과 밀접한 분야에서는 도입이 활발하게 이루어지고 있으나, 잠재된 보안위협은 여전히 잔존하고 있다. 특히 인터넷 상의 유해 정보는 스마트홈스마트시티의 활성화로 인해 폭발적으로 설치된 CCTV에 할당된 IP 정보 및 심지어 접속 포트 번호들이 포털 검색 결과 및 페이스북, 트위터와 같은 소셜 미디어 등에 공개되어 간단한 툴로도 보다 쉽게 해킹이 가능하다. 사용자들이 많이 사용하는 포털 검색 데이터 및 소셜 미디어 데이터의 보안취약점 및 불법 사이트 정보들을 데이터 분석하여, 보안취약성 같은 위험 요소가 내포된 데이터 및 사회적 문제를 야기하는 불법 사이트에 대한 대응을 신속하게 수행할 수 있게 지원하는 빅데이터 분석 시스템이 필요하다. 본 논문에서는 빅데이터 분석 시스템 설계를 위해 하둡 기반 빅데이터 분석 시스템과 스파크 기반 빅데이터 분석 시스템 연구를 통해 요구사항을 도출하여 요구사항에 맞게 Splunk 플랫폼을 활용한 유해 정보 탐지를 위한 빅데이터 분석 시스템을 설계하였다.

Abstract AI-Helper 아이콘AI-Helper

The Internet of Things (IoT), which is emerging as a future economic growth engine, has been actively introduced in areas close to our daily lives. However, there are still IoT security threats that need to be resolved. In particular, with the spread of smart homes and smart cities, an explosive amo...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 Splunk 플랫폼을 활용한 유해 정보 탐지를 위한 빅데이터 분석 시스템 설계하였다. 제안하는 시스템은 인터넷 및 IT 기기의 기술이 발달함에 따라 증가되고 있는 보안취약성과 같은 위험 요소가 내포된 데이터 및 불법 사이트 데이터와 같은 유해 정보를 포털 사이트와 소셜 미디어로부터 빅데이터를 수집한 뒤, 그 데이터들을 빅데이터 분석하여 발견된 보안취약점 및 불법 사이트 정보에 대해 시각화를 수행한다.
  • 이에 본 연구에서는 빅데이터 솔루션 중 세계 점유율 1위인 Splunk Enterprise를 이용하여 유해 정보 탐지를 위한 빅데이터 분석 시스템을 설계한다. 제안하는 빅데이터 분석 시스템은 인터넷 및 IT 기기의 기술이 발달함에 따라 증가되고 있는 보안취약성과 같은 위험 요소가 내포된 데이터 및 불법 사이트 데이터와 같은 유해 정보를 포털 사이트와 소셜 미디어로부터 빅데이터를 수집한 뒤, 그 데이터들을 빅데이터 분석하여 발견된 보안취약점 및 불법 사이트 정보에 대해 시각화를 수행한다.

가설 설정

  • Splunk Forwarder는 Collector Layer의 Data Link API로 전달받은 수집된 데이터를 Splunk Indexer에 적합한 데이터 형태로 변환하여 저장하는 역할을 수행한다. 제안하는 빅데이터 분석 시스템에서 포털 데이터와 소셜 미디어 데이터를 Splunk Forwarder를 이용하여 수집하지 않고 별도의 Collector Layer를 이용하여 구현한 이유는 Splunk는 Crawling을 지원하지 않으며, 기존 구축된 시스템에 수집 모듈을 설치하여 수집하는 방식이기 때문이다. Splunk Indexer는 Splunk가 데이터 분석을 수행하기 위한 데이터가 저장되는 저장소이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
Collector Layer이 수행하는 기능은? Collector Layer는 분석에 필요한 포털 사이트 및 소셜 미디어 데이터를 수집하는 영역으로 데이터 수집기능과 수집된 데이터 전달 기능을 수행한다. 데이터수집 기능은 연구 개발한 수집 알고리즘이 적용된 Web Crawling Agent와 Social Crawling Agent를 이용하여 수행한다.
빅데이터 분석 시스템이 갖추어야 할 사항 중 데이터의 양과 관련된 부분은? 첫째, 빅데이터 분석 시스템들이 처리하는 데이터의 양과 서버의 규모는 기존의 분석 시스템들과는 달리 그 규모가 매우 크다. 또한 빅데이터 분석 시스템의 대부분의 핵심적인 사항들은 비용적인 측면에서의 효율성, 지속적으로 증가하는 데이터들의 수용, 빈번하게 발생하는 장애에 대한 대처와 인프라 관리의 편리성이 요구된다.
스파크 기반 빅데이터 분석 시스템의 장점은? 스파크 기반 빅데이터 분석 시스템의 장점은 메모리를 활용하여 빅데이터 저장·처리를 수행하기 때문에 맵 리듀스를 활용하는 하둡 기반 빅데이터 분석 시스템에 비해 빅데이터 처리 성능은 약 30배 이상 차이난다. 스파크 기반 빅데이터 분석 시스템의 단점은 빅데이터를 분석하기 위해 원천 데이터를 RDD로 변경하여 메모리로 데이터를 처리하기 때문에 빅데이터 분석을 위해 인프라 구축하는 발생되는 비용이 매우 크다.
질의응답 정보가 도움이 되었나요?

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로