네트워크 서버 접근시 발생되는 로그는 네트워크 관리에 필수적인 다양한 정보를 가지고 있다. 이러한 정보에서 네트워크 관리에 유용한 정보를 추출하여 사용자 접속량, 비정상적인 접근 등을 예측하여 네트워크 관리의 효율성을 높이고 비용을 줄일 수 있다. 네트워크 관리자는 SNMP를 활용하여 네트워크상 서버의 CPU, 메모리, 디스크 사용율과 같은 정보를 기반으로 서버의 상태를 실시간으로 파악할 수 있다. 본 논문에서는 네트워크 6가지 로그를 분석하여 사용자의 접속량을 예측에 필요한 정보를 추출한 후 시계열 분석 방법인 이동평균법과 지수평활법을 적용하여 실험하였다. 또한 SNMP 시뮬레이터를 활용하여 서버의 CPU, 메모리, 디스크 사용율에 관한 OID를 추출하여 서버의 상태와 장애 예측을 시계열 분석방법으로 실험한 후 엑셀과 R 프로그래밍언어를 통해 시각화된 예측 결과를 제시하였다.
네트워크 서버 접근시 발생되는 로그는 네트워크 관리에 필수적인 다양한 정보를 가지고 있다. 이러한 정보에서 네트워크 관리에 유용한 정보를 추출하여 사용자 접속량, 비정상적인 접근 등을 예측하여 네트워크 관리의 효율성을 높이고 비용을 줄일 수 있다. 네트워크 관리자는 SNMP를 활용하여 네트워크상 서버의 CPU, 메모리, 디스크 사용율과 같은 정보를 기반으로 서버의 상태를 실시간으로 파악할 수 있다. 본 논문에서는 네트워크 6가지 로그를 분석하여 사용자의 접속량을 예측에 필요한 정보를 추출한 후 시계열 분석 방법인 이동평균법과 지수평활법을 적용하여 실험하였다. 또한 SNMP 시뮬레이터를 활용하여 서버의 CPU, 메모리, 디스크 사용율에 관한 OID를 추출하여 서버의 상태와 장애 예측을 시계열 분석방법으로 실험한 후 엑셀과 R 프로그래밍언어를 통해 시각화된 예측 결과를 제시하였다.
The log has variable informations that are important and necessary to manage a network when accessed to network servers. These informations are used to reduce a cost and efficient manage a network through the meaningful prediction information extraction from the amount of user access. And, the netwo...
The log has variable informations that are important and necessary to manage a network when accessed to network servers. These informations are used to reduce a cost and efficient manage a network through the meaningful prediction information extraction from the amount of user access. And, the network manager can instantly monitor the status of CPU, memory, disk usage ratio on network using the SNMP. In this paper, firstly, we have accumulated and analysed the 6 network logs and extracted the informations that used to predict the amount of user access. And then, we experimented the prediction simulation with the time series analysis such as moving average method and exponential smoothing. Secondly, we have simulated the usage ration of CPU, memory, and disk using Xian SNMP simulator and extracted the OID for the time series prediction of CPU, memory, and disk usage ration. And then, we presented the visual result of the variable experiments through the Excel and R programming language.
The log has variable informations that are important and necessary to manage a network when accessed to network servers. These informations are used to reduce a cost and efficient manage a network through the meaningful prediction information extraction from the amount of user access. And, the network manager can instantly monitor the status of CPU, memory, disk usage ratio on network using the SNMP. In this paper, firstly, we have accumulated and analysed the 6 network logs and extracted the informations that used to predict the amount of user access. And then, we experimented the prediction simulation with the time series analysis such as moving average method and exponential smoothing. Secondly, we have simulated the usage ration of CPU, memory, and disk using Xian SNMP simulator and extracted the OID for the time series prediction of CPU, memory, and disk usage ration. And then, we presented the visual result of the variable experiments through the Excel and R programming language.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구의 목적은 네트워크상에서 보안사고 및 위협에 선제적으로 대응하기 위해 네트워크 로그를 분석하고 접속량을 예측하여 예상 접속 시기에 집중적인 선제적 지원을 통해 접속자의 불편을 최소하고 관리자의 인프라 투입 비용을 절감하고자 한다. 또한 서버 상태에 대한 지속적인 데이터를 분석하여 임계점 이상의 사용률이 발생하는 경우에 대비하여 서버 장애 예측에 대응하고자 한다.
본 논문에서는 네트워크 로그와 SNMP를 통한 서버 상태를 분석하고 예측하여 네트워크 접속량을 예측, 서버 장애 예측 시기에 집중적 경계 및 지원을 통한 선제적 대응 모델을 설정하기 위해 R[5,6] 기반의 라이브러리를 이용하여 시계열 분석 기법 중 이동평균법과 지수평활법을 통해 실험하고 생성된 예측 결과를 제시하였다.
본 연구에서는 Xian SNMP 시뮬레이터에서 CPU, 메모리, 디스크 사용률 정보를 획득에 필요한 OID를 분석한 후 그 값에 대한 시계열 분석을 통해 CPU, 메모리, 디스크 사용률에 관한 예측 실험을 진행하였다.
본 연구의 목적은 네트워크상에서 보안사고 및 위협에 선제적으로 대응하기 위해 네트워크 로그를 분석하고 접속량을 예측하여 예상 접속 시기에 집중적인 선제적 지원을 통해 접속자의 불편을 최소하고 관리자의 인프라 투입 비용을 절감하고자 한다. 또한 서버 상태에 대한 지속적인 데이터를 분석하여 임계점 이상의 사용률이 발생하는 경우에 대비하여 서버 장애 예측에 대응하고자 한다.
제안 방법
SNMP 시뮬레이션을 통한 서버의 CPU, 메모리, 이스크 사용량을 예측하기 위해 그림 6과 같은 Xian 시뮬레이터에서 시계열 데이터 수집에 필요한 OID를 결정하고 그 값을 0~23시까지의 1일 데이터 생성한 뒤 1년 데이터를 축적하였다.
네트워크 로그의 수집은 그림 2와 같이 6가지 서로 다른 로그에 대해 365일 동안 로그를 축적한 후 이를 시간대 별로 접속량을 예측하는 실험을 진행하였다. 실제 실험에서는 가상 로그의 생성과 분석에 신뢰성 높은 SPLUNK를 활용하였으며 시계열 분석 라이브러리의 적용은 엑셀과 R의 라이브러리를 활용하여 예측 결과의 유사도를 비교하여 유사한 예측 결과를 제시하였다.
본 논문에서는 6가지 네트워크 로그를 수집한 후 시계열 분석(이동평균법, 지수 평활법)에 필요한 정보를 SLPUNK를 통해 생성한 후 예측 모델 적용하여 각 로그에 대한 접속량을 예측하는 실험 결과를 제시하였다. 또한 네트워크상의 서버 상태정보를 SNMP를 통해 확보한 후 서버 상태 정보중, CPU 사용률, 메인 메모리 사용율, 디스크 사용률 정보를 기반으로 서버 상태 시계열 예측 정보 생성하는 결과 Xian SNMP 시뮬레이터를 활용하여 실험결과를 제시하였다.
본 논문에서는 6가지 네트워크 로그를 수집한 후 시계열 분석(이동평균법, 지수 평활법)에 필요한 정보를 SLPUNK를 통해 생성한 후 예측 모델 적용하여 각 로그에 대한 접속량을 예측하는 실험 결과를 제시하였다. 또한 네트워크상의 서버 상태정보를 SNMP를 통해 확보한 후 서버 상태 정보중, CPU 사용률, 메인 메모리 사용율, 디스크 사용률 정보를 기반으로 서버 상태 시계열 예측 정보 생성하는 결과 Xian SNMP 시뮬레이터를 활용하여 실험결과를 제시하였다.
SNMP(Simple Network Management Protocol)[3]는 TCP/IP로 구성된 네트워크에서 서버와 같은 노드들을 관리하기 위해 간단하고 운영 가능한 구조와 시스템을 제공하는 단순 전산망 관리 프로토콜로서 구현이 쉽고 간편한 장점을 가지고 있다. 본 논문에서는 SNMP를 통해 주변 서버의 CPU, 메모리, 디스크사용률율 시뮬레이션을 통해 취득한 후 이를 시계열 분석을 통해 서버의 상태 정보에 대한 예측 실험을 진행하였다.
본 논문에서는 그림 1과 같이 다양한 네트워크 로그를 수집한 후 SPLUNK를 통해 네트워크 접속량 예측에 필요한 정보를 추출한 후 엑셀과 R 프로그래밍언어의 시계열 분석(이동 평균법, 지수 평활법) 라이브러리를 활용하여 향후 예상되는 접속량을 시각적으로 제시하였다.
수집된 로그는 SPLUNK를 통해 그림 3과 같이 다양한 분석 결과를 실시간의 시각화된 결과를 확인할 수 있으며 본 논문에서는 시계열 데이터에 해당되는 정보만 추출하여 데이터베이스에 저장하였다.
시뮬레이션은 5개의 서버를 설정한 후 각 서버의 1년 동안 축적된 CPU, 메모리, 디스크 사용율 데이터중 시계열 분석이 가능한 OID만 그림 7과 같이 추출하여 이동평균법, 지수평활법을 엑셀과 R 프로그래밍언어를 이용하여 각각 생성하였다.
네트워크 로그의 수집은 그림 2와 같이 6가지 서로 다른 로그에 대해 365일 동안 로그를 축적한 후 이를 시간대 별로 접속량을 예측하는 실험을 진행하였다. 실제 실험에서는 가상 로그의 생성과 분석에 신뢰성 높은 SPLUNK를 활용하였으며 시계열 분석 라이브러리의 적용은 엑셀과 R의 라이브러리를 활용하여 예측 결과의 유사도를 비교하여 유사한 예측 결과를 제시하였다.
대상 데이터
실제로 디스크 사용률에 대한 시계열 데이터를 수집하기 위해 OID 1.3.6.1.4.1.2021.9.9.번 핵심적으로 활용하였으며 디스크에 사용된 공간의 크기는 %단위이며 사용률에 대한 시계열 데이터는 1시간 마다 평균값을 산정하여 보다 신뢰성 높은 데이터를 확보하였다. 또한 예측된 결과값의 신뢰성 및 타당성을 검증하기 위해 동일 시계열 데이터에 대해 R 프로그래밍 언어의 시계열 분석 라이브러리를 적용하여 그림 9와 같은 동일한 결과를 도출하였다.
데이터처리
번 핵심적으로 활용하였으며 디스크에 사용된 공간의 크기는 %단위이며 사용률에 대한 시계열 데이터는 1시간 마다 평균값을 산정하여 보다 신뢰성 높은 데이터를 확보하였다. 또한 예측된 결과값의 신뢰성 및 타당성을 검증하기 위해 동일 시계열 데이터에 대해 R 프로그래밍 언어의 시계열 분석 라이브러리를 적용하여 그림 9와 같은 동일한 결과를 도출하였다.
이론/모형
분석된 정보는 그래프, 보고서, 경고, 대시보드 및 시각화된 결과를 생성한다. 본 논문에서는 네트워크상에 발생되는 수많은 로그에 대한 분석과 유용한 정보 추출을 위해 SPLUNK를 활용하였다.
후속연구
본 논문의 결과는 네트워크에서 발생되는 다양한 대용량의 정보를 분석하여 네트워크 관리 비용과 장애 등에 선제적으로 대응하는데 활용될 수 있다. 향후에 본 연구를 기반으로 보다 구체적인 정보를 획득과 분석을 통해 다양한 예측 기법을 적용하여 네트워크 효율적인 관리 및 비용 절감에 활용할 계획이다.
본 논문의 결과는 네트워크에서 발생되는 다양한 대용량의 정보를 분석하여 네트워크 관리 비용과 장애 등에 선제적으로 대응하는데 활용될 수 있다. 향후에 본 연구를 기반으로 보다 구체적인 정보를 획득과 분석을 통해 다양한 예측 기법을 적용하여 네트워크 효율적인 관리 및 비용 절감에 활용할 계획이다.
질의응답
핵심어
질문
논문에서 추출한 답변
SPLUNK란 무엇인가?
SPLUNK[2]는 인간이 만들어 내는 휴먼 데이터와 기기 및 장비들이 만들어 내는 머신 데이터에 대해 수집 및 패턴분석을 수행하는 대표적인 도구이다. SPLUNK 솔루션은 웹서비스 기반이며 다양한 데이터 포맷 및 통신방식에서 데이터를 수집한 후 검색 가능한 머신 데이터 저장소에서 실시간으로 데이터를 획득하여 인덱싱한 후, 데이터 사이의 연관성을 분석한다.
SPLUNK의 장점은 무엇인가?
SPLUNK는 단일 소스 뿐만 아니라 수백 GB, TB에 달하는 데이터를 안정적으로 실시간 수집하고 인덱싱하여 사용자는 검색 및 분석을 통해서 보고서를 생성하는데 사용되고 있다. 특징적으로 단순화된 필드 추출기를 통하여 빠르게 데이터 추출할 수 있으며 키워드 검색, 추출된 필드의 즉시 검증이 용이하며 한 번의 동작을 통해 자동으로 탐지된 의미 있는 패턴을 볼 수 있다.
SNMP란 무엇인가?
SNMP는 OSI 7계층인 응용계층에 존재하는 프로토콜로서 네트워크에 존재하는 다양한 장비들을 관리하기 위해 사용되는 간단한 프로토콜로서 네트워크를 관리하기 위한 표준 통신규약이다. 하지만, 표준화 규약으로서 SNMP 자체에서 네트워크 내에 존재하는 장비를 관리하지는 않으며 현재 V.
참고문헌 (10)
Wei-Yu Chen, Jazz wang, "Building a Cloud Computing Analysis System for Intrusion Detection System," CLOUD SLAM, April 2009.
Lee Woo-ri, Time-Series Analysis and Forecast : Understanding and Application, Tomming Publishing Co., Ltd, 2013.
Choi dae soo, Moon Kil-jong, Kim Yong-min, Roh Bong-nam, " Mass Security Log Using MapReduce, " " Korea Information Processing Society, Article 9 of the Korean Information Processing Society, " Article 9, 2011.
Real Time Forecasting System Design and Implementation of Real Time System Using Big Data Log, University of Korea Graduate School of Economics, 2015.
Lee Sang-jun, " abnormal judgment system ", patent 10 - 1542534, UNET system, 2015.
Jung Duk Won, " Real-time analysis and forecasting service framework of traffic giant, " Konkuk University Graduate School of Education, University of Korea,2014.
Symbick-gil, " Real-time mass data analytics technology and application cases, " Ne xR, 2012.
Ravi Kalakota, "USING BUSINESS INTELLIGENCE FOR REAL-TIME DATA MINING, CUSTOMER SEGMENTATION AND PREDICTIVE ANALYTICS", DZone.com, 2013.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.