[논문]5G 모바일 에지 컴퓨팅에서 빅데이터 분석 기능에 대한 데이터 오염 공격 탐지 성능 향상을 위한 연구

옥지원; 노현; 임연섭; 김성민

doi:10.13089/jkiisc.2023.33.3.549

5G 모바일 에지 컴퓨팅에서 빅데이터 분석 기능에 대한 데이터 오염 공격 탐지 성능 향상을 위한 연구
A Study on Improving Data Poisoning Attack Detection against Network Data Analytics Function in 5G Mobile Edge Computing 원문보기

情報保護學會論文誌 = Journal of the Korea Institute of Information Security and Cryptology, v.33 no.3, 2023년, pp.549 - 559

옥지원 (성신여자대학교) , 노현 (성신여자대학교) , 임연섭 (성신여자대학교) , 김성민 (성신여자대학교)

초록
AI-Helper

5G 네트워크의 핵심 기술로 모바일 에지 컴퓨팅(Mobile Edge Computing, MEC)이 주목받음에 따라, 모바일 사용자의 데이터를 기반으로 한 5G 네트워크 기반 에지 AI 기술이 최근 다양한 분야에서 이용되고 있다. 하지만, 전통적인 인공지능 보안에서와 마찬가지로, 에지 AI 핵심 기능을 담당하는 코어망 내 표준 5G 네트워크 기능들에 대한 적대적 교란이 발생할 가능성이 존재한다. 더불어, 3GPP에서 정의한 5G 표준 내 Standalone 모드의MEC 환경에서 발생할 수 있는 데이터 오염 공격은 기존 LTE망 대비 현재 연구가 미비한 실정이다. 본연구에서는 5G에서 에지 AI의 핵심 기능을 담당하는 네트워크 기능인 NWDAF를 활용하는 MEC 환경에 대한 위협 모델을 탐구하고, 일부 개념 증명으로써 Leaf NWDAF에 대한 데이터 오염 공격 탐지 성능을 향상시키기 위한 특징 선택 방법을 제안한다. 제안한 방법론을 통해, NWDAF에서의 Slowloris 공격 기반 데이터 오염 공격에 대해 최대 94.9%의 탐지율을 달성하였다.

Abstract ▼ AI-Helper

As mobile edge computing (MEC) is gaining attention as a core technology of 5G networks, edge AI technology of 5G network environment based on mobile user data is recently being used in various fields. However, as in traditional AI security, there is a possibility of adversarial interference of standard 5G network functions within the core network responsible for edge AI core functions. In addition, research on data poisoning attacks that can occur in the MEC environment of standalone mode defined in 5G standards by 3GPP is currently insufficient compared to existing LTE networks. In this study, we explore the threat model for the MEC environment using NWDAF, a network function that is responsible for the core function of edge AI in 5G, and propose a feature selection method to improve the performance of detecting data poisoning attacks for Leaf NWDAF as some proof of concept. Through the proposed methodology, we achieved a maximum detection rate of 94.9% for Slowloris attack-based data poisoning attacks in NWDAF.

주제어

표/그림 (6)

그림 Fig. 1. A NWDAF Architecture for distributed and federated learning in 5G MEC Environment
그림 Fig. 2. Operation process of NWDAF architecture including feature selection in 5G MEC environment
표 Table 1. 5G-NIDD dataset overview (Slowloris Attack)
그림 Fig. 3. Accuracy of test dataset and training dataset
표 Table 2. Information on the main features of the slowloris dataset
표 Table 3. Comparison of classification performance according to feature selection

AI 본문요약
AI-Helper

문제 정의

특히, 5G 네트워크 통신 과정에서 데이터 오염 공격 가능성이 있지만, 5G SA 방식의 네트워크 프로세스는 LTE망과 차이가 존재하므로 기존의 데이터 오염 공격에 관련 연구를 적용할 수 없다는 한계점이존재한다. 본 논문에서는 5G SA 모드에서 에지 AI 기술이 결합된 NWDAF 위협 모델에 대해 탐구하고, 제안한 배치 시나리오에서 NWDAF에 대한 데이터 오염 공격 가능성을 확인하였다. 또한, NWDAF에 대한 데이터 오염 공격 탐지 성능을 높이기 위해 특징 선택 방법을 제안하며 3가지 분류기를 통해 성능을 비교하며 특징 선택의 필요성을 입증하였다.
이때 MEC마다 1개의 단말이 연결되는 식으로 gNodeB는 단말로부터 정상 및 오염 데이터를 받고, AMF 및 SMF에 데이터를 전달하기 위해 UPF(User Plane Function)를 거친다. 본 논문에서는 각 MEC에서 모델 성능을 높이기 위해 Leaf NWDAF에서 특징 선택을 수행하는 시나리오를 고려한다. 전체적인 동작 과정은 크게 3가지 프로세스로 구분된다.
본 연구에서는 네트워크 기능에 대한 데이터 오염 공격이 발생할 수 있는 5G 네트워크 환경에서의 NWDAF 아키텍처 및 시나리오를 선행 연구를 바탕으로 고안하고, 5G MEC 환경에서 인공지능을 활용하는 NWDAF 아키텍처 배치 시나리오를 설명한다. 먼저 데이터 오염 공격의 예시로 본 연구에서는 Slowloris 공격을 대상으로 선정하였는데, Slowloris 공격은 헤더 정보에 대한 오염을 통해 웹서버는 트래픽이 아직 전송 중이라고 잘못 인식하게 한다는 점에서 데이터에 잡음(noise)을 주는 오염 공격의 한 예로 활용 가능하다고 볼 수 있다.
본 연구에서는 이러한 MEC 기반 5G NWDAF 아키텍처 동작 과정에서, 데이터 오염 공격의 영향과 이를 탐지하기 위한 특징 선택을 통한 성능 향상을 분석하고 실험을 통해 평가하고자 한다.
본 장에서는 설명한 5G MEC 배치 시나리오에서 기계학습 기반 데이터 오염 공격 탐지 성능 향상을 위한 특징 선택 기법을 탐구한다. 실제 트래픽에 기반한 5G 네트워크 데이터는 기본적으로 통신사업자의 데이터로, 프라이버시 이슈로 인해 얻기 힘들고 공개된 오픈 소스 데이터 셋이 충분하지 않다.

가설 설정

이와 같은 아키텍처에서 단말로부터 공격 데이터가 유입되어 NRF에 오염된 데이터가 존재하는 위협 모델을 가정한다. 이때, 오염된 데이터는 의도적으로 라벨이나 특징 값들을 조작하여 인공지능 학습 모델의 정확도를 떨어뜨리는 데이터를 의미한다.
실제 트래픽에 기반한 5G 네트워크 데이터는 기본적으로 통신사업자의 데이터로, 프라이버시 이슈로 인해 얻기 힘들고 공개된 오픈 소스 데이터 셋이 충분하지 않다. 이중 5G 네트워크에서의 침입 탐지 데이터를 제공하는 5G-NIDD 내 Slowloris 공격 데이터를 4장의 배치 시나리오에서 언급한 바와 같이 악의적인 트래픽을 정상으로 오분류하도록 유도하는 오염된 데이터로 가정한다. Slowloris 공격에 대해 특히 데이터의 라벨 뿐만 아니라, 특징 값 자체에도 오염을 유발하는 예로 보며, 5.

제안 방법

과 같다. 결론적으로, Label을 구분짓는 핵심 특징인 Rate를 포함, 관련하여 중요도가 높은 Sum, TotPkts, SrcRate 4개의 특징을 선택하여 학습한 뒤 5G 데이터 오염 공격 중 하나인Slowloris 공격 탐지 성능을 최종 평가하고자 한다.
본 논문에서는 5G SA 모드에서 에지 AI 기술이 결합된 NWDAF 위협 모델에 대해 탐구하고, 제안한 배치 시나리오에서 NWDAF에 대한 데이터 오염 공격 가능성을 확인하였다. 또한, NWDAF에 대한 데이터 오염 공격 탐지 성능을 높이기 위해 특징 선택 방법을 제안하며 3가지 분류기를 통해 성능을 비교하며 특징 선택의 필요성을 입증하였다. 향후 논의 및 고찰에 따라 5G MEC 환경에서의 NWDAF 아키텍처에서 에지 AI에 대한 데이터 오염 비율에 따른 NWDAF 아키텍처 성능 비교를 하고자 한다.
본 제안에서는 데이터 오염 공격 탐지 성능 향상을 위해 예측의 성능을 저하시키는 특징들을 제거함으로써 과소적합(underfittng)에 대응할 수 있도록 특징 선택을 수행한다. 이때, 결정 트리(decision tree), 선형 회귀(logistic regression), SVM 분류기를 이용하여 특징 선택 여부에 따른 분류 성능을 비교함으로써 제안한 특징 선택 방법론의 실효성을 평가하고자 한다.
2장에서 주요 특징을 살펴보면서 설명하고자 한다. 전체 연합 학습 프로세스 중 지역 모델에 해당하는 Leaf NWDAF에서의 데이터 오염 탐지를 통해 전체 아키텍처 중 일부에 대한 개념 증명(proof of concept)으로 성능을 평가하고자 한다.
특징 선택의 효율성 평가를 위해, 3가지의 지도학습 기반 기계 학습 분류기인 결정 트리, 선형 회귀, SVM을 이용하여 주어진 데이터 셋이 Label이라는 클래스에 따라 분류가 이루어지는지 확인하였다. Slowloris 공격 데이터 셋에서 Label을 제외한 29개 특징과 앞서 Slowloris 공격 데이터 셋에 대한 특징 선택으로 중요도가 높았던 데이터 특징 4개(Rate, Sum, TotPkts, SrcRate)를 나누어서 비교 분석하였다.

데이터처리

특징 선택의 효율성 평가를 위해, 3가지의 지도학습 기반 기계 학습 분류기인 결정 트리, 선형 회귀, SVM을 이용하여 주어진 데이터 셋이 Label이라는 클래스에 따라 분류가 이루어지는지 확인하였다. Slowloris 공격 데이터 셋에서 Label을 제외한 29개 특징과 앞서 Slowloris 공격 데이터 셋에 대한 특징 선택으로 중요도가 높았던 데이터 특징 4개(Rate, Sum, TotPkts, SrcRate)를 나누어서 비교 분석하였다. 이때, 데이터 셋의학습률을 0.
본 제안에서는 데이터 오염 공격 탐지 성능 향상을 위해 예측의 성능을 저하시키는 특징들을 제거함으로써 과소적합(underfittng)에 대응할 수 있도록 특징 선택을 수행한다. 이때, 결정 트리(decision tree), 선형 회귀(logistic regression), SVM 분류기를 이용하여 특징 선택 여부에 따른 분류 성능을 비교함으로써 제안한 특징 선택 방법론의 실효성을 평가하고자 한다.

이론/모형

실험 환경 구축을 위한 기계 학습 툴체인의 경우, Google Colab을 활용하였다. GeForce RTX3090 GPU를 사용하고, Ubuntu 22.

성능/효과

은 전체 데이터 셋의 30%에 해당하는 테스트 데이터 셋에 대한 분류 Accuracy, Precision, Recall, F1 score이며, 소수 넷째 자리에서 반올림하여 나타낸 결과이다. 3가지 분류기 모두 전처리된 전체 특성을 모두 포함하여 학습을 진행하는 것보다 데이터 오염 공격 탐지 성능 향상을 목적으로 특징 선택을 한 경우가 분류 성능이 개선됨을 확인할 수 있다. 주목할 점은 특징 중요도 분석 시 활용된 결정 트리 분류기 성능 뿐만 아니라, 선형 회귀 및 SVM 모델에서도 성능이 향상된다는 것이다.

후속연구

이러한 오염 비율의 변화는 5G MEC 아키텍처 내연합 학습 시나리오에서 각 Leaf NWDAF 마다 다양하게 나타날 수 있다. 따라서 본 제안에 관한 후속 연구로 데이터 오염 비율을 다양하게 조정을 하며 데이터 편향성에 대해 실험해볼 계획이다.
본 연구에서는 네트워크 기능에 대한 데이터 오염 공격이 발생할 수 있는 5G 네트워크 환경에서의 NWDAF 아키텍처 및 시나리오를 선행 연구를 바탕으로 고안하고, 5G MEC 환경에서 인공지능을 활용하는 NWDAF 아키텍처 배치 시나리오를 설명한다. 먼저 데이터 오염 공격의 예시로 본 연구에서는 Slowloris 공격을 대상으로 선정하였는데, Slowloris 공격은 헤더 정보에 대한 오염을 통해 웹서버는 트래픽이 아직 전송 중이라고 잘못 인식하게 한다는 점에서 데이터에 잡음(noise)을 주는 오염 공격의 한 예로 활용 가능하다고 볼 수 있다.
이때, MEC의 엔티티로부터 받은 데이터에 대한 신뢰성을 완벽히 보장할 수 없는 상태로 각 데이터가 센트럴 클라우드의 집계함수에 악영향을 끼칠 수 있다. 본 논문에서는 지역 모델에서의 학습에 대해서만 성능 평가를 수행했기 때문에 연합학습 시 MEC에 입력되는 오염 비율에 따라 전역 모델에 어떤 영향을 끼치는지에 대해서 후속 연구를 수행하고자 한다.에 어떤 영향을 끼치는지에 대해서 후속 연구를 수행하고자한다.
5G MEC 환경이 AI와 결합하여 확대됨에 따라 사이버 보안 위협 영역 증가하고 있지만, 해당 영역 식별에 대한 연구가 부족한 실정이다. 특히, 5G 네트워크 통신 과정에서 데이터 오염 공격 가능성이 있지만, 5G SA 방식의 네트워크 프로세스는 LTE망과 차이가 존재하므로 기존의 데이터 오염 공격에 관련 연구를 적용할 수 없다는 한계점이존재한다. 본 논문에서는 5G SA 모드에서 에지 AI 기술이 결합된 NWDAF 위협 모델에 대해 탐구하고, 제안한 배치 시나리오에서 NWDAF에 대한 데이터 오염 공격 가능성을 확인하였다.
또한, NWDAF에 대한 데이터 오염 공격 탐지 성능을 높이기 위해 특징 선택 방법을 제안하며 3가지 분류기를 통해 성능을 비교하며 특징 선택의 필요성을 입증하였다. 향후 논의 및 고찰에 따라 5G MEC 환경에서의 NWDAF 아키텍처에서 에지 AI에 대한 데이터 오염 비율에 따른 NWDAF 아키텍처 성능 비교를 하고자 한다.

참고문헌 (21)

A. C. Chen Liu, O. M. K. Law, J. Liao, J. Y. C. Chen, A. J. En Hsieh and C. H. Hsieh, "Traffic Safety System Edge AI Computing," 2021 IEEE/ACM Symposium on Edge Computing (SEC), pp. 01-02, Dec. 2021.？
S.W.Hong et al, "Technologies of Intelligence Edge Computing and Networking," Electronics and Telecommunications Trends, 34(1), pp.23-35, Feb. 2019.？
M.K.Shin, "Development of Network Data Analytics Function (NWDAF) and Intelligence Technology Standards for 5G Network Automation," TPKO 202100009073, Electronics and Telecommunications Research Institute, 2021.？
3GPP, "Release 16 Description; Summary of Rel-16 Work Items," TR 21.916, 2020.？
S. -M. Senouci, H. Sedjelmaci, J. Liu, M. H. Rehmani and E. Bou-Harb, "AI-Driven Cybersecurity Threats to Future Networks," IEEE Vehicular Technology Magazine, vol. 15, no. 3, pp. 5-6, Sep. 2020.？
S. Hussain, O. Chowdhury, S. Mehnaz, and E. Bertino, "LTE-Inspector: A Systematic Approach for Adversarial Testing of 4G LTE," Network and Distributed Systems Security (NDSS) Symposium, Jan. 2018.？
Chuan Yu, Shuhui Chen, Fei Wang, and Ziling Wei, "Improving 4G/5G air interface security: A survey of existing attacks on different LTE layers," Computer Networks: The International Journal of Computer and Telecommunications Networking, vol. 201, no.C, DOI:10.1016/j.comnet.2021.108532, Dec. 2021.？

상세보기
H. Fang, X. Wang and S. Tomasin,"Machine Learning for Intelligent Authentication in 5G and Beyond Wireless Networks," IEEE Wireless Communications, vol. 26, no. 5, pp.55-61, Oct. 2019.？

상세보기
C. Benzaid and T. Taleb, "AI forBeyond 5G Networks: A Cyber-Security Defense or Offense Enabler?," IEEE Network, vol. 34, no.6, pp. 140-147, Dec. 2020.？

상세보기
Y. Jeon, H. Jeong, S. Seo, T. Kim, H.Ko and S. Pack, "A Distributed NWDAF Architecture for Federated Learning in 5G," 2022 IEEE International Conference on Consumer Electronics (ICCE), pp. 1-2, 2022.？
Sehan Samarakoon et al, "5G-NIDD: A Comprehensive Network Intrusion Detection Dataset Generated over 5G Wireless Network," IEEE Dataport, Dec. 2022.？
3GPP, "Architecture enhancements for 5G System (5GS) to support network data analytics services," TS23.288, 2021.？
3GPP, "5G; 5G System; Network function repository services; Stage3," TS 29.510, 2019.？
E. Yalin, E. Sagduyu, and Yi. Shi, Adversarial Machine Learning for 5G Communications Security, IEEE Game Theory and Machine Learning for Cyber Security, pp. 270-288, Jan. 2021.？
D. Moustis and P. Kotzanikolaou, "Evaluating security controls against HTTP-based DDoS attacks," IISA 2013, pp. 1-6, Jul. 2013.？
Y. Liu, J. Peng, J. Kang, A. M. Iliyasu, D. Niyato and A. A. A. El-Latif, "A Secure Federated Learning Framework for 5G Networks," IEEE Wireless Communications, vol. 27, no. 4, pp. 24-31, Aug. 2020.？

상세보기
S.Y.Lee et al, "Federated learning over private 5G networks: demo", Proceedings of the Twenty-Third International Symposium on Theory, Algorithmic Foundations, and Protocol Design for Mobile Networks and Mobile Computing (MobiHoc '22). Association for Computing Machinery, pp. 295-296, Oct. 2022.？
E. Piri, P. Ruuska, T. Kanstren, J.Makela, J. Korva, A. Hekkala, A.Pouttu, O. Liinamaa, M. Latva-Aho, and K. Vierimaa, "5GTN: A Test Network for 5G Application Development and Testing," 2016 European Conference on Networks and Communications (EuCNC), pp. 313-318, Jun. 2016.？
Girish Chandrashekar, Ferat Sahin, "A survey on feature selection methods," Computers & Electrical Engineering, vol. 40, no. 1, pp. 16-28, Nov. 2014.？

상세보기
N. M. Tahir, A. Hussain, S. A.Samad, K. A. Ishak and R. A. Halim,"Feature Selection for Classification Using Decision Tree," 2006 4th Student Conference on Research and Development, pp. 99-102, Jun. 2006.？
Argus, "Argus: System + Network Monitoring," https://jaw0.github.io/argus5docs/docs/, 2023. 03. 30.

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증