산업 전 분야에 4차 산업혁명의 신기술인 IoT(Internet of Things), AI(Artificial Intelligence), Bigdata 등이 융합되어 새로운 가치를 창출하는 초연결 지능정보사회가 도래되고 있다. 모든 것이 네트워크에 연결되어 데이터가 폭발적으로 증가하고, 인공지능이 스스로 학습하여 지적 판단 기능까지도 가능하다. 특히 사물인터넷은 언제 어디서나 어느 것과도 연결될 수 있는 새로운 통신환경을 제공함에 따라 모든 것들이 연결되는 초 연결을 가능케 하고 있다. 인공지능 기술은 인간이 가진 지각, 학습, 추론, 자연어처리 등의 능력을 컴퓨터가 실행할 수 있도록 구현되고 있다. 인공지능은 기계학습, 딥러닝(Deep leearning), 자연어처리, 음성인식, 시각인식 등 첨단기술을 개발하는 방향으로 발전되고 있으며, 안전, 의료, 국방, 금융, 복지 등의 다양한 응용 분야에 특화된 소프트웨어와 머신러닝(Machine learning), 클라우드(Cloud) 기술을 포함하고 있다. 이를 통해 인간의 편의와 새로운 가치를 제공하기 위해 산업 전반의 다양한 분야에 활용된다. 하지만, 이와는 반대로 지능적이고 정교해진 사이버 위협들이 증가하고 신기술의 기술적 안전성 확보와 같은 잠재적 역기능들을 동반함에 따라 이에 대한 대응이 필요한 시점이다. 본 논문에서는 이러한 역기능을 해결하기 위한 하나의 방안으로 인공지능기술을 활용하여 IoT 통합보안관제 가능하도록 새로운 데이터모델링(Data modelling) 방안을 제안하였다.
산업 전 분야에 4차 산업혁명의 신기술인 IoT(Internet of Things), AI(Artificial Intelligence), Bigdata 등이 융합되어 새로운 가치를 창출하는 초연결 지능정보사회가 도래되고 있다. 모든 것이 네트워크에 연결되어 데이터가 폭발적으로 증가하고, 인공지능이 스스로 학습하여 지적 판단 기능까지도 가능하다. 특히 사물인터넷은 언제 어디서나 어느 것과도 연결될 수 있는 새로운 통신환경을 제공함에 따라 모든 것들이 연결되는 초 연결을 가능케 하고 있다. 인공지능 기술은 인간이 가진 지각, 학습, 추론, 자연어처리 등의 능력을 컴퓨터가 실행할 수 있도록 구현되고 있다. 인공지능은 기계학습, 딥러닝(Deep leearning), 자연어처리, 음성인식, 시각인식 등 첨단기술을 개발하는 방향으로 발전되고 있으며, 안전, 의료, 국방, 금융, 복지 등의 다양한 응용 분야에 특화된 소프트웨어와 머신러닝(Machine learning), 클라우드(Cloud) 기술을 포함하고 있다. 이를 통해 인간의 편의와 새로운 가치를 제공하기 위해 산업 전반의 다양한 분야에 활용된다. 하지만, 이와는 반대로 지능적이고 정교해진 사이버 위협들이 증가하고 신기술의 기술적 안전성 확보와 같은 잠재적 역기능들을 동반함에 따라 이에 대한 대응이 필요한 시점이다. 본 논문에서는 이러한 역기능을 해결하기 위한 하나의 방안으로 인공지능기술을 활용하여 IoT 통합보안관제 가능하도록 새로운 데이터모델링(Data modelling) 방안을 제안하였다.
A hyper-connected intelligence information society is emerging that creates new value by converging IoT, AI, and Bigdata, which are new technologies of the fourth industrial revolution, in all industrial fields. Everything is connected to the network and data is exploding, and artificial intelligenc...
A hyper-connected intelligence information society is emerging that creates new value by converging IoT, AI, and Bigdata, which are new technologies of the fourth industrial revolution, in all industrial fields. Everything is connected to the network and data is exploding, and artificial intelligence can learn on its own and even intellectual judgment functions are possible. In particular, the Internet of Things provides a new communication environment that can be connected to anything, anytime, anywhere, enabling super-connections where everything is connected. Artificial intelligence technology is implemented so that computers can execute human perceptions, learning, reasoning, and natural language processing. Artificial intelligence is developing advanced technologies such as machine learning, deep learning, natural language processing, voice recognition, and visual recognition, and includes software, machine learning, and cloud technologies specialized in various applications such as safety, medical, defense, finance, and welfare. Through this, it is utilized in various fields throughout the industry to provide human convenience and new values. However, on the contrary, it is time to respond as intelligent and sophisticated cyber threats are increasing and accompanied by potential adverse functions such as securing the technical safety of new technologies. In this paper, we propose a new data modeling method to enable IoT integrated security control by utilizing artificial intelligence technology as a way to solve these adverse functions.
A hyper-connected intelligence information society is emerging that creates new value by converging IoT, AI, and Bigdata, which are new technologies of the fourth industrial revolution, in all industrial fields. Everything is connected to the network and data is exploding, and artificial intelligence can learn on its own and even intellectual judgment functions are possible. In particular, the Internet of Things provides a new communication environment that can be connected to anything, anytime, anywhere, enabling super-connections where everything is connected. Artificial intelligence technology is implemented so that computers can execute human perceptions, learning, reasoning, and natural language processing. Artificial intelligence is developing advanced technologies such as machine learning, deep learning, natural language processing, voice recognition, and visual recognition, and includes software, machine learning, and cloud technologies specialized in various applications such as safety, medical, defense, finance, and welfare. Through this, it is utilized in various fields throughout the industry to provide human convenience and new values. However, on the contrary, it is time to respond as intelligent and sophisticated cyber threats are increasing and accompanied by potential adverse functions such as securing the technical safety of new technologies. In this paper, we propose a new data modeling method to enable IoT integrated security control by utilizing artificial intelligence technology as a way to solve these adverse functions.
개략적 인내용은 이를 위해 어떻게 IoT 기기의 로그를 수집하는가 이다. 또한, 기존의 레거시 기반의 보안로그와 어떻게 함께 분석하고, 인공지능기술을 활용하는 방안을 제안하였다.
제 Ⅲ 장에서는 인공지능 기술활용에 있어서 핵심적인 데이터 모델링에 대한 알고리즘의 동향과 데이터모델링 원칙을 선정하게 된 내용을 다루었다. 또한, 데이터셋 구성기준에 따라 데이터의 수집부터 전처리과정까지 알아보았다. 제 Ⅳ장에서는 인공지능 기술이 반영된 IoT 통합보안관제 데이터모델링 검증을 위해 알고리즘을 선정하였다.
제 Ⅳ장에서는 인공지능 기술이 반영된 IoT 통합보안관제 데이터모델링 검증을 위해 알고리즘을 선정하였다. 마지막으로 효과검증방안을 수립하여 데이터모델링에 대한 정합성을 검증하였다. 제 Ⅴ장은 본 연구의 데이터모델링에 대한 결론으로 연구의 결과를 정리하고 앞으로 인공지능 기술의 IoT 통합보안관제 분야에 추가적 연구가 필요한 부분을 기술하였다.
데이터모델링을 할 경우 그 목표를 선정하고 목표에 맞는 방법으로 하는 것이 무엇보다 중요하다. 본 논문에서는 인공지능 기술을 활용하여 보안이벤트에 대한정합도를 인공지능을 통해 높일 수 있도록 머신러닝에 적합한 모델링을 제안하였다. 그 안에는 IoT 관련 데이터가 포함되도록 하는 것이 핵심이라고 할 수 있다.
앞장에서 설명한 신기술에 의해 발생하는 다양하고 복잡한 서비스별 위협을 선제적으로 대응이 필요하여 보안관제기관의 사이버 위기를 능동적이고 효과적으로 관리할 수 있는 능동형 통합보안관제를 제시하였다.
제 Ⅱ 장에서는 인공지능 기술의 IoT 통합보안관제의 필요성과 그 활용방안을 알아본다. 이를 위해 통합보안관제의 체계와 능동형 IoT 통합보안관제 프로세스를 정리하였다. 최종 목표 플랫폼 방안을 설계하고 실무에서 최종적인 활용을 위해 요구되는 문제에 대해 극복방안들에 대해서도 정리하였다.
마지막으로 효과검증방안을 수립하여 데이터모델링에 대한 정합성을 검증하였다. 제 Ⅴ장은 본 연구의 데이터모델링에 대한 결론으로 연구의 결과를 정리하고 앞으로 인공지능 기술의 IoT 통합보안관제 분야에 추가적 연구가 필요한 부분을 기술하였다.
대상 데이터
본 논문의 실습을 위해 사용된 데이터는 국내 공공기관의 광역시급의 6개원간의 보안로그 데이터량으로 데이터수집은 실제 업무에서 사용되는 보안관제시스템의 가공 로그(6개월), 취약점 정보(6개월), 침해사고 조사 결과보고서(6개월), 일일 관제일지(6개월)를 자료를 활용하였다.
또한, 데이터셋 구성기준에 따라 데이터의 수집부터 전처리과정까지 알아보았다. 제 Ⅳ장에서는 인공지능 기술이 반영된 IoT 통합보안관제 데이터모델링 검증을 위해 알고리즘을 선정하였다. 마지막으로 효과검증방안을 수립하여 데이터모델링에 대한 정합성을 검증하였다.
데이터처리
데이터 전처리를 통해 재분류된 데이터를 기반으로 [그림 6]과 같이 1차 탐색에서 기술통계/빈도분석과 상관분석을 통해 대표 값을 선정했다. 2차 탐색은 등급화 산정과 이상 값 존재 탐색을 해서 최종 특성을 선정했다.
이론/모형
앞에서 선정된 알고리즘을 통한 모델학습을 위해서 [그림 7]과 같이 파이선에서 사이킷런(sci kit-learn)을사용하였다. 파이선 기반의 머신러닝을 위한 가장 쉽고 효율적인 개발 라이브러리를 제공한다.
성능/효과
본 논문에서 새롭게 개발된 예측 모델은 IoT에 대한 통합보안관제를 인공지능기술을 적용할 수 있도록 하였다. 하지만, 인공지능기술을 통해 사람처럼 판단하려면 더욱 많은 로그를 통해 수많은 라벨링을 하여 정합도를 높여야 한다.
이를 통해 실무에서 보안관제 요원 수십 명이 오랜 시간 분석해야 할 정·오탐에 대해 단시간에 인공지능이 정합도가 높은 판단을 하여 단순분석 인력은 현저하게 줄일 수 있을 것이다
후속연구
구현 된 결과는 소프트웨어 모듈 형태로 탑재하여 사용할 수 있도록하고, 추가로 위협데이터를 기반으로 더 많이 학습하여 적용할 수 있는 예측모델이 지속적으로 개발되어야 한다.
이를 통해 실무에서 보안관제 요원 수십 명이 오랜 시간 분석해야 할 정·오탐에 대해 단시간에 인공지능이 정합도가 높은 판단을 하여 단순분석 인력은 현저하게 줄일 수 있을 것이다. 나아가더 다양한 환경에서 적용할 수 있는 연구의 기초자료가 되어 연구 분야를 확대할 수 있을 것이다.
한정적인 로그로 학습을 한 결과는 정합 도는 매우 높지만, 오버피팅(Overfitting)으로 인한 오탐을 유발하는 한계점이 있다. 추후 더 다양한 로그와 실제 IoT 로그까지 활용하여 학습할 수 있도록 지속적인 연구를 해야 한다. 이를 통해 실무에서 보안관제 요원 수십 명이 오랜 시간 분석해야 할 정·오탐에 대해 단시간에 인공지능이 정합도가 높은 판단을 하여 단순분석 인력은 현저하게 줄일 수 있을 것이다.
최종 성능평가지표를 위해서 Training Data( 70%) 를 통해서 학습하고, Test Data(30%)를 기준으로 학습성능을 최종 평가 한 결과는 아래와 같이 매우 높은 정합도를 보였다. 하지만, [표 8]과 같이 너무 높은 정합도는오탐을 야기할 수 있고, 이를 개선하기 위해서 더욱 다양한 로그를 통한 연구가 지속되어 개선할 필요가 있다.
하지만, 인공지능기술을 통해 사람처럼 판단하려면 더욱 많은 로그를 통해 수많은 라벨링을 하여 정합도를 높여야 한다. 한정적인 로그로 학습을 한 결과는 정합 도는 매우 높지만, 오버피팅(Overfitting)으로 인한 오탐을 유발하는 한계점이 있다. 추후 더 다양한 로그와 실제 IoT 로그까지 활용하여 학습할 수 있도록 지속적인 연구를 해야 한다.
참고문헌 (10)
김진성, 안전한 AIoT 서비스를 위한 자율 사물의 보안성 강화 방안, 아주대학교 정보통신, 석사학위논문, 2021.
정지만, 4차 산업혁명을 대비한 딥러닝 기술의 금융보안 적용 연구, 국민대학교 컴퓨터공학, 석사학위논문, 2018.
김인원, 지능형 영상보안시스템의 수용의도 영향 요인에 관한 연구, 숭실대학교대학원 IT정책경영학과, 박사학위논문, 2017.
홍준혁, 인공지능기반 보안관제 구축 및 대응 방안, 배재대학교 사이버보안학과, 석사학위논문, 2021.
이보라, 금융 보안에서 휴먼팩터를 고려한 인간과 인공지능의 역할 및 협업 모델, 고려대학교 정보보호대학원, 연구논문, 2018.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.