[학위논문]드론의 폭탄 투하 공격에 대응하기 위한 지상무인무기체계의 심층 강화학습기반 회피기동 연구 Evasive Maneuvering Based on Deep Reinforcement Learning for Ground Unmanned Weapon Systems in Response to Drone Bombing Attacks.
러시아 우크라이나 전쟁에서 전차는 드론에서 투하된 폭탄에 의해 큰 피해를 받았다. 하지만 현재 지상무기체계의 주요 방호 수단인 장갑과 능동방어체계만으 로는 이를 충분히 대응하기에 한계가 있다. 본 연구에서는 이에 대응할 수 있는 또 다른 수단으로서 심층 강화학습 기반 회피기동 모델을 제안한다. 본 연구에서 는 3차원의 시뮬레이션 공간에 지상무인무기체계, 폭탄, 그리고 폭탄을 피해 도 달해야 할 목적지를 정의하였다. 다음으로 이를 심층 ...
러시아 우크라이나 전쟁에서 전차는 드론에서 투하된 폭탄에 의해 큰 피해를 받았다. 하지만 현재 지상무기체계의 주요 방호 수단인 장갑과 능동방어체계만으 로는 이를 충분히 대응하기에 한계가 있다. 본 연구에서는 이에 대응할 수 있는 또 다른 수단으로서 심층 강화학습 기반 회피기동 모델을 제안한다. 본 연구에서 는 3차원의 시뮬레이션 공간에 지상무인무기체계, 폭탄, 그리고 폭탄을 피해 도 달해야 할 목적지를 정의하였다. 다음으로 이를 심층 강화학습에 적용하기 위해 상태, 행동, 보상을 정의하고 ‘점진적 목표증가 기법’을 고안 및 적용하였다. 다음 으로 학습 및 평가를 통해서 심층 강화학습 기반 회피기동 모델의 성능과 ‘점진 적 목표증가 기법’의 효과를 확인하였다. 그 결과 지상무인무기체계가 폭탄을 피 해 목적지까지 81.3%의 확률로 도착하는 것을 확인했다. 또한 ‘점진적 목표증가 기법’을 적용하지 않으면 학습에 따른 획득 보상이 낮을 뿐 아니라, 지상무인무 기체계가 폭탄을 피해서 목적지에 도달하지 못하는 것을 확인하여 그 효과를 검 증하였다. 향후 본 연구가 지상무인무기체계의 생존성을 높이는 데에 도움이 되 기를 기대한다. 주요어 : 강화학습, 회피기동, PPO(Proximal Policy Optimization)
러시아 우크라이나 전쟁에서 전차는 드론에서 투하된 폭탄에 의해 큰 피해를 받았다. 하지만 현재 지상무기체계의 주요 방호 수단인 장갑과 능동방어체계만으 로는 이를 충분히 대응하기에 한계가 있다. 본 연구에서는 이에 대응할 수 있는 또 다른 수단으로서 심층 강화학습 기반 회피기동 모델을 제안한다. 본 연구에서 는 3차원의 시뮬레이션 공간에 지상무인무기체계, 폭탄, 그리고 폭탄을 피해 도 달해야 할 목적지를 정의하였다. 다음으로 이를 심층 강화학습에 적용하기 위해 상태, 행동, 보상을 정의하고 ‘점진적 목표증가 기법’을 고안 및 적용하였다. 다음 으로 학습 및 평가를 통해서 심층 강화학습 기반 회피기동 모델의 성능과 ‘점진 적 목표증가 기법’의 효과를 확인하였다. 그 결과 지상무인무기체계가 폭탄을 피 해 목적지까지 81.3%의 확률로 도착하는 것을 확인했다. 또한 ‘점진적 목표증가 기법’을 적용하지 않으면 학습에 따른 획득 보상이 낮을 뿐 아니라, 지상무인무 기체계가 폭탄을 피해서 목적지에 도달하지 못하는 것을 확인하여 그 효과를 검 증하였다. 향후 본 연구가 지상무인무기체계의 생존성을 높이는 데에 도움이 되 기를 기대한다. 주요어 : 강화학습, 회피기동, PPO(Proximal Policy Optimization)
As the war between Russia and Ukraine erupted, a new pattern of warfare, previously unseen, emerged. Notably, the Ukrainian forces have been using dr ones as a means to drop bombs, causing significant damage to Russia, and th is has been reported through various media. Bomb dropping attacks using dr...
As the war between Russia and Ukraine erupted, a new pattern of warfare, previously unseen, emerged. Notably, the Ukrainian forces have been using dr ones as a means to drop bombs, causing significant damage to Russia, and th is has been reported through various media. Bomb dropping attacks using dro nes also pose a threat to ground unmanned weapon systems that will be dev eloped in the future. However, the main protective measures of current groun d weapon systems, armor and active protection systems, have their limitations in sufficiently responding to these threats. This study proposes a deep reinfor cement learning-based evasion maneuver model to enable future Unmanned G round Weapon Systems to counter drone bomb attacks. To this end, a three- dimensional simulation space was constructed, defining the unmanned ground weapon system, the bomb, and the destination that must be reached to avoid the bomb. Next, to apply this to deep reinforcement learning, state, action, an d reward were defined, and a 'progressive goal increase technique' was desig ned and implemented. The model was then trained, and the performance of th e deep reinforcement learning-based evasion maneuver model and the effectiv eness of the 'technique' were tested. The results confirmed that the Unmanne d Ground Weapon Systems could avoid bombs and reach the destination with an 81.3% probability. Moreover, without the application of the 'technique' not only was the reward from learning lower, but the Unmanned Ground Weapon Systems also failed to reach the destination by evading bombs, thereby verify ing its effectiveness. It is hoped that this research will contribute to enhancin g the survivability of ground unmanned weapon systems. Keyword : Reinforcement learning, evasion maneuver, PPO(Proximal Policy Optimization)
As the war between Russia and Ukraine erupted, a new pattern of warfare, previously unseen, emerged. Notably, the Ukrainian forces have been using dr ones as a means to drop bombs, causing significant damage to Russia, and th is has been reported through various media. Bomb dropping attacks using dro nes also pose a threat to ground unmanned weapon systems that will be dev eloped in the future. However, the main protective measures of current groun d weapon systems, armor and active protection systems, have their limitations in sufficiently responding to these threats. This study proposes a deep reinfor cement learning-based evasion maneuver model to enable future Unmanned G round Weapon Systems to counter drone bomb attacks. To this end, a three- dimensional simulation space was constructed, defining the unmanned ground weapon system, the bomb, and the destination that must be reached to avoid the bomb. Next, to apply this to deep reinforcement learning, state, action, an d reward were defined, and a 'progressive goal increase technique' was desig ned and implemented. The model was then trained, and the performance of th e deep reinforcement learning-based evasion maneuver model and the effectiv eness of the 'technique' were tested. The results confirmed that the Unmanne d Ground Weapon Systems could avoid bombs and reach the destination with an 81.3% probability. Moreover, without the application of the 'technique' not only was the reward from learning lower, but the Unmanned Ground Weapon Systems also failed to reach the destination by evading bombs, thereby verify ing its effectiveness. It is hoped that this research will contribute to enhancin g the survivability of ground unmanned weapon systems. Keyword : Reinforcement learning, evasion maneuver, PPO(Proximal Policy Optimization)
※ AI-Helper는 부적절한 답변을 할 수 있습니다.