최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국시뮬레이션학회논문지 = Journal of the Korea Society for Simulation, v.27 no.4, 2018년, pp.1 - 8
이재훈 , 김태림 (LIG Nex1 유도무기 연구소) , 송종규 (LIG Nex1 유도무기 연구소) , 임현재 (LIG Nex1 유도무기 연구소)
The most common way to control a target point using artificial intelligence is through reinforcement learning. However, it had to process complicated calculations that were difficult to implement in order to process reinforcement learning. In this paper, the enhanced Proximal Policy Optimization (PP...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
강화학습은 무엇인가? | 인공지능을 이용하여 목표 지점까지 제어하는 가장 대표적인 방법은 강화학습이다. 하지만 그동안 강화학습을 처리하기 위해서는 구현하기 어렵고 복잡한 연산을 처리해야만 했다. | |
강화학습을 처리하는 것에 있어서 한계는 무엇인가? | 인공지능을 이용하여 목표 지점까지 제어하는 가장 대표적인 방법은 강화학습이다. 하지만 그동안 강화학습을 처리하기 위해서는 구현하기 어렵고 복잡한 연산을 처리해야만 했다. 본 논문에서는 이를 개선한 Proximal Policy Optimization (PPO) 알고리즘을 이용하여 가상환경에서 목표지점에 도달하기 위한 계획된 비행궤적을 찾는 방법을 시뮬레이션 하였다. | |
강화학습의 한계점을 개선하기 위해 어떠한 것을 이용하였나? | 하지만 그동안 강화학습을 처리하기 위해서는 구현하기 어렵고 복잡한 연산을 처리해야만 했다. 본 논문에서는 이를 개선한 Proximal Policy Optimization (PPO) 알고리즘을 이용하여 가상환경에서 목표지점에 도달하기 위한 계획된 비행궤적을 찾는 방법을 시뮬레이션 하였다. 또한 외부 환경요소가 비행궤적 학습에 미치는 영항을 알아보기 위하여 궤적의 변화, 보상 값의 영향 및 외부 바람등과 같은 변수를 추가하고 궤적 학습 성능 및 학습 속도에 미치는 영향을 비교 분석을 수행한다. |
John Schulman, Sergey Levine, Philipp Moritz, Michael Jordan, Pieter Abbeel (2015), Trust Region Policy Optimization, arXiv:1502.05477v5 [cs.LG].
John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov (2017), Proximal Policy Optimization Algorithms, arXiv:1707.06347v2 [cs.LG] 28 Aug 2017.
Vincent Pierre (2017), Unity ML-Agents, https://github.com/Unity-Technologies/ml-agents
Kaiming He, Georgia Gkioxari, Piotr Dollar, Ross Girshick (2017), Mask R-CNN, arXiv:1703.06870 [cs.CV]
Jemin Hwangbo, Inkyu Sa, Roland Siegwart, Marco Hutter (2017), Control of a Quadrotor with Reinforcement Learning, arXiv:1707.05110v1 [cs.RO]
Huy X. Pham, Hung. M. La, David Feil-Seifer, Luan V. Nguyen (2018), Autonomous UAV Navigation Using Reinforcement Learning, arXiv:1801.05086v1 [cs.RO]
William Koch, Renato Mancuso, Richard West, Azer Bestavros, Reinforcement Learning for UAV Attitude Control, arXiv:1804.04154v1 [cs.RO]
D. Silver, A. Huang, C. J. Maddison, A. Guez, L. Sifre, G. Van Den Driessche, J. Schrittwieser, I. Antonoglou, V. Panneershelvam, M. Lanctot, Mastering the game of go with deep neural networks and tree search, Nature, vol. 529, no. 7587, pp. 484-489, 2016
Huy X. Pham, Hung. M. La, David Feil-Seifer, Luan V. Nguyen, Autonomous UAV Navigation Using Reinforcement Learning, arXiv:1801.05086v1 [cs.RO]
김성필 (2016), 딥러닝 첫걸음, 한빛미디어, 서울, pp. 17-33.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.