최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국게임학회 논문지 = Journal of Korea Game Society, v.19 no.6, 2019년, pp.61 - 70
양의홍 (홍익대학교 일반대학교 게임학과(공학)) , 강신진 (홍익대학교 일반대학교 게임학과(공학)) , 조성현 (홍익대학교 일반대학교 게임학과(공학))
In this paper, we apply reinforcement learning in the field of management simulation game to check whether game agents achieve autonomously given goal. In this system, we apply PPO (Proximal Policy Optimization) algorithm in the Unity Machine Learning (ML) Agent environment and the game agent is des...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
강화학습의 특징은? | 지도 학습과 비지도 학습의 경우 주로 어떠한 물체를 구분하거나 데이터의 특성을 분석, 가공하는데 사용되는 반면 강화학습은 주로 제어나 상호작용을 통해 최적의 행동을 탐색하는 분야에서 주로 사용된다[1]. 강화학습은 상태에 대한 행동을 매핑하는 방법을 학습하여 수치적인 보상을 극대화시킬 수 있는 행동을 선택한다[2]. | |
인공지능 기술 중 기계학습은 학습 방식에 따라 어떻게 나눌 수 있는가? | 인공지능 기술 중 기계학습은 학습 방식에 따라 크게 지도 학습, 비지도 학습 그리고 강화학습으로 나눌 수 있다. 지도 학습과 비지도 학습의 경우 주로 어떠한 물체를 구분하거나 데이터의 특성을 분석, 가공하는데 사용되는 반면 강화학습은 주로 제어나 상호작용을 통해 최적의 행동을 탐색하는 분야에서 주로 사용된다[1]. | |
강화학습 기법 중 Policy Gradient 기법은 어떤 기법인가? | 강화학습에서 인공 신경망을 적용하여 최적 행동의 행동 값을 직접적으로 얻는 기법으로 Policy Gradient(PG) 기법이 있다[2]. 이 기법은 인공 신경망 학습을 통해 누적 보상을 최대로 하는 최적 정책을 찾는 것이다. 누적 보상은 정책신경망을 통해 최적화하고자 하는 목표 함수에 의해 얻어지며 최적화 대상은 인공신경망 내의 가중치 값들이다. |
Sungpill Kim, Deep Learning First Step, pp.17-33, Hanbit Media, 2016.
Taewoo Lee, Jinhoo Ryu, Heemin Park "Hovering Control of 1-Axial Drone with Reinforcement Learning", Journal of Korea Multimedia Society, Vol.21, No.2, pp.250-260, 2018.
Daniel R.Jiang, Emmanuel Ekwedike, Han Liu, "Feedback-Based Tree Search for Reinforcement Learning", Journal of Korea Multimedia Society, arXiv:1805.05935, 2018.
Jeongsoo Han, "A Study of Adaptive QoS Routing scheme using Policy-gradient Reinforcement Learning", Journal of the Korea Society of Computer and Information, Vol.16, No.2, pp.93-99, 2011.
Jongho Kim, Daesung Kang, Jooyoung Park, "Robot Locomotion via RLS-based Actor-Critic Learning", Journal of Korean Institute of Intelligent Systems, Vol.15, No.7, pp.893-898, 2005.
Arthur Juliani, "Introducing: Unity Machine Learning Agents Toolkit", Unity Blog, https://blogs.unity3d.com/2017/09/19/introducin g-unity-machine-learning-agents/, 2017.
Wooil Shim, Taehwa Park, Kyungjoong Kim, "Comparison of Policy Optimization Reinforcement Learning for Simulated Autonomous Car Environment", Korea Information Science Society, p.833-835, 2018.
Adrian Gonzalez, Ramirez, "Neural networks applied to a tower defense video game", Universitat Jaume I, Grauen Disseny i Desenvolupament de Videojocs [94], 2018.
Arthur Juliani, Vincent-Pierre Berges, Esh Vckay, Yuan Gao, Hunter Henry, Marwan Mattar, Danny Lange, "ML-Agents Toolkit Overview",https://github.com/Unity-Technologies/ml-agents/blob/master/docs/ML-Agents-Overview.md, 2017.
Jaehoon Lee, Taerim Kim, Jonggyu Song, Hyunjae Im, "Flight Trajectory Simulation via Reinforcement Learning in Virtual Environment", Journal of the Korea Society for Simulation, Vol.27, No.4, p.1-8, 2018.
Sonic, "PPO (Proximal Policy Optimization Algorithms) I Machine Learning & QA)", Naver Blog, https://cafe.naver.com/soynature/2400, 2017.
Saemaro Moon, Yonglak Choi "A Study on Application of Reinforcement Learning Algorithm Using Pixel Data", Journal of Information Technology Services, Vol.15, No.4, pp.85-95, 2016.
John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov, "Proximal Policy Optimization Algorithms", OpenAI, arxiv.org/pdf/1707.06347, 2017.
RL Korea, "PG Travel Guide", RLKoreaBlog, https://reinforcement-learning-kr.github.io/2018/06/29/0_pg-travel-guide/#, 2018.
Kyeongnam Kim, "ML-Agents Project Organization Unity ML / Unity", Naver Blog, https://blog.naver.com/kkyy0126/221448746477, 2019.
Arthur Juliani, Vincent-Pierre Berges, Esh Vckay, Yuan Gao, Hunter Henry, Marwan Mattar, Danny Lange, "Training with Proximal Policy Optimization", https://github.com/Unity-Technologies/ml-agents/blob/master/docs/Training-PPO.md, 2017.
Arthur Juliani, Vincent-Pierre Berges, Esh Vckay, Yuan Gao, Hunter Henry, Marwan Mattar, Danny Lange, "Getting Started with the 3D Balance Ball Environment", https://github.com/Unity-Technologies/ml-agents/blob/master/docs/Getting-Started-with-Balance-Ball.md#observing-training-progress, 2017.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.