최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기주관연구기관 | 한국과학기술원 Korea Advanced Institute of Science and Technology |
---|---|
연구책임자 | 이동환 |
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 | 한국어 |
발행년월 | 2024-03 |
과제시작연도 | 2023 |
주관부처 | 과학기술정보통신부 Ministry of Science and ICT |
연구관리전문기관 | 한국연구재단 National Research Foundation of Korea |
등록번호 | TRKO202400006155 |
과제고유번호 | 1711191821 |
사업명 | 개인기초연구(과기정통부) |
DB 구축일자 | 2024-09-04 |
키워드 | 강화학습.제어시스템.안정성.수렴성.안장점.Reinforcement learning.Control system.Stability.Convergence.Saddle-point. |
□ 연구개요
동적 시스템 및 제어 시스템 관점에서 강화학습과 머신러닝 기법들의 수렴성을 연구를 목표. 연구 목표의 달성을 위해서 강화학습 알고리즘의 제어시스템 모델의 개발 및 안정점 이론을 이용한 새로운 알고리즘의 개발. 전체 알고리즘의 안정성 및 수렴성을 보장하는 기법을 연구. 이를 통해서 강화학습 분야에 새로운 관점을 제시. 엄정한 수학적인 분석을 통해서 수렴성과 해를 해석.
□ 연구 목표대비 연구결과
연구의 목표는 제어 시스템 의 관점과 기법을 사용해서 강화학습 알고리즘을 해석하고 개발하는 새로운 관점과
해당 보고서가 속한 카테고리에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.