최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기주관연구기관 | 이화여자대학교 Ewha Womans University |
---|---|
연구책임자 | 민대기 |
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 | 한국어 |
발행년월 | 2022-03 |
과제시작연도 | 2021 |
주관부처 | 과학기술정보통신부 Ministry of Science and ICT |
연구관리전문기관 | 한국연구재단 National Research Foundation of Korea |
등록번호 | TRKO202200013003 |
과제고유번호 | 1711147246 |
사업명 | 개인기초연구(과기정통부)(R&D) |
DB 구축일자 | 2022-10-18 |
키워드 | 강화학습.행동제약.최적화.비가능해 보정.재고관리.Reinforcement learning.Constrained action.optimization.Solution feasibility.Inventory management. |
□ 연구개요
산업현장에서 고려하는 비즈니스 응용(Business Applications) 문제는 의사결정 과정에서 다수의 제약사항을 포함하고 있다. 표준 강화학습(Reinforcement Learning) 기법은 제약식을 만족하지 못하는 비가능해(Infeasible Solution)를 생성하여 비즈니스 응용 문제를 해결하는데 적절하지 않은 단점이 존재한다. 본 과제에서는 의사결정변수 (즉, action space)에 대한 다수의 제약식이 존재하는 MDP(Constrained Markov Decision Process) 문제를
※ AI-Helper는 부적절한 답변을 할 수 있습니다.