최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기국가/구분 | 한국(KR)/공개특허 | |
---|---|---|
국제특허분류(IPC8판) |
|
|
출원번호 | 10-2018-0148822 (2018-11-27) | |
공개번호 | 10-2020-0068076 (2020-06-15) | |
DOI | http://doi.org/10.8080/1020180148822 | |
발명자 / 주소 | ||
출원인 / 주소 |
|
|
대리인 / 주소 |
|
|
법적상태 | 공개 |
강화학습 기반 시스템 제어기가 상태 보정 기반의 강화학습을 하는 방법 및 장치에 있어서 상태변이 정보 및 시스템의 상태 정보에 기초하여 보정된 상태 정보는 생성되고, 상태변이 정보는 제어 신호에 기초하여 시스템을 제어하여 발생되는 상태 정보의 차이에 해당되는 것을 개시한다.
강화학습 기반 시스템 제어기가 상태 보정 기반의 강화학습을 하는 방법에 있어서,주기적으로 시스템의 상태를 관측하여 상기 시스템의 상태 정보를 획득하는 단계;상기 시스템의 관측된 또는 보정된 상태 정보에 기초한 제어 신호를 강화학습 에이전트로 요청하여 수신하는 단계; 상기 상태 정보를 보정하여 보정된 상태 정보를 생성하는 단계; 및보상값을 측정하고, 상기 보상값 및 상기 보정된 상태 정보를 상기 강화학습 에이전트에게 제공하는 단계;를 포함하되,상기 보정된 상태 정보는 상태변이 정보 및 상기 시스템의 상태 정보에 기초하여 생성되고, 상
※ AI-Helper는 부적절한 답변을 할 수 있습니다.