최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기국가/구분 | 한국(KR)/등록특허 | |
---|---|---|
국제특허분류(IPC8판) |
|
|
출원번호 | 10-2019-0088942 (2019-07-23) | |
등록번호 | 10-2082113-0000 (2020-02-21) | |
DOI | http://doi.org/10.8080/1020190088942 | |
발명자 / 주소 |
|
|
출원인 / 주소 |
|
|
대리인 / 주소 |
|
|
심사청구여부 | 있음 (2019-07-23) | |
심사진행상태 | 등록결정(일반) | |
법적상태 | 등록 |
데이터 기반 강화 학습 장치를 개시한다. 본 발명은 임의의 환경(Environment, 200)에서 현재의 상태(state)에 따라 선택 가능한 액션(Action)에 대한 보상(Reward)이 최대화되도록 에이전트(Agent, 100)가 강화 학습 모델을 학습하되, 각 액션에 대해서 전체 변동률 대비 개별 액션에 따라 변동되는 전체 변동률과의 차이를 상기 에이전트(100)의 보상으로 제공하는 것을 특징으로 한다.
수익률이 전체 평균 보다 높은 케이스 1(400)과, 수익률이 전체 평균과 대비하여 변동이 없는 케이스 2(400a)와, 수익률이 전체 평균 보다 낮은 케이스 3(400b)으로 구분되고, 각 케이스에서 현재 한도 유지(stay), 현재 한도 대비 20% 증액(up), 현재 한도 대비 20% 감액(down)된 개별 데이터별로 수익률이 최대화될 수 있도록 액션을 결정하는 에이전트(100); 및상기 에이전트(100)로부터 결정된 개별 데이터의 액션에 대하여 산출되는 수익률의 개별 변동률과 수익률의 전체 변동률 간의 차이값을 산출하고, 산
※ AI-Helper는 부적절한 답변을 할 수 있습니다.