[논문]그래프 기반 멀티 에이전트 강화 학습의 동적 표현 학습

윤성훈

그래프 기반 멀티 에이전트 강화 학습의 동적 표현 학습
Learning Dynamic Representation of Multiple Agent in Graph-based Reinforcement Learning 원문보기

윤성훈 (세종대학교 일반대학원 컴퓨터공학과 국내석사)

초록 ▼
AI-Helper

멀티 에이전트 강화 학습에서 협동 전략을 배우는데 있어 각 에이전트의
관계를 정의하는 것이 가장 중요하다. 그래프는 각 에이전트의 이러한 관
계를 정의하는데 있어 인간이 이해하기 쉽다는 장점이 있다. 최근 이러한
그래프 데이터를 통해 강화 학습을 적용시킨 연구가 좋은 성과를 거두었
다. 그러나 그래프의 인접 행렬을 구성하는 방법이 ...

멀티 에이전트 강화 학습에서 협동 전략을 배우는데 있어 각 에이전트의
관계를 정의하는 것이 가장 중요하다. 그래프는 각 에이전트의 이러한 관
계를 정의하는데 있어 인간이 이해하기 쉽다는 장점이 있다. 최근 이러한
그래프 데이터를 통해 강화 학습을 적용시킨 연구가 좋은 성과를 거두었
다. 그러나 그래프의 인접 행렬을 구성하는 방법이 유클리디안 거리를 이
용하기 때문에, 실제 에이전트의 이동해야 할 거리와 차이가 나는 환경에
서는 이로 인해 성능이 좋지 않은 문제가 발생한다. 환경에 따라 학습이
불안정한 기존 그래프 기반 강화 학습 모델을 여러 환경에 적합한 모델로
만들기 위해, 본 논문에서는 인접 행렬 추상화를 이용한 멀티 에이전트 강
화 학습 모델을 제안한다. 에이전트가 우선적으로 협동에 필요한 인접 노
드들을 환경과 상호작용하면서 구성하므로, 학습 환경에 적절한 인접 노드
간의 관계를 표현하는 데 있어 더 유리하다. 또한, 기존의 연구가 가지고
있는 멀티 에이전트 환경 상에서 발생하는 비 정적 문제와 동적 그래프에
서 발생하는 문제를 해결하여 학습의 불안정성과 수렴 속도를 향상시켰다. 실험은 Unity를 통해 제작한 환경과 StarCraft II의 mini-game으로 진행하
였으며, 기존 그래프 기반 멀티 에이전트 강화 학습 모델과 비교해 좋은
성능을 달성한다.

Abstract ▼ AI-Helper

In learning multi-agent reinforcement learning, it is most important to
define the relationship of each agent. The graph has the advantage that
it is easy for humans to understand the relationship of each agent.
Recently, the research that applied reinforcement learning using the
graph data has achieved good results. However, since the method of
generating the adjacency matrix of the graph uses the Euclidean distance,
there is a problem in the environment where the distance of the actual
agent is different from the Euclidean distance.
In this paper, we propose a multi-agent reinforcement learning model
using adjacency matrix abstraction in order to solve the unstable learning
according to the environment. Since the agent first configures the
neighbor nodes necessary for cooperation by interacting with the
environment, it is more advantageous to express the relation between adjacent nodes by forming adjacent nodes suitable for the environment.
In addition, it solves non-stationary problems and problems that occur in
dynamic graphs and improves learning instability and convergence speed.
We experiment proposed methods using GridWorld and StarCraft II
mini-game. The proposed method achieves good performance compared
with the existing method.

주제어

학위논문 정보

저자	윤성훈
학위수여기관	세종대학교 일반대학원
학위구분	국내석사
학과	컴퓨터공학과
발행연도	2019
총페이지	52p.
키워드	강화학습 심층 학습 그래프 인공 신경망 멀티 에이전트 게임 인공지능
언어	kor
원문 URL	http://www.riss.kr/link?id=T15385148&outLink=K
정보원	한국교육학술정보원

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명(한글), 저자명(한글), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문) 관리번호, 논문명(한글), 논문명(영문), 저자명(한글), 저자명(영문), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문)
저장형식	Text(ASCII format) Excel format
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

그래프 기반 멀티 에이전트 강화 학습의 동적 표현 학습
Learning Dynamic Representation of Multiple Agent in Graph-based Reinforcement Learning 원문보기

초록 ▼
AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

그래프 기반 멀티 에이전트 강화 학습의 동적 표현 학습 Learning Dynamic Representation of Multiple Agent in Graph-based Reinforcement Learning 원문보기

초록 ▼ 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

그래프 기반 멀티 에이전트 강화 학습의 동적 표현 학습
Learning Dynamic Representation of Multiple Agent in Graph-based Reinforcement Learning 원문보기

초록 ▼
AI-Helper