$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

스마트 팩토리에서 그리드 분류 시스템의 협력적 다중 에이전트 강화 학습 기반 행동 제어
Cooperative Multi-Agent Reinforcement Learning-Based Behavior Control of Grid Sortation Systems in Smart Factory 원문보기

정보처리학회논문지. KIPS transactions on computer and communication systems 컴퓨터 및 통신 시스템, v.9 no.8, 2020년, pp.171 - 180  

최호빈 (한국기술교육대학교 컴퓨터공학과) ,  김주봉 (한국기술교육대학교 컴퓨터공학과) ,  황규영 (한국기술교육대학교 컴퓨터공학과) ,  김귀훈 ,  홍용근 (ETRI KSB디바이스ML연구실) ,  한연희 (한국기술교육대학교 컴퓨터공학부)

초록
AI-Helper 아이콘AI-Helper

스마트 팩토리는 설계, 개발, 제조 및 유통 등 생산과정 전반이 디지털 자동화 솔루션으로 이루어져 있으며, 내부 설비와 기계에 사물인터넷(IoT)을 설치해 공정 데이터를 실시간으로 수집하고 이를 분석해 스스로 제어할 수 있게 하는 지능형 공장이다. 스마트 팩토리의 장비들은 게임과 같이 가상의 캐릭터가 하나의 객체 단위로 구동되는 것이 아니라 수많은 하드웨어가 물리적으로 조합되어 연동한다. 즉, 특정한 공동의 목표를 위해 다수의 장치가 개별적인 행동을 동시다발적으로 수행해야 한다. 공정 데이터를 실시간으로 수집할 수 있는 스마트 팩토리의 장점을 활용하여, 일반적인 기계 학습이 아닌 강화 학습을 사용하면 미리 요구되는 훈련 데이터 없이 행동 제어를 할 수 있다. 하지만, 현실 세계에서는 물리적 마모, 시간적 문제 등으로 인해 수천만 번 이상의 반복 학습이 불가능하다. 따라서, 본 논문에서는 시뮬레이터를 활용해 스마트 팩토리 분야에서 복잡한 환경 중 하나인 이송 설비에 초점을 둔 그리드 분류 시스템을 개발하고 협력적 다중 에이전트 기반의 강화 학습을 설계하여 효율적인 행동 제어가 가능함을 입증한다.

Abstract AI-Helper 아이콘AI-Helper

Smart Factory consists of digital automation solutions throughout the production process, including design, development, manufacturing and distribution, and it is an intelligent factory that installs IoT in its internal facilities and machines to collect process data in real time and analyze them so...

주제어

표/그림 (6)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 Real Games사에서 제공하는 3D Simulation Software 중 스마트 팩토리 분야에 해당하는 Factory I/O를 사용하여 스마트 팩토리 분야에서 복잡한 환경 중 하나인 이송 설비에 초점을 둔 그리드 분류 시스템을 개발한다[1]. 또, 개발한 그리드 분류 시스템에 협력적 다중 에이전트 기반 강화 학습 환경을 설계하고 효율적인 행동 제어가 가능함을 입증한다.
  • 한편, 분류 시스템에 딥러닝을 적용하여 성능을 높이는 연구도 진행되고 있다[10]. 본 논문에서는 소형의 그리드 분류 시스템을 개발하고 협력적 다중 에이전트 기반의 강화 학습을 적용하여 복잡한 규칙 기반의 알고리즘 없이 효율적인 제어가 가능함을 입증한다.
  • 본 논문에서는 전통적인 분류 시스템과 비교하여 더 높은 처리량과 더 적은 공간요구의 장점이 있는 N-그리드 분류 시스템을 설계하고 Factory I/O를 통해 소형 버전인 3-그리드 분류 시스템을 개발하였다. 그리고 N-그리드 분류 시스템의 특성을 고려하여 에피소드 시나리오와 세부 학습 목표를 정의하고 협력적 다중 에이전트 강화 학습을 설계하였다.
  • 본 연구에서 설정한 강화 학습의 에피소드 시나리오는 다수의 Emitter에서 분류 대기 중인 무작위 타입의 무한한 상자들을 타입에 맞게 올바른 목적지로 신속하게 이동 분류하는 것이다. 분류할 상자의 타입은 총 세 가지가 있으며 Small 타입의 목적지는 D1, Medium 타입의 목적지는 D2, Large 타입의 목적지는 D3이다.
  • 모든 상자는 타임 스텝마다 인접한 Part로 한 번 이동할 수 있으며 모든 이동이 끝나면 해당 타임 스텝이 끝난 것으로 간주한다. 최종 학습 목표는 높은 분류 정확도를 유지하며 많은 상자를 최대한 빠르게 분류하는 것이다. 다음의 각 항은 최종 학습 목표의 세가지 하위 목표이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
스마트 팩토리는 무엇인가? 스마트 팩토리는 설계, 개발, 제조 및 유통 등 생산과정 전반이 디지털 자동화 솔루션으로 이루어져 있으며, 내부 설비와 기계에 사물인터넷(IoT)을 설치해 공정 데이터를 실시간으로 수집하고 이를 분석해 스스로 제어할 수 있게 하는 지능형 공장이다. 스마트 팩토리의 장비들은 게임과 같이 가상의 캐릭터가 하나의 객체 단위로 구동되는 것이 아니라 수많은 하드웨어가 물리적으로 조합되어 연동한다.
DQN에서 에이전트가 환경과 상호작용하며 얻은 경험은 어떻게 저장 및 업데이트가 이루어 지는가? DQN은 에이전트가 환경과 상호작용하며 얻은 경험을 바탕으로 미래 누적 보상을 예측하는 Q(s,a) 값을 업데이트한다. 여기서 경험은 Experience Replay Memory에 저장되고 샘플링을 통해 신경망의 업데이트가 이루어진다. Experience Replay Memory는 큐이기 때문에 한 번 저장된 경험은 여러 번 사용될 수 있어 경험의 사용 효율이 높아지며 랜덤으로 샘플링하므로 경험 간의 높은 Correlation 문제를 해결할 수 있다.
PLC는 무엇인가? PLC (Programmable Logic Controller)는 산업 응용 분야에서 가장 일반적인 컨트롤러이며, Factory I/O를 PLC 훈련 플랫폼으로 사용할 수 있다. 또, I/O 드라이버는 외부 컨트롤러와 대화를 담당하는 Factory I/O의 내장형 기능이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. Real Games, Factory I/O [Internet], https://factoryio.com. 

  2. Arun Jayaraman, Ramu Narayanaswamy and Ali K. Gunal, "A sortation system model," Proceedings of the 1997 Winter Simulation Conference, Atlanta, GA, USA, pp. 866-871, Dec. 1997. 

  3. Patrick M McGuire, Conveyors: Application, Selection, and Integration, 1st Edition, CRC Press, 2009. 

  4. M. Eric Johnson, “The impact of sorting strategies on automated sortation system performance,” IIE Transactions, Vol. 30, No. 1, pp. 67-77, Jan. 1997. 

  5. James C. Chen, Chien-Fu Huang, Tzu-Li Chen, and Yu-Hsin Lee, "Solving a Sortation Conveyor Layout Design Problem with Simulation-optimization Approach," 2019 IEEE 6th International Conference on Industrial Engineering and Applications (ICIEA), Tokyo, Japan, pp. 551-555, Apr. 2019. 

  6. Russell D. Meller, “Optimal order-to-lane assignments in an order accumulation/sortation system,” IIE Transactions, Vol. 29, No. 4, pp. 293-301, Apr. 1997. 

  7. Shiwang Hou, “Distribution Center Logistics Optimization Based on Simulation,” Research Journal of Applied Sciences, Engineering and Technology, Vol. 5, No. 21, pp. 5107-5111, 2013. 

  8. Stefan Fedtke and Nils Boysen, “Layout Planning of Sortation Conveyors in Parcel Distribution Centers,” Transportation Science, Vol. 51, No. 1, pp. 3-18, Feb. 2017. 

  9. Zazilia Seibold, Thomas Stoll, and Kai Furmans, "Layoutoptimized sorting of goods with decentralized controlled conveying modules," 2013 IEEE International Systems Conference (SysCon), Apr. 2013. 

  10. Mir Alireza Athari, Farzad Ahmadinejad, and Mehran Ahmadi, "Design and Implementation of a Parcel Sorter Using Deep Learning," 2018 4th Iranian Conference on Signal Processing and Intelligent Systems (ICSPIS), Dec. 2018. 

  11. Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Andrei A. Rusu, Joel Veness, Marc G. Bellemare, Alex Graves, Martin Riedmiller, Andreas K. Fidjeland, Georg Ostrovski, Stig Petersen, Charles Beattie, Amir Sadik, Ioannis Antonoglou, Helen King, Dharshan Kumaran, Daan Wierstra, Shane Legg, and Demis Hassabis, "Human-level control through deep reinforcement learning," Nature, Vol. 518, pp. 529-533, Feb. 2015. 

  12. John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov, "Proximal Policy Optimization Algorithms," arXiv:1707.06347, Jul. 2017. 

  13. John Schulman, Sergey Levine, Philipp Moritz, Michael I. Jordan, and Pieter Abbeel, "Trust Region Policy Optimization," arXiv:1502.05477, Feb. 2015. 

  14. Fu-bin Pan, "Simulation Design of Express Sorting System-Example of SF's Sorting Center," The Open Cybernetics & Systemics Journal, Vol. 8, pp. 1116-1122, 2014. 

  15. Real Games, Factory I/O SDK [Internet], https://github.com/realgamessoftware/factoryio-sdk. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로