$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

군집 로봇의 협조 행동을 위한 로봇 개체의 행동학습과 진화
Behavior Learning and Evolution of Individual Robot for Cooperative Behavior of Swarm Robot System 원문보기

퍼지 및 지능시스템학회 논문지 = Journal of fuzzy logic and intelligent systems, v.16 no.2, 2006년, pp.131 - 137  

심귀보 (중앙대학교 전자전기공학부) ,  이동욱 (한국생산기술연구원 로봇기술본부)

초록
AI-Helper 아이콘AI-Helper

군집 로봇시스템에서 개개의 로봇은 스스로 주위의 환경과 자신의 상태를 스스로 판단하여 행동하고, 필요에 따라서는 다른 로봇과 협조를 통하여 어떤 주어진 일을 수행할 수 있어야 한다. 따라서 개개의 로봇은 동적으로 변화하는 환경에 잘 적응할 수 있는 학습과 진화능력을 갖는 것이 필수적이다. 이를 위하여 본 논문에서는 지연된 보상능력이 있는 강화학습과 분산유전알고리즘을 이용한 새로운 자율이동로봇의 행동학습 및 진화방법을 제안한다. 지연 보상능력이 있는 강화학습은 로봇이 취한 행동에 대하여 즉각적인 보상을 가할 수 없는 경우에도 학습이 가능한 방법이다. 또한 개개의 로봇이 통신을 통하여 염색체를 교환하는 분산유전알고리즘은 각기 다른 환경에서 학습한 우수한 염색체로부터 자신의 능력을 향상시킨다. 특히 본 논문에서는 진화의 성능을 향상시키기 위하여 강화학습의 특성을 이용한 선택 교배방법을 채택하였다. 제안된 방법은 협조탐색 문제에 적용하여 컴퓨터 시뮬레이션을 통하여 그 유효성을 검증한다.

Abstract AI-Helper 아이콘AI-Helper

In swarm robot systems, each robot must behaves by itself according to the its states and environments, and if necessary, must cooperates with other robots in order to carry out a given task. Therefore it is essential that each robot has both learning and evolution ability to adapt the dynamic envir...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 본 논문에서는 실제적으로 적용할 수 있는 로봇 모델의 제시와 함께 강화학습의 특성을 이용한 새로운 교배 방법을 제안하여 진화의 효율을 향상시켰다. 교배를 위한 로봇의 염색체는 현재까지 학습된 정보이고, 로봇은 자신보다 우수한 로봇과 마주쳤을 경우 지역적 통신을 이용하여 염색체를 받아온다.
  • 본 논문에서는 다수의 로봇으로 구성된 군집 로봇 시스템에서 로봇의 행동학습 및 진화를 위하여 강화학습과 분산유전알고리즘을 도입하 바법을 제안하였다. 각각의 로봇은 주변을 인식하여 자신의 행동을 결정하며, 이때 지연보상이 있는 Q-학습법을 제안하여 적용하였고, 지역적 통신시스템을 이용하여 시스템의 목적에 맞도록 진화해 나가는 방법을 사용하였다.
  • 특히 강화학습법을 포함한 신경회로망, 유전 알고리즘, 퍼지 시스템 등과 이들의 융합에 관심을 가지고 있다. 본 논문에서는 로봇에게 완전한 프로그램을 만들어 주는 대신 동적으로 변화하는 환경에 대하여 유연하게 대처할 수 있는 행동이 발현되고 진화해 나갈 수 있는 시스템을 구현하여 협조행동을 실현하였다. 제안한 방법의 유효성을 검증하기 위하여 본 논문에서는 비교적 간단한 문제에 적용하였지만 앞으로는 자율이동로봇 및 마이크로 로봇의 기술 발달과 더불어 적용할 수 있는 분야는 계속 늘어날 전망이며 제안한 방법은 이를 실현할 수 있는 기본전략으로 사용될 수 있을 것으로 기대한다.
  • 뿐만 아니라, 적합도의 값은 서로 다른 로봇을 선택하는 기준이 된다. 본 논문에서는 협조탐색의 문제로서 충돌을 피하면서 많은 물체를 획득하는 것을 목표로 하고 있으므로, 물체를 획득하였을경우 적합도가 상승하고, 장애물이나 로봇에 충돌하였을 경우 적합도가 떨어진다. 여기에서 로봇의 적합도는 최종 주행 시간 동안 받은 보상이나 벌칙에 의해 (6)식과 같이 표현할 수 있다.
  • 이러한 관점에서, 본 논문에서는 자율 분산 로봇 시스템에서 자율적으로 행동하며 시스템의 목적을 달성하는 로봇을 실현하기 위하여 사전에 짜여진 완벽한 계획이 아닌 시스템에 적응할 수 있는 구조를 설계하여 주었다. 로봇은 주어진 환경에서 자신의 행동을 학습하기 위하여 강화학습을 이용하였고 진화를 위하여 분산유전알고리즘을 도입하였다.
  • 따라서 이러한 교배에 의하여 우수한 개체가 소실될 가능성도 존재한다. 이러한 점을 보완하기 위하여 본 논문에서는 개선된 교배방법을 제안한다.

가설 설정

  • 1. 모든 상태 s 와 행동 a 에 대하여 (Xs, a)를 임의의 값(일반적으로 0)으로 초기화한다.
  • 1. 모든 상태 s와 행동 a 의 Q(s, a)에 대하여 0보다 크고 1 이하의 임의의 값으로 초기화한다. 주의할 것은 초기 값이 0인 경우는 아래의 (2)식에 의거하여 행동 선택이 되지 않는다는 사실이다.
  • 2. 현재의 상태 s 를 인식한다.
  • 5cm 전진할 수 있다. 또한 작업 대상인 물체 및 장애물은 작업 공간 내에 골고루 퍼져 있고, 모든 로봇은 작업공간에서 다른 로봇과의 거리를 충분히 유지하도록 흩어진 후 작업을 수행한다고 가정한다.
  • 본 논문에서는 자율이동로봇군의 행동학습과 진화를 위하여 군집 로봇의 협조탐색 문제의 하나인 다수 로봇에 의한 물체획득 문제로 설정하였으며 실험을 위하여 다음과 같은 환경을 가정하였다. 로봇의 수: 25개, 물체의 수: 500개, 장애물의 수: 100개, 1회의 수행시간: 1000단위시간, 평가시간: 500단위시간, 작업 공간: 20x20m(로봇의 크기는 5x5cm).
본문요약 정보가 도움이 되었나요?

참고문헌 (16)

  1. 이동욱, 심귀보, '자율이동로봇군의 협조행동을 위한 통신시스템의 개발,' 대한전자공학회 논문지, 제34권, S편, 제3호, pp. 33-45, 1997. 3 

  2. 이동욱 심귀보, '강화학습과 분산유전알고리즘을 이용한 자율이동로봇군의 행동학습 및 진화,' 대한전자공학회 논문지, 제34권, S편, 제8호, pp. 56-64, 1997. 8 

  3. 이동욱, 심귀보, '인공면역계 기반의 자율이동로봇군의 협조행동전략 결정,' 대한전자공학회 논문지, 제 35권 S편 제3호, pp. 102-109, 1998. 3 

  4. H.B. Jun, K.B. Sim, 'Emergence of Cooperative Behavior based on Learning and Evolution in Collective Autonomous Mobile Robots,' Journal of Electrical Engineering and Information Science, vol. 3, 1998 

  5. 심귀보, 이동욱, 선상준, '인공면역계 기반 자율분산 로봇 시스템의 협조 전략과 군행동', 제어자동화시스템 공학회 논문지, 제6권, 제12호, pp. 1079-1085, 2000. 12 

  6. I. Roitt, J. Brostoff, D. Male, Immunology, 4th edition, Mosby, 1996 

  7. R.A. Wallace, G.P. Sanders, R. J. Ferl, BIOLOGY: The Science of Life, 3rd eds., HarperCollins Publishers Inc., 1991 

  8. N.K. Jerne, 'Idiotopic Network and Other Preconceived Ideas,' Immunological Rev., vol. 79, pp. 5-24, 1984 

  9. Y. Ishida, N. Adachi, 'An Immune Algorithm for Multiagent : Application to Adaptive Noise Neutralization,' Proc. of IROS 96, pp. 1739-1746, 1996 

  10. S. Forrest, B Javornik, R.E. Smith, A.S. Perelson, 'Using Genetic Algorithms to Explore Pattern Recognition in the Immune System,' Evolutionary Computation, vol. 1, no. 3, pp. 191-211, 1993 

  11. A. Ishiguro, Y. Watanabe, Y. Uchikawa, 'An Immunological Approach to Dynamic Behavior Control for Autonomous Mobile Robots,' Proc, of IROS 95, pp. 495-500, 1995 

  12. A. Ishiguro, Y. Shirai, T. Kendo, Y. Uchikawa, 'Immunoid : An Architecture for Behavior Arbitration Based on the Immune Networks,' Proc. of IROS 96, pp. 1730-1738, 1996 

  13. H. Bersini, F.J, Varela, 'The Immune Recruitment Mechanism: A Selective Evolutionary Strategy,' Proc, of 4th Int. Conf. on Genetic Algorithms, pp. 520-526, 1991 

  14. N. Mitsumoto et al., 'Micro Autonomous Robotic System and Biologically Inspired Immune Swarm Strategy as a Multi-Agent Robotic System,' Proc. of Int. Conf. on Robotics and Automation, pp. 2187-2192, 1995 

  15. P. D'haeseleer, S. Forrest, P. Helman, 'An Immunological Approach to Change Detection : Algorithms, Analysis and Implications,' Proc. of IEEE Symp. on Security and Privacy, 1996 

  16. J.D. Farmer, N.H. Packard, and A.S. Perelson, 'The Immune System, Adaptation, and Machine Learning,' Physica 22-D, pp. 184-204, 1986 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로