$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

산업용 자율 주행 로봇에서의 격자 지도를 사용한 강화학습 기반 회피 경로 생성기 개발
Development of Reinforcement Learning-based Obstacle Avoidance toward Autonomous Mobile Robots for an Industrial Environment 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.19 no.3, 2019년, pp.72 - 79  

양정연 (목원대학교)

초록
AI-Helper 아이콘AI-Helper

자율 주행은 이동 로봇의 핵심적 기술로써, 측정된 센서 정보를 토대로 불확실한 위치 정보를 이용한 지도 작성 및 수정 기능과, 불확실한 지도 및 센서 정보를 이용한 로봇의 위치 인식 기능으로 구성된다. 자율주행은 이러한 주행 위치의 불확실성에 기반한 확률론적 방법론과 함께 주행 시 장애물의 감지 및 회피 경로의 생성, 반복적 주행 패턴에 따른 경로 관리 기능이 필수적 요소이다. 거리 기반의 스캐너를 통해 관측된 센서 입력은, 지도 구성에 사용된 벽과 같은 정적 물체와 주행 시의 사람처럼 움직이는 동적 물체와의 구별이 필요하기 ?문에 장애물 감지에 어려움이 있다. 본 논문에서는, 이러한 자율 주행 환경에서 기존의 정적, 동적 개체의 판별 방식과 비교하여, 장애물 회피를 위한 저해상도 격자 공간의 생성 및 강화학습을 이용한 경로 생성을 다루고자 한다. 최종적으로 실험을 통해 제안된 방법론의 실효성을 검증하고자 한다.

Abstract AI-Helper 아이콘AI-Helper

Autonomous locomotion has two essential functionalities: mapping builds and updates maps by uncertain position information and measured sensor inputs, and localization is to find the positional information with the inaccurate map and the sensor information. In addition, obstacle detection, avoidance...

주제어

표/그림 (7)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는, 이러한 장애물 회피를 위해 강화 학습 기반의 회피 경로 생성을 다루고자 한다. 기존의 장애물 감지에 따른 강화 학습 기반 회피와, 제안된 장애물 감지용의 격자 지도 생성 및 강화 학습 기반 회피의 방법론을 비교하고자 한다.
  • 따라서, SLAM을 위한 격자 지도는 조밀하게 구성하고, 장애물의 감지 및 회피 경로 생성을 위해서는 별도의 저해상도 격자 공간을 사용하고자 한다.
  • 본 논문에서는 산업용 자율 주행 로봇을 위한 장애물 회피 기법의 개발 사례를 다루고 있다. 이를 위해, 두 가지의 서로 다른 방법을 통해, 연산량의 특징과 작업 공간에 대한 의존성을 설명하려 한다.
  • 본 논문에서는, 이러한 장애물 회피를 위해 강화 학습 기반의 회피 경로 생성을 다루고자 한다. 기존의 장애물 감지에 따른 강화 학습 기반 회피와, 제안된 장애물 감지용의 격자 지도 생성 및 강화 학습 기반 회피의 방법론을 비교하고자 한다.
  • 이러한 한계성 때문에, 제안된 저해상도의 격자 공간을 토대로 장애물을 감지하고자 하였다. 장애물을 감지하는 식 (3)의 방식과 달리, 장애물용 격자를 이용하기에 강화 학습의 보상 함수는 지도상의 확률값을 이용하여 설계가능하다.
  • SLAM의 지도 작성 기능은 위치 추정의 오류를 감소하기 위해 다수의 조밀한 격자 공간으로 이루어진다. 이와 달리, 장애물 감지를 위한 격자 지도를 강화학습과 결합하여, 장애물 회피와 함께 처리하고자 한다.

가설 설정

  • 자율 주행 로봇은, 지능형 서비스 로봇 분야에서 활발히 진행되어 왔으나, 다양한 불확실성이 잠재하고 있는 실 환경 서비스 측면에서 다소 미흡한 실정이다. 가정, 도로, 공공 장소 등의 환경은, 지형의 변화에 따른 지속적인 지도 수정이 빈번하며, 환경 내의 동적 물체의 출현 빈도가 높아 감지 및 회피에 어려움이 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
이동 로봇은 어떠한 로봇인가? 이동 로봇은, 바퀴 또는 캐터필러와 같은 구름 접촉을 이용한 지면에서의 이동 방식 및 드론과 같은 3차원 공간 상의 비행에 따른 위치 변경이 가능한 로봇을 말한다. 이러한 이동성에 대한 제어 기능을 토대로, 물류 이송, 농업 및 해양 환경, 보안 설비, 위험한 환경의 탐사에 활용되며, 주행 방식에 따라 크게 원격지 조종에 의한 원격 제어와 로봇 내 부착된 센서를 이용하여 로봇이 스스로 움직이는 자율 주행 방식으로 구별된다.
미래에 가능한 보상의 기대 값을 사용하는 확률론적 방법론인 강화 학습의 특징은 무엇인가? 이와 달리, 강화 학습은 미래에 가능한 보상의 기대 값을 사용하는 확률론적 방법론에 해당한다. 장애물의 판단 여부가 불확실한 경우에도, 미래의 보상값을 추정 하는 방식으로 장애물 회피에 적합한 특징을 가지고 있다. 산업용 자율 주행 로봇이 일반적으로 제한된 작업 공간내의 움직임으로 제한되어 있어 다양한 기하학적 공간 내의 회피 경로 생성에 장점을 가진다.
자율 주행에서 요구되는 기능은? 자율 주행은, 부착된 거리 기반 센서를 이용하여 작업 공간 내 실제 주행을 통한 지도 작성 기능과, 생성, 수정된 지도와 센서 정보를 융합하여 현재 위치를 보정 하는 위치 추정 기능이 요구된다. 이러한 방법론은, 현재 위치가 불확실한 상태에서 관측을 통해, 위치의 추정 및 보정과 함께 지도를 수정하는 방식으로 구현되 며, 이러한 불확실성 때문에 확률 기반 방법론이 필수 적으로 사용되고 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (10)

  1. S. Thrun, "A Probabilistic Approach to Concurrent Mapping and Localization for Mobile Robots," Machine Learning and Autonomous Robots, Vol.31, No.5, pp.1-25, 1998 

  2. S. Thrun, W. Burgard, and D. Fox, Probabilistic Robotics, pp.171-172, MIT Press, 2005. 

  3. D. Holz, D. Droeschel, S. Behnke, M. May, and H. Surmann, "Fast 3D perception for collision avoidance and SLAM in domestic environment," In Mobile robots navigation, In-Tech Education and Publishing, Vienna, Austria, 2010. 

  4. G. Grisetti, C. Stachniss, and W. Burgard, "Improved Technique for Grid Mapping with Rao-Blackwellization Particle Filters," IEEE Trans. on Robotics (T-RO), Vol.23, pp.34-46, 2007. 

  5. J. Civera, A. J. Davison, and J. M. M. Montiel, "Inverse depth parametrization for monocular SLAM," IEEE Trans. Robot., Vol.24, No.5, pp.932-945, 2008(10). 

  6. A. J. Davison, I. D. Reid, N. D. Molton, and O. Stasse, "MonoSLAM: Real-time single camera SLAM," IEEE Trans. Pattern Anal. Mach. Intell., Vol.29, No.6, pp.1052-1067, 2007(6). 

  7. D. Marzorati, M. Matteucci, D. Migliore, and D. G. Sorrenti, "Monocular SLAM with inverse scaling parametrization," In Proc. of the British machine vision conference, Leeds, pp.945-994, 2008. 

  8. J. Sola, T. Vidal-Calleja, J. Civera, and J. M. M. Montiel, "Impact of landmark parametrization on monocular EKF-SLAM with points and lines," International Journal of Computer Vision, Vol.97, pp.339-368, 2012. 

  9. R. S. Sutton and A. G. Barto, Reinforcement Learning: An Introduction, Cambridge Univ. Press, pp.157-159, 1998. 

  10. J. Roberts, I. Manchester, and R. Tedrake, "Feedback controller parameterizations for reinforcementlearning," In 2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning (ADPRL), 2011. 

저자의 다른 논문 :

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로