$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"
쳇봇 이모티콘
안녕하세요!
ScienceON 챗봇입니다.
궁금한 것은 저에게 물어봐주세요.

논문 상세정보

RGB-D 정보를 이용한 객체 탐지 기반의 신체 키포인트 검출 방법

A Method for Body Keypoint Localization based on Object Detection using the RGB-D information

초록

최근 영상감시 분야에서는 영상에서 움직이는 사람을 탐지하고, 탐지된 사람의 행위를 분석하는 방식에 딥러닝 기반 학습방법이 적용되기 시작했다. 이러한 지능형 영상분석 기술을 적용할 수 있는 분야 중 하나인 인간 행위 인식은 객체를 탐지하고 탐지된 객체의 행위를 인식하기 위해 신체 키포인트를 검출 하는 과정을 거치게 된다. 본 논문에서는 RGB-D 정보를 이용한 객체 탐지 기반의 신체 키포인트 검출 방법을 제시한다. 먼저, 두 대의 카메라로 생성된 색상정보와 깊이정보를 이용하여 이동하는 객체를 배경으로부터 분할하여 탐지한다. RGB-D 정보를 이용하여 탐지된 객체의 영역을 재조정하여 생성된 입력 데이터를 한 사람의 자세 추정을 위한 Convolutional Pose Machines(CPM)에 적용한다. CPM을 이용하여 한 사람당 14개의 신체부위에 대한 신념 지도(Belief Map)를 생성하고, 신념 지도를 기반으로 신체 키포인트를 검출한다. 이와 같은 방법은 키포인트를 검출할 객체에 대한 정확한 영역을 제공하게 되며, 개별적인 신체 키포인트의 검출을 통하여 단일 신체 키포인트 검출에서 다중 신체 키포인트 검출로 확장 할 수 있다. 향후, 검출된 키포인트를 이용하여 인간 자세 추정을 위한 모델을 생성할 수 있으며 인간 행위 인식 분야에 기여 할 수 있다.

Abstract

Recently, in the field of video surveillance, a Deep Learning based learning method has been applied to a method of detecting a moving person in a video and analyzing the behavior of a detected person. The human activity recognition, which is one of the fields this intelligent image analysis technology, detects the object and goes through the process of detecting the body keypoint to recognize the behavior of the detected object. In this paper, we propose a method for Body Keypoint Localization based on Object Detection using RGB-D information. First, the moving object is segmented and detected from the background using color information and depth information generated by the two cameras. The input image generated by rescaling the detected object region using RGB-D information is applied to Convolutional Pose Machines for one person's pose estimation. CPM are used to generate Belief Maps for 14 body parts per person and to detect body keypoints based on Belief Maps. This method provides an accurate region for objects to detect keypoints an can be extended from single Body Keypoint Localization to multiple Body Keypoint Localization through the integration of individual Body Keypoint Localization. In the future, it is possible to generate a model for human pose estimation using the detected keypoints and contribute to the field of human activity recognition.

질의응답 

키워드에 따른 질의응답 제공
핵심어 질문 논문에서 추출한 답변
CPM의 네트워크
CPM의 네트워크는 어떻게 구성되어 있는가?
입력 영상에서 의미 있는 특징(Feature)을 추출하는 합성 곱 층(Convolution Layer)과 특징을 줄이는 서브 샘플링(Subsampling)을 하는 풀링 층 (Pooling Layer)으로 구성

CPM의 네트워크 구조는 입력 영상에서 의미 있는 특징(Feature)을 추출하는 합성 곱 층(Convolution Layer)과 특징을 줄이는 서브 샘플링(Subsampling)을 하는 풀링 층 (Pooling Layer)으로 구성되어 있다. 출력 값을 위한 활성화 함수(Activation Function)는 입력 값이 0보다 작으면 0, 0보다 크면 입력 값 그대로를 출력하는 ReLU(Rectified Linear Unit) 함수를 사용한다.

지능형 영상분석 기술을 적용할 수 있는 분야
본 논문에서 언급한 지능형 영상분석 기술을 적용할 수 있는 분야는?
인간 행위 인식

최근 영상감시 분야에서는 영상에서 움직이는 사람을 탐지하고, 탐지된 사람의 행위를 분석하는 방식에 딥러닝 기반 학습방법이 적용되기 시작했다. 이러한 지능형 영상분석 기술을 적용할 수 있는 분야 중 하나인 인간 행위 인식은 객체를 탐지하고 탐지된 객체의 행위를 인식하기 위해 신체 키포인트를 검출 하는 과정을 거치게 된다. 본 논문에서는 RGB-D 정보를 이용한 객체 탐지 기반의 신체 키포인트 검출 방법을 제시한다.

목표 객체와 다른 객체가 가까이 있거나, 다른 객체에 의해서 목표 객체가 가려진 경우
목표 객체와 다른 객체가 가까이 있거나, 다른 객체에 의해서 목표 객체가 가려진 경우 발생하는 문제점은?
부정확한 영역에서 키포인트 검출이 수행됨으로써 키포인트 검출의 정확성을 보장 할 수 없게 된다

그러나 목표 객체와 다른 객체가 가까이 있거나, 다른 객체에 의해서 목표 객체가 가려진 경우는 객체가 하나로 탐지되는 문제가 발생 할 수 있다. 이러한 경우는 부정확한 영역에서 키포인트 검출이 수행됨으로써 키포인트 검출의 정확성을 보장 할 수 없게 된다. 그러므로 정확한 영역을 제공함으로써 제공된 영역 내부에서 키포인트 검출을 수행해야한다.

질의응답 정보가 도움이 되었나요?

저자의 다른 논문

문의하기 

궁금한 사항이나 기타 의견이 있으시면 남겨주세요.

Q&A 등록

원문보기

원문 PDF 다운로드

  • ScienceON :

원문 URL 링크

원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)

이 논문 조회수 및 차트

  • 상단의 제목을 클릭 시 조회수 및 차트가 조회됩니다.

DOI 인용 스타일

"" 핵심어 질의응답