본 논문에서는 복잡한 배경에서의 사람의 머리 추적에 있어서 효과적인 Adaptive Boosting에 의한 방법을 제안한다. 하나의 특징 추출 방법은 사람의 머리를 모델링하기에는 부족하다. 따라서 본 연구에서는 여러 가지 특징 추출 방법을 병행하여 정확한 머리 검출을 시도하였다. 머리 영상의 특징 추출은 sub-region과 Haar 웨이블릿 변환(Haar wavelet transform)을 이용하였다. Sub-region은 머리의 지역적인 특징을 나타내고, Haar 웨이블릿 변환은 얼굴의 주파수 특성을 나타내기 때문에 이들을 이용하여 특징을 추출하면 효과적인 모델링이 가능해 진다. 실시간으로 입력되는 영상에서 사람의 머리를 추적하기 위하여 제안하는 방법에서는 3가지 형태의 Harr-wavelet 특징을 AdaBoosting 알고리즘으로 학습한 후 결과를 이용하였다. 원래 AdaBoosting 알고리즘은 학습시간이 매우 길며 학습데이터가 변하면 다시 학습을 수행해야 하는 단점이 존재한다. 이 단점을 극복하기 위하여 제안하는 방법에서는 캐스케이드를 이용한 AdaBoosting의 효율적인 학습방법을 제안한다. 이 방법은 머리 영상에 대한 학습시간은 감소시키며, 학습데이터의 변화에도 효율적으로 대처할 수 있다. 이 방법은 학습과정을 레벨별로 분리한 후 중요도가 높은 학습데이터를 다음 단계에 반복적으로 적용시킨다. 제안하는 방법이 적은 학습 시간과 학습 데이터를 사용해서 우수한 성능을 가지는 분류기를 생성하였다. 또한, 이 방법은 다양한 머리데이터를 가진 실시간 영상데이터에 적용한 결과 다양한 머리를 정확하게 검출 및 추적하였다.
본 논문에서는 복잡한 배경에서의 사람의 머리 추적에 있어서 효과적인 Adaptive Boosting에 의한 방법을 제안한다. 하나의 특징 추출 방법은 사람의 머리를 모델링하기에는 부족하다. 따라서 본 연구에서는 여러 가지 특징 추출 방법을 병행하여 정확한 머리 검출을 시도하였다. 머리 영상의 특징 추출은 sub-region과 Haar 웨이블릿 변환(Haar wavelet transform)을 이용하였다. Sub-region은 머리의 지역적인 특징을 나타내고, Haar 웨이블릿 변환은 얼굴의 주파수 특성을 나타내기 때문에 이들을 이용하여 특징을 추출하면 효과적인 모델링이 가능해 진다. 실시간으로 입력되는 영상에서 사람의 머리를 추적하기 위하여 제안하는 방법에서는 3가지 형태의 Harr-wavelet 특징을 AdaBoosting 알고리즘으로 학습한 후 결과를 이용하였다. 원래 AdaBoosting 알고리즘은 학습시간이 매우 길며 학습데이터가 변하면 다시 학습을 수행해야 하는 단점이 존재한다. 이 단점을 극복하기 위하여 제안하는 방법에서는 캐스케이드를 이용한 AdaBoosting의 효율적인 학습방법을 제안한다. 이 방법은 머리 영상에 대한 학습시간은 감소시키며, 학습데이터의 변화에도 효율적으로 대처할 수 있다. 이 방법은 학습과정을 레벨별로 분리한 후 중요도가 높은 학습데이터를 다음 단계에 반복적으로 적용시킨다. 제안하는 방법이 적은 학습 시간과 학습 데이터를 사용해서 우수한 성능을 가지는 분류기를 생성하였다. 또한, 이 방법은 다양한 머리데이터를 가진 실시간 영상데이터에 적용한 결과 다양한 머리를 정확하게 검출 및 추적하였다.
This paper proposes an effective method using Adaptive Boosting to track a person's head in complex background. By only one way to feature extraction methods are not sufficient for modeling a person's head. Therefore, the method proposed in this paper, several feature extraction methods for the accu...
This paper proposes an effective method using Adaptive Boosting to track a person's head in complex background. By only one way to feature extraction methods are not sufficient for modeling a person's head. Therefore, the method proposed in this paper, several feature extraction methods for the accuracy of the detection head running at the same time. Feature Extraction for the imaging of the head was extracted using sub-region and Haar wavelet transform. Sub-region represents the local characteristics of the head, Haar wavelet transform can indicate the frequency characteristics of face. Therefore, if we use them to extract the features of face, effective modeling is possible. In the proposed method to track down the man's head from the input video in real time, we ues the results after learning Harr-wavelet characteristics of the three types using AdaBoosting algorithm. Originally the AdaBoosting algorithm, there is a very long learning time, if learning data was changes, and then it is need to be performed learning again. In order to overcome this shortcoming, in this research propose efficient method using cascade AdaBoosting. This method reduces the learning time for the imaging of the head, and can respond effectively to changes in the learning data. The proposed method generated classifier with excellent performance using less learning time and learning data. In addition, this method accurately detect and track head of person from a variety of head data in real-time video images.
This paper proposes an effective method using Adaptive Boosting to track a person's head in complex background. By only one way to feature extraction methods are not sufficient for modeling a person's head. Therefore, the method proposed in this paper, several feature extraction methods for the accuracy of the detection head running at the same time. Feature Extraction for the imaging of the head was extracted using sub-region and Haar wavelet transform. Sub-region represents the local characteristics of the head, Haar wavelet transform can indicate the frequency characteristics of face. Therefore, if we use them to extract the features of face, effective modeling is possible. In the proposed method to track down the man's head from the input video in real time, we ues the results after learning Harr-wavelet characteristics of the three types using AdaBoosting algorithm. Originally the AdaBoosting algorithm, there is a very long learning time, if learning data was changes, and then it is need to be performed learning again. In order to overcome this shortcoming, in this research propose efficient method using cascade AdaBoosting. This method reduces the learning time for the imaging of the head, and can respond effectively to changes in the learning data. The proposed method generated classifier with excellent performance using less learning time and learning data. In addition, this method accurately detect and track head of person from a variety of head data in real-time video images.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
훈련영상집합은 얼굴과 배경으로 구별되어진 입력영상집합이다. 본 논문에서는 AdaBoosting 학습 알고리즘을 효율적으로 적용하는 캐스케이드 구조에 기반한 학습시스템을 제안한다. 최종검출기는 설정한 스테이지 수만큼의 강한 분류기로 구성되며 캐스케이드 구조로 이루어진다.
기존의 AdaBoosting 알고리즘은 학습 시간이 너무 길며 학습 영상의 변화에 대처하는 데 어려움이 많았다. 본 논문에서는 카메라로부터 입력되는 영상으로부터 실시간으로 머리를 검출하는 시스템을 구현하고 실험하였다. 이 시스템은 학습 시간이 적게 걸리며, 학습데이터의 변화에도 일정한 머리 추적 성능을 보인다.
제안 방법
AdaBoosting 알고리즘을 이용해서 첫 번째 단계는 [그림 4]와 같이 세 개의 특징을 가지는 강한 분류기를 제작한다. 첫 번째 특징은 얼굴의 콧대와 왼쪽 눈 사의 밝기 차이이고 두 번째 특징은 콧대와 오른쪽 눈 사의 밝기 차이이다.
본 논문에서 제안하는 방법에서는 머리 패턴을 sub-region과 Haar Wavelet 변환을 이용하여 모델링하고 AdaBoosting 분류기를 이용하여 머리의 검출을 시도한다. Sub-region은 얼굴 영상의 지역적인 특징을 나타낼 수 있다.
본 논문에서 제안하는 방법은 외형 기반 모델로써, 머리 패턴을 sub-region과 Haar Wavelet 변환을 이용하여 모델링하고 AdaBoosting 분류기를 이용하여 머리의 검출을 시도한다.
입력 영상내의 얼굴 영상의 크기는 매우 유동적이므로 스캔하는 과정에서 스케일링 작업이 필요하다. 본 실험에서는 187개의 특징으로 구성된 최종 검출기를 스케일링하며 얼굴을 검출하고 추적하게 된다. 초기의 스케일은 1.
본 실험에서는 많은 훈련데이터를 이용해서 학습을 하였으며 AdaBoosting 알고리즘은 정확한 얼굴검출 및 추적을 가능하게 하였다.
이 논문에서는 효율성이 더 좋은 머리 검출 및 추적을 달성하기 위해 간단한 웨이블렛 특징을 기반으로 AdaBoosting 알고리즘을 이용하여 분류기를 학습한 후에 머리를 추적하도록 하였다. 기존의 AdaBoosting 알고리즘은 학습 시간이 너무 길며 학습 영상의 변화에 대처하는 데 어려움이 많았다.
얼굴 특징은 Haar기저 함수를 사용해서 [그림 1]과 같이 사각형 특징으로 생성하였다. 전처리 단계를 거친 훈련 영상집합 중 얼굴 영상들의 특징에 대한 계수들을 구한다.
제안하는 방법에서는 [그림 3]과 같이 캐스케이드를 이용한 AdaBoosting의 효율적인 학습방법을 이용한다. 이 방법에서는 학습단계를 i 개의 레벨로 분리한다.
시스템이 얼굴 영역에서 하나의 특징만으로는 높은 검출율과 낮은 에러율을 가지는 분류기를 만들기 어렵다. 제안하는 방법은 AdaBoosting 알고리즘을 적용하여 여러 개의 특징을 선형적으로 결합해서 효율적인 강한 분류기를 만들 수 있다. AdaBoosting 알고리즘은 특징을 선택할 때 매우 많은 특징들로부터 적은 수의 특징을 과감하게 제거하여 찾아낸다.
얼굴의 크기, 색깔, 모양 등의 변화가 심하며 조명의 영향을 많이 받는다. 제안하는 시스템에서는 얼굴의 특성에 강인한 검출을 위해서 얼굴 영상을 Haar Wavelet 특징으로 정의한다. Haar Wavelet 계수를 이용한 Haar Wavelet 특징은 간단하므로 계산량을 감소시키며 여러 잡음이 있는 환경에서도 얼굴 검출에 있어서 강인한 면을 보인다.
제안하는 시스템은 온라인 부분과 오프라인 부분의 두 개의 모듈로 구성된다. 오프라인 부분은 입력영상의 전처리 단계와 Haar Wavelet 특징을 생성하는 단계와 특징을 이용한 학습단계로 구성된다.
온라인 부분은 입력 영상의 전처리 단계와 오프라인 부분에서 생성한 최종검출기를 이용해서 얼굴을 검출하는 과정이다. 최종검출기에서는 사각형 특징들을 스케일링(scaling), 쉬프팅(shifting)하며 입력 영상을 스캔하여 얼굴 영역을 검출한다.
대상 데이터
U)의 얼굴 데이터 집합과 인터넷을 이용하여 수집한 얼굴 데이터를 이용하였다. 사용한 영상의 크기는 20 * 20 픽셀이며 얼굴 영상은 정면 영상만을 고려하였다. 얼굴 영상 4000장과 배경 영상 약 10000장을 사용하여 학습하였다.
사용한 영상의 크기는 20 * 20 픽셀이며 얼굴 영상은 정면 영상만을 고려하였다. 얼굴 영상 4000장과 배경 영상 약 10000장을 사용하여 학습하였다. 특징 집합은 23,328 개의 사각형 특징으로 구성하였다.
본 논문에서 제안하는 학습시스템으로 각 단계를 생성하게 되면 각 단계는 하나의 강한 분류기로 구성된다. 최종 검출기는 200여개의 특징과 30개의 단계로 구성된다. 현재의 dual core 3.
얼굴 영상 4000장과 배경 영상 약 10000장을 사용하여 학습하였다. 특징 집합은 23,328 개의 사각형 특징으로 구성하였다. 각 특징들은 20 * 20 영상 내에 정방형 사각형 특징부터 비대칭 형태로도 존재하여 다양한 위치에 존재한다.
훈련 영상 집합은 국제 표준 FERET [11]과 카메기 멜론 대학(C.M..U)의 얼굴 데이터 집합과 인터넷을 이용하여 수집한 얼굴 데이터를 이용하였다. 사용한 영상의 크기는 20 * 20 픽셀이며 얼굴 영상은 정면 영상만을 고려하였다.
이론/모형
전처리 단계에서는, 훈련 영상집합을 인테그럴 이미지로 변환하며 연산량을 줄이는 역할을 한다. 얼굴 영역을 추출하기 위해 피부색으로 얼굴 후보 영역을 추출한 후 특징 집합을 만들기 위해 Haar Wavelet특징을 사용하였다. 얼굴 특징은 Haar기저 함수를 사용해서 [그림 1]과 같이 사각형 특징으로 생성하였다.
제안하는 방법에서는 얼굴 영상의 특징을 Harrwavelet을 이용하여 구한 후 그 특징을 AdaBoosting 알고리즘으로 학습한 후 결과를 이용하였다. 시스템이 얼굴 영역에서 하나의 특징만으로는 높은 검출율과 낮은 에러율을 가지는 분류기를 만들기 어렵다.
성능/효과
4로 스케일을 증가시키며 구현하였다. [그림 5]에서 볼 수 있는 것과 같이 각각의 분류기를 사용하는 것보다 두 개의 분류기인 Haar Wavelet와 캐스케이드를 이용한 AdaBoosting 알고리즘을 적용한 분류기를 조합하여 이용하였을 때 더 좋은 결과를 나타내었다. [그림 6]은 카메라에서 실시간으로 입력되는 영상에서 머리 영역을 검출하고 추적하는 장면을 보여주고 있다.
얼굴 검출 및 추적하는 시스템은 생체인식시스템, 대화형 게임기, 화상회의 등의 핵심기술이 되었다. 본 논문에서 제안하는 학습시스템으로 학습을 한 결과, 많은 학습시간을 줄일 수 있었으며, 얼굴검출 및 추적 성능 또한 우수한 결과를 보여주었다. 제안하는 시스템에서는 정면 얼굴만을 검출하므로 앞으로 개선의 여지가 많다.
질의응답
핵심어
질문
논문에서 추출한 답변
머리 영역 검출 중 형판 정합 모델의 단점은 무엇인가?
형판 정합 모델은 표준적인 머리의 패턴을 미리 구성하고, 입력 영상과의 상관관계를 비교하여 머리를 검출하는 방법이다. 그러나 머리의 자세나 모양, 크기 등이 다양하기 때문에 하나의 형판으로는 검출이 불가능 하다. 이의 대안으로 Yuille는 가변 형판 모델(deformable template model)을 제안하였다.
머리 영역 검출 방법 중 형판 정합 모델이란?
형판 정합 모델은 표준적인 머리의 패턴을 미리 구성하고, 입력 영상과의 상관관계를 비교하여 머리를 검출하는 방법이다. 그러나 머리의 자세나 모양, 크기 등이 다양하기 때문에 하나의 형판으로는 검출이 불가능 하다.
머리 검출은 어떠한 방법들로 수행될 수 있는가?
이런 머리 검출은 여러 가지 방법으로 수행될 수 있다. 영상내의 윤곽선 정보, 색상 정보, 움직임 정보 등을 이용하는 방법과 템플릿 정합, 신경망, SVM (Support Vector Machine)과 방법 등이 있다[1][2].
※ AI-Helper는 부적절한 답변을 할 수 있습니다.