사람 검출은 정지된 영상 혹은 동영상으로부터 사람의 움직임이나 자세를 추정하고, 사람이 찾아질 경우 영상 내 사람의 좌표, 동작 인식, 보안관련 인증 등을 알아내는 기술로 정의된다. 이러한 사람 검출은 다른 객체의 검출이나 사람과 컴퓨터와의 상호작용, 동작 인식 등의 기초 기술로서 해당 시스템의 성능에 영향을 미치는 매우 중요한 변수 중에 하나이다. 그러나 영상 내의 사람은 움직임, 자세, 크기, 빛의 방향 및 밝기, 다른 객체와의 중복 등의 환경적 변화로 인해 사람 모양이 다양해지므로 정확하고 빠른 검출이 어렵다. 따라서 본 논문에서는 피셔의 선형 판별 분석을 이용하여 몇 가지 환경적 조건을 극복한 정확하고 빠른 사람 검출 방법을 제안한다. 제안된 방법은 사람 움직임 및 자세와 배경에 무관하게 빠른 시간 안에 사람을 검출하는 것이 가능하다. 이를 위해 계층적인 방법으로 사람 검출을 수행하며, 휴리스틱한 방법, 피셔의 판별 분석을 이용하여 사람 검출을 수행하고, 검색 영역의 축소와 선형 결정의 계산 시간의 단축으로 검출 응답 시간을 빠르게 하였다. 추출된 사람 영상에서 사람의 자세를 추정하고 사람의 영역을 검출함으로써 사람 정보의 사용에 있어 보다 많은 정보를 추출할 수 있도록 하였다.
사람 검출은 정지된 영상 혹은 동영상으로부터 사람의 움직임이나 자세를 추정하고, 사람이 찾아질 경우 영상 내 사람의 좌표, 동작 인식, 보안관련 인증 등을 알아내는 기술로 정의된다. 이러한 사람 검출은 다른 객체의 검출이나 사람과 컴퓨터와의 상호작용, 동작 인식 등의 기초 기술로서 해당 시스템의 성능에 영향을 미치는 매우 중요한 변수 중에 하나이다. 그러나 영상 내의 사람은 움직임, 자세, 크기, 빛의 방향 및 밝기, 다른 객체와의 중복 등의 환경적 변화로 인해 사람 모양이 다양해지므로 정확하고 빠른 검출이 어렵다. 따라서 본 논문에서는 피셔의 선형 판별 분석을 이용하여 몇 가지 환경적 조건을 극복한 정확하고 빠른 사람 검출 방법을 제안한다. 제안된 방법은 사람 움직임 및 자세와 배경에 무관하게 빠른 시간 안에 사람을 검출하는 것이 가능하다. 이를 위해 계층적인 방법으로 사람 검출을 수행하며, 휴리스틱한 방법, 피셔의 판별 분석을 이용하여 사람 검출을 수행하고, 검색 영역의 축소와 선형 결정의 계산 시간의 단축으로 검출 응답 시간을 빠르게 하였다. 추출된 사람 영상에서 사람의 자세를 추정하고 사람의 영역을 검출함으로써 사람 정보의 사용에 있어 보다 많은 정보를 추출할 수 있도록 하였다.
Many reported methods assume that the people in an image or an image sequence have been identified and localization. People detection is one of very important variable to affect for the system's performance as the basis technology about the detection of other objects and interacting with people and ...
Many reported methods assume that the people in an image or an image sequence have been identified and localization. People detection is one of very important variable to affect for the system's performance as the basis technology about the detection of other objects and interacting with people and computers, motion recognition. In this paper, we present an efficient linear discriminant for multi-view people detection. Our approaches are based on linear discriminant. We define training data with fisher Linear discriminant to efficient learning method. People detection is considerably difficult because it will be influenced by poses of people and changes in illumination. This idea can solve the multi-view scale and people detection problem quickly and efficiently, which fits for detecting people automatically. In this paper, we extract people using fisher linear discriminant that is hierarchical models invariant pose and background. We estimation the pose in detected people. The purpose of this paper is to classify people and non-people using fisher linear discriminant.
Many reported methods assume that the people in an image or an image sequence have been identified and localization. People detection is one of very important variable to affect for the system's performance as the basis technology about the detection of other objects and interacting with people and computers, motion recognition. In this paper, we present an efficient linear discriminant for multi-view people detection. Our approaches are based on linear discriminant. We define training data with fisher Linear discriminant to efficient learning method. People detection is considerably difficult because it will be influenced by poses of people and changes in illumination. This idea can solve the multi-view scale and people detection problem quickly and efficiently, which fits for detecting people automatically. In this paper, we extract people using fisher linear discriminant that is hierarchical models invariant pose and background. We estimation the pose in detected people. The purpose of this paper is to classify people and non-people using fisher linear discriminant.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
사람 검출을 위한 전체 시스템은 다음의 [그림 3]과 같이 설계될 수 있다. 본 논문에서는 사람의 검출을 실시간과 오프라인으로 수행이 가능하며, 이때 영상의 어느 위치에 어느 정도의 크기로 사람이 있는지 예측하기가 힘들다. 따라서 사람이 있는 영역을 예측하기 위하여 영역 및 움직임 기반 방법을 이용한다.
가설 설정
피셔 판별 분석기법을 이용하여 분류를 위한 사람영역의 검색은 사람 크기변화에 대한 적응을 위해 5단계의 크기로 구성된 이미지를 통해 이루어진다. 실험에서 사용된 이미지의 크기 조절은 원 영상의 40%부터 70%까지로 하여 사람의 최소크기가 20x20, 최대크기가 110x110 임을 가정하였다.
제안 방법
[그림 5]는 검출을 위한 테스트 영상으로써 [그림 6]에서 나타난 바와 같이 사람 영역에 대해서는 검색된 영역이 2~ 3개 이상 중복되는 것을 볼 수 있다. 2개의 네트워크를 모두 통과한 최종영역들에 대해 각 영역마다 근처에 다른 영역이 있는지를 우선 검색한다. 제안하는 방법에서 사용된 것은 영역의 중점을 기준으로 상, 하, 좌, 우 5 픽셀 이내에 다른 영역이 있을 경우 인접 영역으로 처리한다.
본 논문에서는 선형 판별 분석을 이용하여 사람 검출을 수행한다. 가보 웨이블릿을 이용하여 사람 인식을 위한 각 개인의 특징 벡터를 구성하며, 선형 판별 분석을 이용하여 사람 자료를 분류할 때 정확한 피셔 판별식 및 사람 검출에 유용한 피셔 판별식을 알아보도록 한다. 사람의 스케일에 따른 신뢰성 있는 인식 성능을 위하여, 정규화에 따른 인식 성능을 분석하여 사람 인식 성능에 맞도록 하여 실험하였다.
본 논문에서는 사람 영상의 대칭적 특성을 강조하기 위해 영상을 단위 셀(Cell)로 나누어 4개의 셀, 9개의 셀, 16개, 25개의 셀에 의해 생성되어진 평균값에 의해 벡터화 되었다. 그리고 FAR 감소를 위한 비사람 추출을 위하여 Haar 변환 방식을 이용하여 데이터를 표현함으로써 이웃하는 픽셀들과의 상대적인 차이값을 고려하여 본 논문에서 사용하는 벡터화방식과 피셔 판별 분석에 의해 잘못 인식되는 데이터들을 추출할 수 있도록 한다.
기존에 연구되었던 방법들과 마찬가지로 이 방법은 두 단계로 이루어진다. 먼저 사람 이미지는 주성분 해석(Principal Component Analysis, PCA)을 통해서 사람 부분공간으로 사영되는데 여기에서 부분 공간 크기가 주의 깊게 선택되며, 그리고 부분공간에서 선형 분류기를 생성하기 위해서 PCA 공간으로 투영된 벡터들을 LDA로 투영한다. 이러한 방법과 피셔 공간으로의 직접적인 투영 방법 등을 비교하였으며, 오프라인과 실시간에서의 사람 검출 성능을 비교하였다.
[그림 3]에서 영상의 변화를 검출하여 객체들을 인식한 후에 추적을 시작한다. 미리 정의한 동작에 대한 외형 모델과 비교하여 동작을 인식해 냄으로써 사람의 움직임을 인식하도록 한다.
본 논문에서는 기본적인 영상 개선 알고리즘으로 알려진 히스토그램 평활화(Histogram Equalization)를 전처리 과정으로 수행 하였고, 이렇게 추출된 영상을 1차원 벡터로 변형하였다.
따라서 수식은 다음의 식과 같이 구해질 수 있다. 본 논문에서는 다음과 같이 유사도 평가 함수를 유클리디언 거리 공식, 코사인 거리공식, 마할라노비스 거리 공식을 이용하여 계산하였으며 사람 검출에 효과적인 유사도 평가 함수를 제시한다. 에러가 나타난 영상 중 6개의 영상에서는 사람으로 인식되는 영역이 하나도 검출되지 않았으며, 그 이외의 영상에서는 사람 영역이 검출되며 팔과 다리 및 머리의 일부분만 검출된 것으로 사람 전체가 포함되지 않은 것에 대해서는 제대로 검출하지 못한 것으로 하여 검출하였다.
본 논문에서는 사람 영상의 대칭적 특성을 강조하기 위해 영상을 단위 셀(Cell)로 나누어 4개의 셀, 9개의 셀, 16개, 25개의 셀에 의해 생성되어진 평균값에 의해 벡터화 되었다. 그리고 FAR 감소를 위한 비사람 추출을 위하여 Haar 변환 방식을 이용하여 데이터를 표현함으로써 이웃하는 픽셀들과의 상대적인 차이값을 고려하여 본 논문에서 사용하는 벡터화방식과 피셔 판별 분석에 의해 잘못 인식되는 데이터들을 추출할 수 있도록 한다.
본 논문에서는 선형 판별 분석을 이용하여 사람 검출을 수행한다. 가보 웨이블릿을 이용하여 사람 인식을 위한 각 개인의 특징 벡터를 구성하며, 선형 판별 분석을 이용하여 사람 자료를 분류할 때 정확한 피셔 판별식 및 사람 검출에 유용한 피셔 판별식을 알아보도록 한다.
사람의 스케일에 따른 신뢰성 있는 인식 성능을 위하여, 정규화에 따른 인식 성능을 분석하여 사람 인식 성능에 맞도록 하여 실험하였다. 사람 검출 실험은 사람 데이터들의 특징을 분석함에 따라 마할라노비스(Mahalanobis) 거리공식 및 유클리디언(Euclidian) 거리공식을 사용하여 검출하며, 검출된 영상의 사람 여부를 판정하고, 성공률을 측정 하였다[9].
이러한 방법과 피셔 공간으로의 직접적인 투영 방법 등을 비교하였으며, 오프라인과 실시간에서의 사람 검출 성능을 비교하였다. 사람 검출에 있어서는 여러 가지 인공조명을 넣은 사람 데이터와 포즈 데이터들을 이용하여 사람들을 분류하여 피셔 공간으로 투영함으로써 판별하도록 한다. 실시간 및 복잡한 배경에서의 사람 검출 성능을 높이기 위하여 Haar Wavelet[7, 8]으로의 검증, 휴리스틱한 방법으로 사람의 후보 영역 검출 등 계층적으로 수행한다.
사람 영상의 경우, 사람이 포함된 다양한 영상에서 사람 영역만을 다음에 설명된 방법으로 정렬한 후 20x20의 크기로 재조정하였다. 비 사람 영상의 경우, 무작위로 선택된 사람이 포함되지 않은 영상에 대해 임의로 20×20의 영상을 추출하였다.
3으로 설정하여 사람 영역임을 인증하도록 하였다. 사람 클래스로 분류되는 영역에 대해서 거리값으로 검증하였다.
사람으로 인식되는 비사람의 경우 사람과 유사한 비사람(People-Like nonPeople)로 정의함으로써 분류기를 계층적으로 구성하며, 이를 통해 FAR을 감소하도록 설계하였다.
가보 웨이블릿을 이용하여 사람 인식을 위한 각 개인의 특징 벡터를 구성하며, 선형 판별 분석을 이용하여 사람 자료를 분류할 때 정확한 피셔 판별식 및 사람 검출에 유용한 피셔 판별식을 알아보도록 한다. 사람의 스케일에 따른 신뢰성 있는 인식 성능을 위하여, 정규화에 따른 인식 성능을 분석하여 사람 인식 성능에 맞도록 하여 실험하였다. 사람 검출 실험은 사람 데이터들의 특징을 분석함에 따라 마할라노비스(Mahalanobis) 거리공식 및 유클리디언(Euclidian) 거리공식을 사용하여 검출하며, 검출된 영상의 사람 여부를 판정하고, 성공률을 측정 하였다[9].
사람 검출에 있어서는 여러 가지 인공조명을 넣은 사람 데이터와 포즈 데이터들을 이용하여 사람들을 분류하여 피셔 공간으로 투영함으로써 판별하도록 한다. 실시간 및 복잡한 배경에서의 사람 검출 성능을 높이기 위하여 Haar Wavelet[7, 8]으로의 검증, 휴리스틱한 방법으로 사람의 후보 영역 검출 등 계층적으로 수행한다.
실시간 시스템에서의 활용을 위하여 검색 시간을 단축시킬 수 있도록 검색방법을 제안하며, 제한된 영역 내에서의 빠른 인식률을 위한 방법을 제안한다.
실시간에서의 사람 검출 시간을 증가시키기 위하여 처음 들어오는 프레임에 대해서는 전체적으로 검색을 해서 사람을 검출하고 그 다음 프레임부터는 일단 이동할 반경에 해당하는 검출된 주위 영역들에 대해서 검출함으로써 움직임이 크지 않은 영역에 대해 검출함으로써 검출 성능 및 검출 시간을 1/3 정도 감소시켰다.
실제의 검출에서는 외부의 환경을 판단하는 센서가 있어야 하지만, 실험에서는 가상으로 영상에 대해 영상의 상태를 판단한 후 이미 만들어져 있는 적합한 필터 조합을 선택하게 하였다.
비사람 영상은 계층적이고 반복적인 학습을 통해 사람과 유사한 비사람(People-like nonPeople) 그룹을 설계함으로써 사람 검출의 성능을 높인다. 오프라인과 온라인에서의 실시간 시스템에서의 사람 검출 성능을 높이도록 한다.
먼저 사람 이미지는 주성분 해석(Principal Component Analysis, PCA)을 통해서 사람 부분공간으로 사영되는데 여기에서 부분 공간 크기가 주의 깊게 선택되며, 그리고 부분공간에서 선형 분류기를 생성하기 위해서 PCA 공간으로 투영된 벡터들을 LDA로 투영한다. 이러한 방법과 피셔 공간으로의 직접적인 투영 방법 등을 비교하였으며, 오프라인과 실시간에서의 사람 검출 성능을 비교하였다. 사람 검출에 있어서는 여러 가지 인공조명을 넣은 사람 데이터와 포즈 데이터들을 이용하여 사람들을 분류하여 피셔 공간으로 투영함으로써 판별하도록 한다.
2개의 네트워크를 모두 통과한 최종영역들에 대해 각 영역마다 근처에 다른 영역이 있는지를 우선 검색한다. 제안하는 방법에서 사용된 것은 영역의 중점을 기준으로 상, 하, 좌, 우 5 픽셀 이내에 다른 영역이 있을 경우 인접 영역으로 처리한다.
학습 데이터는 사람 영상의 경우, 사람이 포함된 다양한 영상에서 사람 영역만을 수작업으로 분리 후 20×20의 크기로 재조정하였다.
대상 데이터
피셔의 판별분석 기법을 이용하여 사람 검출에 관한 연구들이 되어오고 있으며 사람 검출을 하기 위하여 학습데이터는 다음과 같이 구성한다. 20x20 크기의 사람 영상과 사람 영상이 아닌 비사람 영상을 20x20 크기로 생성하여 학습을 위한 데이터로 사용한다. 비사람 영상은 계층적이고 반복적인 학습을 통해 사람과 유사한 비사람(People-like nonPeople) 그룹을 설계함으로써 사람 검출의 성능을 높인다.
본 논문에서는 총 600개의 학습 데이터를 사용하였다. 각 포즈별과 비사람 클래스를 각각 2개씩 구성하였으며, 각 클래스당 학습 자료의 수는 100개씩으로 하여 수행하였다. 피셔의 판별 분석 기법에서는 클래스당 학습데이터의 수가 너무 많으면 오히려 다른 클래스로 투영될 가능성이 있다.
학습 데이터는 사람 영상의 경우, 사람이 포함된 다양한 영상에서 사람 영역만을 수작업으로 분리 후 20×20의 크기로 재조정하였다. 또한, 포즈 검출을 고려하여 다양한 포즈를 사람 데이터 영상으로 선정하였다. 사람 영역이 완전히 포함되지 않은 학습 데이터들은 피셔의 판별 분석을 이용하여 검출된 결과들을 사용한다.
학습 데이터의 수가 많을수록 검출 오차가 적어지며, 잘못 추출되는 오 검출의 경우도 줄어든다. 본 논문에서는 총 600개의 학습 데이터를 사용하였다. 각 포즈별과 비사람 클래스를 각각 2개씩 구성하였으며, 각 클래스당 학습 자료의 수는 100개씩으로 하여 수행하였다.
비 사람 영상의 경우, 무작위로 선택된 사람이 포함되지 않은 영상에 대해 임의로 20×20의 영상을 추출하였다.
사람 검출을 위하여 사용한 데이터는 FERET DB와 연구실 자체 보유 데이터이다. 검출에 관련된 실험 결과는 다음과 같다.
검출에 관련된 실험 결과는 다음과 같다. 사람 데이터 100개 중에서 앞면과 뒷면 사람 데이터 100개씩에 대하여 학습 자료로 사용하였으며, 비사람 데이터도 400개의 이미지를 사용하였다. FLD의 특성중의 하나가 유클리디언 거리 공식으로 계산할 수 있다는 것인데 학습시킨 데이터의 정확성에 따라 결정 함수는 달라질 수 있다.
이론/모형
완전한 사람 영역만을 중심으로 피셔 판별분석에 의해 사람 영역을 검색하면, 사람을 포함하는 큰 영역과 근처의 영역까지 모두 사람 영역으로 판정한다. 본 논문에서는 4번의 반복적인 학습을 cascading 방법으로 수행하였다. 학습 시 중요한 또 하나의 요소는 학습 데이터의 수이며, 이는 검출의 성공률과 밀접한 관계가 있다.
동일한 공분산을 가지는 경우에는 FLD에 의해 데이터가 어떤 경계값을 넘을 경우 w1을 선택하고, 그 외에는 w2를 선택하는 것이다. 사람 검출을 위하여 사람 데이터들을 포즈별로 2 단계로 설계하였으며 비사람 데이터에 대해서는 Boosting 방법을 이용하여 구성하도록 하였다.
본 논문에서 사람 검출을 위하여 사용한 경계값은 경험에 의하여 생성된 값이다. 이러한 경험에 의한 결과값의 신뢰성을 높이기 위하여 Adaboosting과 같은 방법을 통해 학습을 시킴으로써 신뢰성 있는 경계값을 추출할 수 있을 것으로 예상한다. 사람이 들어가 있는 여러 영상의 경우 영상의 복잡도 및 해상도 또한 다양하다.
판별 분석식은 영상을 분류하거나 영상이 어느 클래스에 속하는지 결정하게 되는 기능을 수행한다. 판별 분석에 사용하는 결정 방법을 포즈에 대한 사람 데이터를 분류하기 위하여 피셔의 판별 분석 방법을 이용한다. 보통 PCA는 데이터의 표현에 유용한 컴포넌트를 찾는 것이다.
후속연구
사람 인식 및 추적에 대한 연구는 국외에서도 계속해서 연구가 되어오고 있으며, 생체인식 보안을 위한 시스템으로 발전되어 관련 분야의 시장 창출에 기여하고 있다. 비접촉식의 장점과 CCTV의 보급으로 인한 건물 출입시의 보안 기술 등 다양한 응용에 적용할 수 있다는 장점이 있으므로 앞으로 신뢰성 있는 인식과 실시간에서의 안정성을 보장할 수 있도록 하는 정확성 있는 시스템 구성이 필요할 것으로 예상된다. 실시간에서 시스템으로 적용하기 위하여 시간 단축 및 검색 알고리즘에 대한 연구가 요구되어진다.
질의응답
핵심어
질문
논문에서 추출한 답변
사람 정보의 사용이 인공시각의 중요한 부분을 차지하는 이유는?
사람 정보의 인식과 분석은 이러한 인공시각의 중요한 부분을 차지하고 있으며, 다양한 연구들이 오랫동안 진행 되어 온 분야 중에 하나다. 사람 정보의 사용은 사람과 컴퓨터간의 인터페이스(Human - Computer Interaction)를 획기적으로 개선시켜 줄 수 있으며, 높은 수준의 보안시스템에도 적용할 수 있기 때문이다.
사람 검출은 어떠한 기술로 정의되는가?
사람 검출은 정지된 영상 혹은 동영상으로부터 사람의 움직임이나 자세를 추정하고, 사람이 찾아질 경우 영상 내 사람의 좌표, 동작 인식, 보안관련 인증 등을 알아내는 기술로 정의된다. 이러한 사람 검출은 다른 객체의 검출이나 사람과 컴퓨터와의 상호작용, 동작 인식 등의 기초 기술로서 해당 시스템의 성능에 영향을 미치는 매우 중요한 변수 중에 하나이다.
사람 검출 방법의 한계점은?
이러한 사람 검출은 다른 객체의 검출이나 사람과 컴퓨터와의 상호작용, 동작 인식 등의 기초 기술로서 해당 시스템의 성능에 영향을 미치는 매우 중요한 변수 중에 하나이다. 그러나 영상 내의 사람은 움직임, 자세, 크기, 빛의 방향 및 밝기, 다른 객체와의 중복 등의 환경적 변화로 인해 사람 모양이 다양해지므로 정확하고 빠른 검출이 어렵다. 따라서 본 논문에서는 피셔의 선형 판별 분석을 이용하여 몇 가지 환경적 조건을 극복한 정확하고 빠른 사람 검출 방법을 제안한다.
참고문헌 (11)
Balakrishnama, S.; Ganapathiraju, A.; Picone, J.; "Linear discriminant analysis for signal processing problems," Southeastcon '99. Proceedings. IEEE, pp: 78-81, March.1999
Zhao, W.; Chellappa, R.; Krishnaswamy, A.; "Discriminant analysis of principal components for face recognition," Third IEEE International Conference on, 14-16 , pp336-341, April.1998
Ordowski, M.; Meyer, G.G.L.; "Geometric linear discriminant analysis," ICASSP '01. 2001 IEEE International Conference on, Vol. 5, 7-11, pp.3173-3176 , May 2001
Hyun-Chul Kim; Daijin Kim; Sung Yang Bang; "Face recognition using LDA mixture model," Pattern Recognition, 2002. Proceedings. 16th International Conference on , 11-15, 8. 2002. pp: 486-489 vol.2
Liu. Chengjun ; H.Wechsler.; "Enhanced Fisher linear discriminant models for face recognition," Pattern Recognition, 1998. Proceedings. Vol. 2, 16-20 pp: 1368-1372, Aug.1998
Lee, W.S.; Lee, H.J.; Chung, J.H.; "Wavelet-based FLD for face recognition," Circuits and Systems, Proceedings of the 43rd IEEE Midwest Symposium on , Vol.2, 8-11 pp. 734-737, Aug. 2000
Takano, S.; Niijima, K.; Abdukirim, T.; "Fast face detection by lifting dynamic wavelet filters," Image Processing, International Conference on , Vol.3, pp. 893-896, Sept. 14-17.2003
C. W. Ng and S. Ranganath, "Real-time Gesture Recognition System and Application," Image and Vision Computing, Vol. 20, Issues 13-14, pp. 993-1007, 2002.
P. Phillips, "The FERET Database and Evolution Procedure for Object Recognition Al-gorithms," Image and Vision Computing, Vol. 16, No. 5, pp. 295-306, 1999.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.