얼굴 인식에서 얼굴 이미지의 특정 추출 방법에는 여러 가지가 있다. 그러나, 얼굴 이미지의 대부분은 표본의 수보다 특정 변수의 수가 많기 때문에 이러한 점을 고려한 특정 추출 방법이 필요하다. 본 논문에서는 부분 최소제곱법을 이용하여 특정 벡터의 차원을 축소하는 방법을 제안한다. 전통적인 차원 축소 방법인 주성분 분석은 클래스의 정보를 고려하지 않고 최대 변이를 가지는 성분을 추출하기 때문에, 클래스의 구분에 필요한 특정을 필수적으로 추출하지 못한다. 이에 비해, 부분 최소제곱법은 클래스 변수에 대한 정보를 포함하여 성분을 추출한다. 그러므로, 분류를 하는데 있어서는 주성분 분석에 의해 추출된 성분보다는 부분 최소제곱법에 의해 추출된 성분이 보다 더 예측적이다. 맨체스터와 ORL 얼굴 데이터베이스를 이용하여 실험한 결과, 분류와 차원 축소 측면에서 주성분 분석 방법보다는 부분 최소제곱법을 이용한 방법이 그 성능이 우수함을 알 수 있었다.
얼굴 인식에서 얼굴 이미지의 특정 추출 방법에는 여러 가지가 있다. 그러나, 얼굴 이미지의 대부분은 표본의 수보다 특정 변수의 수가 많기 때문에 이러한 점을 고려한 특정 추출 방법이 필요하다. 본 논문에서는 부분 최소제곱법을 이용하여 특정 벡터의 차원을 축소하는 방법을 제안한다. 전통적인 차원 축소 방법인 주성분 분석은 클래스의 정보를 고려하지 않고 최대 변이를 가지는 성분을 추출하기 때문에, 클래스의 구분에 필요한 특정을 필수적으로 추출하지 못한다. 이에 비해, 부분 최소제곱법은 클래스 변수에 대한 정보를 포함하여 성분을 추출한다. 그러므로, 분류를 하는데 있어서는 주성분 분석에 의해 추출된 성분보다는 부분 최소제곱법에 의해 추출된 성분이 보다 더 예측적이다. 맨체스터와 ORL 얼굴 데이터베이스를 이용하여 실험한 결과, 분류와 차원 축소 측면에서 주성분 분석 방법보다는 부분 최소제곱법을 이용한 방법이 그 성능이 우수함을 알 수 있었다.
There are many feature extraction methods for face recognition. We need a new method to overcome the small sample problem that the number of feature variables is larger than the sample size for face image data. The paper considers partial least squares(PLS) as a new dimension reduction technique for...
There are many feature extraction methods for face recognition. We need a new method to overcome the small sample problem that the number of feature variables is larger than the sample size for face image data. The paper considers partial least squares(PLS) as a new dimension reduction technique for feature vector. Principal Component Analysis(PCA), a conventional dimension reduction method, selects the components with maximum variability, irrespective of the class information. So, PCA does not necessarily extract features that are important for the discrimination of classes. PLS, on the other hand, constructs the components so that the correlation between the class variable and themselves is maximized. Therefore PLS components are more predictive than PCA components in classification. The experimental results on Manchester and ORL databases shows that PLS is to be preferred over PCA when classification is the goal and dimension reduction is needed.
There are many feature extraction methods for face recognition. We need a new method to overcome the small sample problem that the number of feature variables is larger than the sample size for face image data. The paper considers partial least squares(PLS) as a new dimension reduction technique for feature vector. Principal Component Analysis(PCA), a conventional dimension reduction method, selects the components with maximum variability, irrespective of the class information. So, PCA does not necessarily extract features that are important for the discrimination of classes. PLS, on the other hand, constructs the components so that the correlation between the class variable and themselves is maximized. Therefore PLS components are more predictive than PCA components in classification. The experimental results on Manchester and ORL databases shows that PLS is to be preferred over PCA when classification is the goal and dimension reduction is needed.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
주성분 분석은 다변량 자료의 총 변이를 주요 성분이라는 축소 요약된 양을 통하여 해석함으로써 다차원 변수들에 대 한 단순화를 도모하고, 서로 상관되어 있는 변수들간의 내 적 구조를 분석하는 데에 그 목적을 두고 있다. 이를 위하 여 주성분 분석은 원래 변수들을 선형 결합의 형식으로 변 화시켜 주성분(Principal Component)이라고 부르는 서로 상 관되어 있지 않은(독립적인) 인공적 변수를 유도한다.
제안 방법
주성분 분석과 부분 최소제곱법으로 차원 축소된 각각의 결과는 선형판별분석 (Linear Discriminant Analysis- LDA)[7, 10], 이차판별분석 (Quardratic Discriminant Analysis: QDA)[8], 신경망(Neural Network: NN)[5, 13, 14], SVM(Support Vector Machine)"]과 같은 분류기를 이용하여 얼굴 인식 실험을 하여 그 성능을 측정하였다. 성능 측정을 위해 MATLAB과 SAS 및 SPSSU2]를 사용하였다.
각 데이터베이스에서 70%는 학습 자료로, 30%는 실험 자료로 사용하였다. 또한, 이러한 표본 추출을 무작위로 10번 반복 시행하여 각각 10개의 학습자료 셋과 실험자료 셋을 사용하여 실험하였다.
본 논문에서는 얼굴 이미지의 부분 최소제곱법과 주성분 분석법을 이용하여 4가지 분류방법 (LDA, QDA, NN, SVM) 을 통해 얼굴 이미지 자료를 분류하였다. 실험 결과를 통해 효과적인 얼굴 이미지 추출 방법을 제안하였고 각 분류기에 따른 비교를 통해 각 이미지 데이터베이스에서 보다 나은 분류 방법올 선택할 수 있도록 하였다.
본 논문에서는 얼굴 이미지의 부분 최소제곱법과 주성분 분석법을 이용하여 4가지 분류방법 (LDA, QDA, NN, SVM) 을 통해 얼굴 이미지 자료를 분류하였다. 실험 결과를 통해 효과적인 얼굴 이미지 추출 방법을 제안하였고 각 분류기에 따른 비교를 통해 각 이미지 데이터베이스에서 보다 나은 분류 방법올 선택할 수 있도록 하였다.
주성분'변환의 경우 그레이 스케일로 구성된 얼굴 데이터를 주성분 분석을 위해 학습자료에 대한 분산-공분산 행렬을 구하여 고유벡터와 고유값을 구한다. 이로부터 구해진 고유 벡터를 사용하여 학습자료에 대한 주성분 점수와 실험자료에 대한 주성분 점수를 구하여 그것을 분석 대상으로 하였다.
축소된 주성분 분석과 부분 최소제곱법 성분수를 25 개부 터 50 개까지 5 개씩 증가시켜가면서 각 분류기 별로 10 개 의 실험자료 셋들에 대하여 각각 인식률을 계산한 다음, 그 들의 평균을 구하여 평균인식률을 측정하였다.(그림 4)는 실 험에 사용된 성분수별 각 분류방법들의 평균 인식률을 부분 최소제곱법과 주성분 분석 방법을 비교하여 보여주고 있는 데, QDA를 제외한 나머지 모든 방법에서 부분 최소제곱법 을 이용하는 것이 더 높은 인식률을 달성한다는 것을 확인 할 수 있다.
축소된 주성분 분석과 부분 최소제곱법 성분수를 30 개부 터 100 개까지 10 개씩 증가시켜가면서 각 분류기 별로 10 개의 실험자료 셋들에 대하여 각각 인식률을 계산한 다음, 그들의 평균을 구하여 평균인식률을 측정하였다. (그림 3)은 부분 최소제곱법과 주성분 분석에 의한 성분을 사용하여 여 러 가지 분류기별로 적용시켰을 때 성분수의 증가에 따른 각 분류방법들의 평균 인식률을 나타내고 있다.
대상 데이터
각 데이터베이스에서 70%는 학습 자료로, 30%는 실험 자료로 사용하였다. 또한, 이러한 표본 추출을 무작위로 10번 반복 시행하여 각각 10개의 학습자료 셋과 실험자료 셋을 사용하여 실험하였다.
여기서, 맨체스터의 경우 30명의 사람에 대해 각각 10장씩 300장의 영상을 사용하였고, ORL의 경우 40명의 사 람에 대해 각각 10장씩 400장의 영상을 사용하였다. 맨체스 터 이미지의 해상도는 512x512이지만 16X16으로 축소하여 실험하였고, ORL 이미지의 경우에는 112X92 해상도이지만 28X23으로 축소하여 실험하였다. 그리고, 모든 이미지는 256 그레이 스케일로 표현되었다.
실험 자료는 맨체스터와 ORL 얼굴 데이터베이스를 사용하였다. 여기서, 맨체스터의 경우 30명의 사람에 대해 각각 10장씩 300장의 영상을 사용하였고, ORL의 경우 40명의 사 람에 대해 각각 10장씩 400장의 영상을 사용하였다.
실험 자료는 맨체스터와 ORL 얼굴 데이터베이스를 사용하였다. 여기서, 맨체스터의 경우 30명의 사람에 대해 각각 10장씩 300장의 영상을 사용하였고, ORL의 경우 40명의 사 람에 대해 각각 10장씩 400장의 영상을 사용하였다. 맨체스 터 이미지의 해상도는 512x512이지만 16X16으로 축소하여 실험하였고, ORL 이미지의 경우에는 112X92 해상도이지만 28X23으로 축소하여 실험하였다.
데이터처리
(그림 3)의 (a)와(b)를 비교해 보면 LDA 방법을 제외한 나머지 방법들 에서 부분 최소제곱법을 이용하는 경우가 더 우수한 인식률 을 보이고 있다. 각 분류방법별로 두 가지 성분추출 방법 간에 유의적인 차이가 존재하는지, 즉 최소제곱추출 성분이 주성분분석 성분보다 유의적으로 더 인식률이 높은지 검정 하기 위하여 두 방법의 인식률 차이에 대하여 대응표본 t- 검정을 실시하였다. [표 2]에서는 맨체스터 자료의 분류기 별 주성분 분석과 부분 최소제곱법 인식률의 차이에 대한 대응표본 t-검정 결과를 나타내고 있다.
05보다 작기 때문이다. 다음으로는 성능이 우 수하다고 판정된 부분 최소제곱법 변환 자료를 이용하여 인 식을 할 때 각 분류방법 간에는 과연 인식률에 있어서 차이 가 있는지 검정하기 위하여 분산분석을 실시하였다. [표 3](a)에서 '방법'에 대한 유의확률이 0.
성능/효과
[표 5](a)에서 '방법' 에 대한 유의확률이 역시 0 이므로 분류방법들 간에는 그 인식률에 있어 유의한 차이가 있음을 확인할 수 있다. 또한 어느 분류방법이 다른 방법에 비하여 더 우수한 인식률을 보이는지 검정하기 위해 [표 5](b)와 같이 Tukey의 다중비 교를 실시한 결과, SVM과 LDA 그룹이 NN과 QDA 방법 보다 유의적으로 높은 인식률을 가지고 있음을 알 수 있다.
축소된 주성분 분석과 부분 최소제곱법 성분수를 25 개부 터 50 개까지 5 개씩 증가시켜가면서 각 분류기 별로 10 개 의 실험자료 셋들에 대하여 각각 인식률을 계산한 다음, 그 들의 평균을 구하여 평균인식률을 측정하였다.(그림 4)는 실 험에 사용된 성분수별 각 분류방법들의 평균 인식률을 부분 최소제곱법과 주성분 분석 방법을 비교하여 보여주고 있는 데, QDA를 제외한 나머지 모든 방법에서 부분 최소제곱법 을 이용하는 것이 더 높은 인식률을 달성한다는 것을 확인 할 수 있다.[표 4]에서는 ORL 자료의 분류기별 주성분 분석과 부분 최소제곱법 인식률의 차이가 통계적으로 유의 한지 검정하기 위해 실시한 대응표본 t-검정의 결과를 나타 내고 있다.
[표 2]에서는 맨체스터 자료의 분류기 별 주성분 분석과 부분 최소제곱법 인식률의 차이에 대한 대응표본 t-검정 결과를 나타내고 있다. [표 2]의 각 방법 에 대한 t값과 유의확률을 통하여 유의수준 0.05 하에서 LDA를 제외한 QDA, NN, SVM에서 부분 최소제곱법이 주 성분 분석에 비하여 유의적으로 더 우수한 인식률을 가지고 있음을 알 수 있다. 왜냐하면, QDA, NN, SVM의 유의확률 이 유의수준 0.
맨체스터 자료와 ORL 자료에 대한 두 가지 변환 방법을 비교하여 실시한 결과 부분 최소제곱법 변환 방법이 주성분 분석 변환 방법 보다 우수한 성능을 보임을 알 수 있었다. 또한 제한된 얼굴인식 실험 자료에 의존한 결과이지만 부분 최소제곱법 특징을 이용했을 때 SVM, NN, LDA 는 그 성 능 면에서 비슷한 인식 성능을 가지고 있다고 할 수 있겠다.
맨체스터 자료와 ORL 자료에 대한 두 가지 변환 방법을 비교하여 실시한 결과 부분 최소제곱법 변환 방법이 주성분 분석 변환 방법 보다 우수한 성능을 보임을 알 수 있었다. 또한 제한된 얼굴인식 실험 자료에 의존한 결과이지만 부분 최소제곱법 특징을 이용했을 때 SVM, NN, LDA 는 그 성 능 면에서 비슷한 인식 성능을 가지고 있다고 할 수 있겠다.
참고문헌 (14)
K. Fukunaga, 'Introducion to Statistical Pattern Recognition', Academic Press, Boston, 1990
M. Turk, A. Pentland, 'Eigen faces for recognition', J. Cognitive Neurosci. 3, pp.71-86, 1991
※ AI-Helper는 부적절한 답변을 할 수 있습니다.