본 논문에서는 기존 평행좌표를 이용하는 얼굴영상 대신 극 좌표계 변환을 이용한 얼굴 인식 방법을 제안한다. 이 방법은 얼굴의 중심부분의 한 점을 극으로 삼아 이 점을 기준으로 360도의 각 방향으로 일정 길이만큼 얼굴 영상을 샘플링하여 새로운 얼굴 영상을 제작하고 이를 바탕으로 기존의 특징 추출 방법들을 이용하여 얼굴 인식의 성능을 높인다. 극 좌표계의 특성상 극에 가까운 부분은 세밀하게 묘사되고 극에서 멀리 떨어질수록 영상의 정확도가 떨어진다. 일반적으로 얼굴 영상은 얼굴의 중심부에 가까운 영역에 눈, 코, 입 등의 주요 부위가 밀집되어 있다. 따라서 이러한 극 좌표계를 얼굴영상에 적용한다면 같은 화소를 이용하는 기존 평행좌표를 사용할 때보다 눈, 코, 입 등 주요 부위를 보다 세밀하게 표현할 수 있다는 장점을 갖는다. 제안된 방법을 Yale데이터와 FRGC데이터에 적용한 후 기존의 특징 추출 방법인 LDA와 NLDA를 이용하여 얼굴인식을 수행한 결과 평행좌표에 기반한 원 영상을 그대로 사용했을 때 보다 인식률이 향상됨을 확인할 수 있었다.
본 논문에서는 기존 평행좌표를 이용하는 얼굴영상 대신 극 좌표계 변환을 이용한 얼굴 인식 방법을 제안한다. 이 방법은 얼굴의 중심부분의 한 점을 극으로 삼아 이 점을 기준으로 360도의 각 방향으로 일정 길이만큼 얼굴 영상을 샘플링하여 새로운 얼굴 영상을 제작하고 이를 바탕으로 기존의 특징 추출 방법들을 이용하여 얼굴 인식의 성능을 높인다. 극 좌표계의 특성상 극에 가까운 부분은 세밀하게 묘사되고 극에서 멀리 떨어질수록 영상의 정확도가 떨어진다. 일반적으로 얼굴 영상은 얼굴의 중심부에 가까운 영역에 눈, 코, 입 등의 주요 부위가 밀집되어 있다. 따라서 이러한 극 좌표계를 얼굴영상에 적용한다면 같은 화소를 이용하는 기존 평행좌표를 사용할 때보다 눈, 코, 입 등 주요 부위를 보다 세밀하게 표현할 수 있다는 장점을 갖는다. 제안된 방법을 Yale데이터와 FRGC데이터에 적용한 후 기존의 특징 추출 방법인 LDA와 NLDA를 이용하여 얼굴인식을 수행한 결과 평행좌표에 기반한 원 영상을 그대로 사용했을 때 보다 인식률이 향상됨을 확인할 수 있었다.
In this paper, we propose a novel method for face recognition which uses polar coordinate instead of conventional cartesian coordinate. Among the central area of a face, we select a point as a pole and make a polar image of a face by evenly sampling pixels in each direction of 360 degrees around the...
In this paper, we propose a novel method for face recognition which uses polar coordinate instead of conventional cartesian coordinate. Among the central area of a face, we select a point as a pole and make a polar image of a face by evenly sampling pixels in each direction of 360 degrees around the pole. By applying conventional feature extraction methods to the polar image, the recognition rates are improved. The polar coordinate delineates near-pole area more vividly than the area far from the pole. In a face, important regions such as eyes, nose and mouth are concentrated on the central part of a face. Therefore, the polar coordinate of a face image can achieve more vivid representation of important facial regions compared to the conventional cartesian coordinate. The proposed polar coordinate transform was applied to Yale and FRGC databases and LDA and NLDA were used to extract features afterwards. The experimental results show that the proposed method performs better than the conventional cartesian images.
In this paper, we propose a novel method for face recognition which uses polar coordinate instead of conventional cartesian coordinate. Among the central area of a face, we select a point as a pole and make a polar image of a face by evenly sampling pixels in each direction of 360 degrees around the pole. By applying conventional feature extraction methods to the polar image, the recognition rates are improved. The polar coordinate delineates near-pole area more vividly than the area far from the pole. In a face, important regions such as eyes, nose and mouth are concentrated on the central part of a face. Therefore, the polar coordinate of a face image can achieve more vivid representation of important facial regions compared to the conventional cartesian coordinate. The proposed polar coordinate transform was applied to Yale and FRGC databases and LDA and NLDA were used to extract features afterwards. The experimental results show that the proposed method performs better than the conventional cartesian images.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
LDA 는 특징 벡터의 차원을 감소시키는 기법 중의 하나로서, 클래스간 분산과 클래스내 분산의 비율을 최대화하는 방법을 이용하여 데이터에 대한 특징 벡터의 차원을 축소한다. LDA의 변형인 NLDA (null space based LDA)는 클래스내 분산의 영공긴-(null space)에서 클래스 간 분산을 최대화 하는 것이 목적이다. 이는 클래스 간 분산의 사영된 결과가 0이 아닌 흔!; 클래스내 분산의 영공간에 서로 다른 클래스들을 분류 할 수 있는 중요한 정보가 많이 들어있다는 점에서 나온 개념이다.
이에 반해 극 좌표계 변환 방법은 홍채 영상에서의 특징 검출团이나 물체 인식미을 위해 사용되었다. 본 논문에서는 극좌표계 변환 방법을 이용하여 얼굴 인식률을 향상 시키는 방법을 제시하고자 한다. 극좌표계 변환 방법은 얼굴을 분류하기 위한 중요한 특징들의 대부분은 얼굴의 중심부 근처에 위치한다는 사실에 기반한다.
제안 방법
그림 1(b)는 얼굴의 중심부분의 고정된 한 점인 극을 중심으로 반지름을 40픽셀로 하여 각 방향으로 픽셀 값을 읽는 것을 나타낸 것이다. 이때 원의 중심점인 극의 위치를 정하는 것이 중요한데 본 논문에서는 그림 1(a) 와 같은 동일한 크기의 원 영상에서 코끝의 위치를 지정한 후 이 점을 극으로 삼았으며, 코끝의 위치를 직접 지정해 준 후, 각 영상에 대해 일률적으로 이 점을 중심으로 극좌표 변환을 수행하였다.
PCA를 수행하여 차원을 감소시킨 결과를 이용하여 , 와 岛을 계산한다. 열벡터 /로 이루어진 얼굴의 표본 집합에 대해 식 (2)와 식 (3)을 통해 &와 岛을 계산한다.
각 영상의 크기는 80姬 픽셀의 크기로 구성되었다. 극좌표 변환을 한 영상과 원영상 각각에 대해 위의 개수만큼의 데이터를 사용하였으며, 극좌표 변환을 할 때는 코끝의 위치를 중심으로 반지름을 변화시키면서 실험을 하였다.
또한 고차원의 영상 벡터가 입력으로 들어오게 되면 방대한 계산으로 인해 어려움을 초래한다. 따라서 PCA를 통해 차원을 감소시키고 얼굴인식을 수행한다본 실험에서는 PCA를 이용하여 100차원으로 차원을 감소시킨 후 얼굴 인식을 수행한다.
이 논문의 각 장의 내용은 다음과 같다. 먼저 II 장에서는 얼굴 인식에서 차원 감소 방법 중에서 본 논문의 실험에서 사용하는 LDA와 NLDA 방법을 간단히 살펴보고, HI장에서는 극좌표계 변환 방법과 인식률 향상의 이론적 검토에 대해 살펴본다. 제IV장에서는 실험 결과를 분석하며, 제V장에서는 결론을 제시한다.
본 논문에서 사용하는 극 좌표계 변환은 얼굴의 중심부를 기준점으로 일정한 반지름을 갖는 원을 그리면서, 각 360도 방향으로 각각 원의 중심에서부터 반지름의 끝 부분까지 샘플링을 하여 얼굴 데이터를 재구성한다. 본 논문의 실험에서는 談도의 방향 중 같은 간격으로 총 90개의 방향을 사용하여 실험을 수행하였다.
재구성한다. 본 논문의 실험에서는 談도의 방향 중 같은 간격으로 총 90개의 방향을 사용하여 실험을 수행하였다. 만약 극좌표계와 평행좌표계(원영상)에서 사용하는 화소 수가 같다면, 극좌표계를 이용할 때 얼굴을 분류하는데 중요한 역할을 하는 눈, 코, 입 등 얼굴의 중앙 부분 이원 영상을 그대로 사용할 때 보다 더 자세히 표현되므로 얼굴인식의 인식률의 향상을 도모할 수 있다.
이러한 극좌표계 변환 방법을 통해 얼굴을 분류하는데 중요한 특징들을 원 영상을 그대로 사용할 때 보다 더 많이 고려하게 되어 인식률의 향상을 도모할 수 있다. 이 방법은 특징 추출 전 입력 영상을 변환하는 방법으로서 모든 특징 추출 방법에 적용이 가능하며, 본 논문에서는 LDA와 NLDA를 대상으로 실험을 수행한다.
입력된 테스트 데이터에 대하여 정규화를 수행한다. 식 (15)에서 Trtean(j)는 (나)단계에서 구한 학습에 이용된 행렬 7?의 j번째 픽셀값의 평균, std(j)는 행렬 幼■의 j 번째 픽셀의 표준편차를 나타내고 財와 Testn°E点은 각각 정규화되기 전후의 테스트 데이터 행렬을 나타낸다.
최적화된 변환행렬인 Wlda 및 0;吳와 PCA를 이용하여 차원을 감소시킨 결과와 곱을 하여 사영을 하고, 클래스 분리를 최대화 하는 벡터의 방향을 찾아 그 방향으로 사영을 시켜 차원을 감소시킨다. 같은 클래스 내의 데이터들은 서로 가깝게 모여 있고, 동시에 다른 클래스의 평균간의 거리는 최대화하는 방향을 찾게 된다.
대상 데이터
각각의 영상의 크기는 100x80 픽셀의 크기로 구성되어 있다. FRGC데이터의 경우 총 40명의 영상에 학습 데이터와 테스트 데이터로 400장을 사용하였다. 각 영상의 크기는 80姬 픽셀의 크기로 구성되었다.
각각의 영상의 크기는 100x80 픽셀의 크기로 구성되어 있다. FRGC데이터의 경우 총 40명의 영상에 학습 데이터와 테스트 데이터로 400장을 사용하였다. 각 영상의 크기는 80姬 픽셀의 크기로 구성되었다.
있다. Yale데이터는 총 165장의 얼굴 영상으로 구성되어 있으며, 15명의 사람에 대해 각각 H장씩 구성되어 있다. 각각의 영상의 크기는 100x80 픽셀의 크기로 구성되어 있다.
Yale데이터는 총 165장의 얼굴 영상으로 구성되어있으며, 15명의 사람에 대해 각각 11장씩 구성되어 있다. 각각의 영상의 크기는 100x80 픽셀의 크기로 구성되어 있다.
데이터처리
— norm을 이용하여 계산을 수행한다. 각 인식률은 총 15명의 사람의 10장씩의 영상을 학습 영상으로 사용하고, 나머지 1장의 영상을 테스트 영상으로 사용하여 인식률을 확인하고 총 11번의 실험을 통해 얻은 인식률 값을 평균을 하여 나타낸 것으로, 교차검증 방법을 통해 나온 결과이다.
이론/모형
K=1 로 된다면 자신과 가장 가까이 위치하는 이웃의 클래스 값으로 자신의 클래스가 결정되게 된다. 실험 과정에서는 館 — noTTn을 이용하여 계산을 수행한다.
그림 1(b)는 360도의 방향 중 90개의 방향만을 동일한 간격으로 나타난 그림 이다. 얼굴 중심의 극으로부터 외각 부분으로 픽셀 값을 샘플링 할 경우 얼굴의 중심 근처에서는 두 점이 겹쳐 나타나는 현상이 나타나는데, 이 경우에는 보간법 (interpolation) 방법 중 쌍이차(bicubic) 보간법을 사용하여 픽셀 값을 구하였다.
표 4는 FRGC 데이터에 극 좌표계 변환을 적용한 후 LDA와 NLDA의 인식률을 나타낸 것이다. 이때 분류는 1-최근접 이웃 알고리즘을 이용하였고, & — norm, 을 이용하여 계산을 수행한다. 표 4와 표 5의 각 인식률은 총 40명의 사람의 10장씩의 영상을 학습 영상으로 사용하고, 10장씩의 영상을 테스트 영상으로 사용하여, 학습영상으로 400장, 테스트 영상으로 400장을 사용하여 인식률을 얻어낸 결과이다.
성능/효과
73% 이상으로 상승하는 것을 볼 수 있다. NLDA의 경우 히스토그램 평활화를 한 영상의 경우 표 3에서 볼 수 있듯이 원영상보다 극 좌표계 변환한 영상의 인식률이 93.33%이며, 반지름이 30일 경우를 제외하고, 반지름을 35이상으로 했을 경우 인식률이 더 상승하는 것을 볼 수 있다.
이 때, 서로 다른 각각의 얼굴을 분류해 낼 수 있는 정보를 유지한 채 입력 변수의 차원을 줄이는 것이 필요하다. 입력 차원을 줄이면, 특징 벡터를 간결하게 다루는 효과를 얻으며, 입력 차원이 커질 때 발생하는 차원의 저주(the curse of dimensionality) 같은 문제를 해결하는 효과를 얻을 수 있다. 얼굴 인식 분야에서 많이 사용되는 차원 감소(dimensionality reduction) 방법에는 아공간(subspace) 방법들이 많이 사용되며 이들 중 대표적인 것으로 LDA (Linear Discriminant Analysis )[1], PCA (Principal Component Analysis )[21, 그리 고 ICA (Independent Component Analysis )[3] 등의 방법이 있다.
특징을 추출한 후 1-최근접 이웃(1-nearest neighbor) 알고리즘으로 분류를 수행하였으며, 11겹 교차 검증(11-fold cross validation)에 대한 인식률을 비교해 보면 표 1에서 볼 수 있듯이 후자의 경우가 인 식률이 더 높은 것을 알 수 있다. 즉 얼굴의 코 주변의 중심 부분에 위치한 특징들이 얼굴 외곽에 위치한 머리카락 등의 정보보다 더 중요한 특징이라는 것을 확인할 수 있다. 즉 극좌표 변환 방법은 얼굴 중심 부분의 사람을 분류하는데 중요한 특징에 대해 가중치를 더 줌으로써, 얼굴 분류에 오히려 방해요소로 작용할 수 있는 모자를 쓰거나, 머리 스타일의 변화 등의 인식률 저하의 요인을 줄일 수 있게 된다.
이러한 사실은 원 얼굴 영상에서 머리카락 같은 얼굴의 외곽부분은 제외하고, 눈, 코, 입과 같은 얼굴 부분만을 포함하게 얼굴 영상을 잘라내어 이렇게 잘려진 얼굴 영상의 인식률과 원 얼굴 영상의 인식률을 비교해보면 확인할 수 있다. 즉 원 영상에 대해 LDA, NLDA 등의 특징 추출 방법을 적용해 얻은 얼굴 인식률과 머리카락 같은 얼굴의 외곽 부분을 제거하고 눈, 코, 입 주변 부위만 잘라낸 영상에 동일한 특징 추출 방법을 적용해 얻은 인식률을 비교해 볼 때 일반적으로 후자의 경우가 인식률이 더 높은 것을 확인할 수 있다.
이는 원 얼굴 영상과 머리카락 같은 얼굴의 외곽부분은 제외하고, 눈, 코, 입과 같은 얼굴 부분만을 포함하게 잘라내어 이를 원 얼굴 영상과의 인식률을 비교해 본 결과를 통해서 이러한 점을 인식할 수 있다. 즉 원영상에 대해 LDA, NLDA를 이용해 얻은 얼굴 인식률과 머리카락 같은 얼굴의 외곽 부분을 제거하고 눈, 코, 입 주변 부위만 잘라내어 인식률을 비교해보면 후자의 경우가 인식률이 더 높은 것을 알 수 있다. 극 좌표계 변환은 얼굴의 중심부분의 한점을 극으로 삼아 일정길이 만큼 얼굴 영상을 샘플링하여 새로운 얼굴 영상을 제작하고 이를 바탕으로 기존의 특징 추출 방법을 이용하여 얼굴인식의 성능 향상을 도모할 수 있다.
그림 3 에 나타낸 Yale 데이터에 대해 LDA, NLDA를 사용하여 인식률을 나타내었으며, 각각 14개의 특징을 사용하였다. 특징을 추출한 후 1-최근접 이웃(1-nearest neighbor) 알고리즘으로 분류를 수행하였으며, 11겹 교차 검증(11-fold cross validation)에 대한 인식률을 비교해 보면 표 1에서 볼 수 있듯이 후자의 경우가 인 식률이 더 높은 것을 알 수 있다. 즉 얼굴의 코 주변의 중심 부분에 위치한 특징들이 얼굴 외곽에 위치한 머리카락 등의 정보보다 더 중요한 특징이라는 것을 확인할 수 있다.
표 2에서 볼 수 있듯이 LDA의 경우 히스토그램 평활화를 하지 않은 영상의 경우 원영상의 경우 인식률이 78.78%임에 비해, 반지름을 변화시키며 측정한 극 좌표계 변환한 영상의 인식률은 84.24% 이상으로 상승하는 것을 볼 수 있다. NLDA의 경우 히스토그램 평활화를 하지 않은 영상의 경우 표 2에서 볼 수 있듯이 원 영상에 대한 인식률은 87.
표 3에서 볼 수 있듯이 LDA의 경우 히스토그램 평활화를 한 영상의 경우 원영상의 경우 인식률이 92.12%임에 비해, 반지름을 변화시키며 측정한 극 좌표계 변환한 영상의 인식률은 반지름이 30일 경우를 제외하고, 92.73% 이상으로 상승하는 것을 볼 수 있다. NLDA의 경우 히스토그램 평활화를 한 영상의 경우 표 3에서 볼 수 있듯이 원영상보다 극 좌표계 변환한 영상의 인식률이 93.
표 4에서 볼 수 있듯이 LDA의 경우 히스토그램 평활화를 하지 않은 원영상을 사용하는 경우 인식률이 90.71%임에 비해, 반지름을 30픽셀 이상으로 했을 경우 91.48% 이상의 인식률을 보인다. NLDA의 경우 히스토그램 평활화를 하지 않은 영상의 경우 표 4에서 볼 수 있듯이 원영상의 경우 인식률이 94.
표 5에서 볼 수 있듯이 LDA의 경우 히스토그램 평활화를 한 영상의 경우 원영상의 경우 인식률이 94.17% 임에 비해, 반지름을 변화시키며 측정한 극 좌표계 변환한 영상의 인식률은 반지름이 30픽셀 이상일 경우, 94.95% 이상으로 상승하는 것을 볼 수 있다. NLDA의 경우 히스토그램 평활화를 한 영상의 경우 표 5에서 볼 수 있듯이 LDA의 실험 수행 결과보다도 더 인식률이 높은 것을 볼 수 있다.
후속연구
앞으로 조명에 덜 민감하며, 얼굴이 돌아가 있는 경우에도 인식률을 높일 수 있는 방법에 대한 연구가 필요할 것이다. 또한, 코끝의 위치를 자동으로 찾을 수 있는 방법에 대한 연구도 이루어져야 할 것이다.
극 좌표계 변환은 얼굴의 중심부분의 한점을 극으로 삼아 일정길이 만큼 얼굴 영상을 샘플링하여 새로운 얼굴 영상을 제작하고 이를 바탕으로 기존의 특징 추출 방법을 이용하여 얼굴인식의 성능 향상을 도모할 수 있다. 앞으로 조명에 덜 민감하며, 얼굴이 돌아가 있는 경우에도 인식률을 높일 수 있는 방법에 대한 연구가 필요할 것이다. 또한, 코끝의 위치를 자동으로 찾을 수 있는 방법에 대한 연구도 이루어져야 할 것이다.
참고문헌 (12)
Martinez and A. Kak, "PCA versus LDA," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 23, no. 2, pp. 228-233, 2001.
P. Belhumeur, J. Hespanha, and D. Kriegman, "Eigenfaces vs. Fisherfaces: recognition using class specific linear projection," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 19, no. 7, pp. 711-720, March 1997.
M. S. Bartlett, J. R. Movellan and T. J. Sejnowski, "Face recognition by independent component analysis," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 22, no. 6, March 2000.
S. Matschitsch, H. Stogner, M. Tschinder and A. Uhl, "Rotation-invariant iris recognition: Boosting 1D Spatial-Domain Signatures," ICINCO 2008: Proceedings of the 5th International Conference on Informatics in Control, Automation and Robotics, vol. SPSMC, pp. 232-235, 2008.
H. Zhang, D. Wang and K. Song, "Object recognition using polar-exponential grid technique," Image and Signal Processing and Analysis, 2003. ISPA 2003. Proceedings of the 3rd International Symposium, vol. 2, pp. 816-819, Sept 2003.
J. Yang, Y. Yu, and W. Kunz, "An efficient LDA algorithm for face recognition," Proceedings of the Sixth International Conference on Control, Automation, Robotics and Vision, vol. 33, no. 10, 2000.
한학용, 패턴인식개론, 한빛미디어, 2005.
Jieping Ye and Tao Xiong, "Null space versus orthogonal linear discriminant analysis," Preceedings of the 23rd international conference on Machine learning, pp.1073-1080, June 2006.
Z. Xiaoxun and J. Yunde, "Symmetrical null space LDA for face and ear recognition," Neurocomputing, vol. 70, pp. 842-848, January 2007.
Ganhua Li, Xuanping Cai and Xianshuai Li, "An Efficient Face Normalization Algorithm Based on Eyes Detection," Proceedings of the 2006 IEEE/RSJ, pp. 3843-3848, Oct 2006.
홍은혜, 고병철, 변혜란, "PCA와 LDA를 이용한 실시간 얼굴 검출 및 검증기법," 정보과학회논문지 : 소프트웨어 및 응용, 제31권 (2), pp. 213-223, Feb 2004.
M. Turk and A. Pentland, "Face recognition using eigenfaces," Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 586-591, 1991.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.