최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기韓國ITS學會 論文誌 = The journal of the Korea Institute of Intelligent Transportation Systems, v.9 no.3, 2010년, pp.67 - 72
This paper presents biometrical driver verification system in car experiment through analysis of speech, and face information. We have used Mel-scale Frequency Cesptral Coefficients (MFCCs) for speaker verification using speech information. For face verification, face region is detected by AdaBoost ...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
본 논문에서 사용한 얼굴인식 알고리즘의 AdaBoost 학습단계에서는 무엇을 하는가? | 본 논문에서 사용한 얼굴인식 알고리즘은 <그림 2>에 나타난 바와 같이 크게 학습단계, 얼굴영역 검출단계와 얼굴검출단계로 나뉜다. AdaBoost 학습단계에서는 얼굴과 비얼굴 패턴으로 구성된 훈련영상 집합에서 전처리 단계로 명암대비 스트레칭 기법과 이미지 내의 명암 분포를 보정하는 히스토그램 평활화 기법을 통해 명암 대비도를 키움으로서 얼굴과 배경의 경계를 더욱 부각시킨다. 동영상 내의 얼굴의 움직임이 발생한 경우에 이전 프레임과 현재 프레임의 차이를 이용하는 모션 추적 과정 등의 전처리 단계를 수행한 후에, 얼굴영역을 검출하기 위해 간단하면서도 연산이 빠른 Haar-like 특징[3]을 추출한다. | |
검출된 얼굴영역으로부터 PCA를 통해 추출된 특징들은 얼굴 검증을 위해 무엇을 사용하여 학습과 검증을 수행하는가? | 검출된 얼굴영역으로부터 PCA를 통해 추출된 특징들은 얼굴검증을 위해 GMM supervector[4]를 SVM Kerenl에 적용한 GMM supervector kernel을 사용하여 학습과 검증을 수행한다. 상세한 학습 및 검증과정은 GMM supervector kernel를 이용한 SVM에서 설명된다. | |
검출된 음성프레임은 어떠한 처리 절차를 거치면서 주파수 영역으로 변환되는가? | 검출된 음성프레임은 특징 추출 알고리즘인 MFCC 방식을 통해 음성의 특징 정보를 추출한다. 이 절차는 pre-emphasis 처리, 해밍 윈도우 처리, fast Fourier transform을 각각 수행하여 주파 수영역으로 변환한다. 변환된 값들은 MFCC 대역 필터뱅크를 통과시키고, 로그화, discrete cosine transform을 거치면 프레임당 13개의 계수값을 획득하는데, 이 값들이 음성의 특징 정보들이며 식 (1)과 같이 표현된다. |
W. Zhao, R. Chellappa, PJ Phillips, and A. Rosenfeld, "Face recognition: a literature survey," ACM Computing Suerveys(CSUR), vol.35, no.4, pp.399-458, Dec. 2003.
W. M. Campbell, J. P. Campbell, D. A. Raynolds, E. Singer, and P. A. Torres-Carrasquillo, "Support vector machines for speaker and language recognition," Computer Speech & Language, vol.20, no.2-3, pp. 210-229, Apr. 2006.
P. Viola, and M. Jones, "Rapid object detection using a boosted cascade of simple features," Proc. Computer Vision and Pattern Recognition, vol.1, pp. 511-518, Dec. 2001.
W. M. Campbell, J. P. Campbell, D. A. Raynolds, E. Singer, and P. A. Torres-Carrasquillo, "Support vector machines for speaker and language recognition," IEEE Signal Processing Letters, vol.13, no.5, pp. 308-311, 2006.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.