본 논문에서는 카오스가 음성신호에 포함되어 있는 비선형적인 개인성 정보를 분석할 수 있고, 변별력이 우수한 점을 착안하여 화자인식을 위한 퍼지상관차원과 퍼지 Lyapunov차원을 제안하였다. 또한 음성신호의 스트레인지 어트렉터를 정확하게 구성하기 위해서 음성에 대한 주파수분석으로 ...
본 논문에서는 카오스가 음성신호에 포함되어 있는 비선형적인 개인성 정보를 분석할 수 있고, 변별력이 우수한 점을 착안하여 화자인식을 위한 퍼지상관차원과 퍼지 Lyapunov차원을 제안하였다. 또한 음성신호의 스트레인지 어트렉터를 정확하게 구성하기 위해서 음성에 대한 주파수분석으로 지연시간을 결정하는 방법을 제안하였다. 퍼지상관차원은 어트렉터 구성점들의 상관관계에서 상관적분추정시 퍼지유사도를 적용하여 추정되는 파라미터이며, 퍼지 Lyapunov 차원은 표준패턴과 시험패턴에 대한 어트렉터의 변동을 흡수하기 위해서 시간변화에 따른 어트렉터 점들의 벡터추정시 퍼지유사도를 적용하여 추정된 파라미터로서 이 카오스차원은 표준패턴 어트렉터와 시험패턴 어트렉터의 변동을 흡수함으로써 화자인식을 향상시키는 파라미터임을 확인하였다. 제안한 카오스차원을 평가하기 위하여 화자인식 평가방법을 제안하였고, 화자와 표준패턴별로 식별오차에 따른 오인식을 추정함으로써 화자인식 파라미터의 타당성을 검토하였다. 제안한 각 차원을 적용하여 화자인식 실험을 수행한 결과 인식율은 상관차원 81.6[%], Lyapunov차원 92.3[%], 퍼지상관차원 94.6[%], 퍼지 Lyapunov차원 97.0[%]의 인식율을 나타내므로써 퍼지 Lyapuov차원이 가장 우수하였으며, 제안된 카오스차원은 화자인식 파 라미터로서 적합함을 확인하였다.
본 논문에서는 카오스가 음성신호에 포함되어 있는 비선형적인 개인성 정보를 분석할 수 있고, 변별력이 우수한 점을 착안하여 화자인식을 위한 퍼지상관차원과 퍼지 Lyapunov차원을 제안하였다. 또한 음성신호의 스트레인지 어트렉터를 정확하게 구성하기 위해서 음성에 대한 주파수분석으로 지연시간을 결정하는 방법을 제안하였다. 퍼지상관차원은 어트렉터 구성점들의 상관관계에서 상관적분추정시 퍼지유사도를 적용하여 추정되는 파라미터이며, 퍼지 Lyapunov 차원은 표준패턴과 시험패턴에 대한 어트렉터의 변동을 흡수하기 위해서 시간변화에 따른 어트렉터 점들의 벡터추정시 퍼지유사도를 적용하여 추정된 파라미터로서 이 카오스차원은 표준패턴 어트렉터와 시험패턴 어트렉터의 변동을 흡수함으로써 화자인식을 향상시키는 파라미터임을 확인하였다. 제안한 카오스차원을 평가하기 위하여 화자인식 평가방법을 제안하였고, 화자와 표준패턴별로 식별오차에 따른 오인식을 추정함으로써 화자인식 파라미터의 타당성을 검토하였다. 제안한 각 차원을 적용하여 화자인식 실험을 수행한 결과 인식율은 상관차원 81.6[%], Lyapunov차원 92.3[%], 퍼지상관차원 94.6[%], 퍼지 Lyapunov차원 97.0[%]의 인식율을 나타내므로써 퍼지 Lyapuov차원이 가장 우수하였으며, 제안된 카오스차원은 화자인식 파 라미터로서 적합함을 확인하였다.
In this dissertation, we propose two kinds of chaos dimensions, the fuzzy correlation and fuzzy Lyapunov dimensions, for speaker recognition. The proposal is based on the point that chaos enables us to analyze the non-linear information contained in individual's speech signal and to obtain superior ...
In this dissertation, we propose two kinds of chaos dimensions, the fuzzy correlation and fuzzy Lyapunov dimensions, for speaker recognition. The proposal is based on the point that chaos enables us to analyze the non-linear information contained in individual's speech signal and to obtain superior discrimination capability. In order to draw precisely the strange attractor of the speech signal, we device an optimum method to decide the delay time to draw its strange attractor. The fuzzy correlation dimension is a parameter to estimate correlation integral, by applying fuzzy membership function between the points forming the attractors. Whereas, the fuzzy Lyapunov dimension is a parameter to apply fuzzy membership function in estimating the vector between the attractor points as a functions of time. We confirms that the proposed chaos dimensions play an important role in enhancing speaker recognition ratio, by absorbing the variations of the reference and test pattern attractors. In order to evaluate the proposed chaos dimensions, we suggest speaker recognition using the proposed dimensions. In other words, we investigate the validity of the speaker recognition parameters, by estimating the recognition error according to the discrimination error of an individual speaker from the reference pattern. Our speaker recognition experiments by the proposed dimensions show the recognition ratios as follows; 81.6[%] by the correlation dimension, 92.3[%] by the Lyapunov dimension, 94.6[%] by the fuzzy correlation dimension, and 97.0[%] by the fuzzy Lyapunov dimension, respectively. This confirms that the method by the fuzzy Lyapunov dimension is best, and that all of the proposed chaos dimensions are good enough to be used for speaker recognition.
In this dissertation, we propose two kinds of chaos dimensions, the fuzzy correlation and fuzzy Lyapunov dimensions, for speaker recognition. The proposal is based on the point that chaos enables us to analyze the non-linear information contained in individual's speech signal and to obtain superior discrimination capability. In order to draw precisely the strange attractor of the speech signal, we device an optimum method to decide the delay time to draw its strange attractor. The fuzzy correlation dimension is a parameter to estimate correlation integral, by applying fuzzy membership function between the points forming the attractors. Whereas, the fuzzy Lyapunov dimension is a parameter to apply fuzzy membership function in estimating the vector between the attractor points as a functions of time. We confirms that the proposed chaos dimensions play an important role in enhancing speaker recognition ratio, by absorbing the variations of the reference and test pattern attractors. In order to evaluate the proposed chaos dimensions, we suggest speaker recognition using the proposed dimensions. In other words, we investigate the validity of the speaker recognition parameters, by estimating the recognition error according to the discrimination error of an individual speaker from the reference pattern. Our speaker recognition experiments by the proposed dimensions show the recognition ratios as follows; 81.6[%] by the correlation dimension, 92.3[%] by the Lyapunov dimension, 94.6[%] by the fuzzy correlation dimension, and 97.0[%] by the fuzzy Lyapunov dimension, respectively. This confirms that the method by the fuzzy Lyapunov dimension is best, and that all of the proposed chaos dimensions are good enough to be used for speaker recognition.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.