본 발명은 로봇에서의 음성인식을 위한 원거리 음성인식용 마이크의 성능을 평가하기 위한 기능을 구현한다. 특히 네트워크 로봇을 포함하는 로봇에서는 음성인식이 정상적으로 이루어져야지만 사용자를 인식하고 주변 상황을 인식할 수 있게 되므로, 그 로봇에서 사용되는 마이크의 선정을 위해서는 객관적인 평가 기준(criteria)이 필요하다. 이에 따라 본 발명에서는 음성 감쇠 정도의 측정, 음성 왜곡 정도의 측정, 음성의 감쇠 및 왜곡 정도의 동시 측정 방법을 제안한다. 이와 같이 로봇에서의 음성인식 기능을 위해 수치화가 가능한 마이크 선정에
본 발명은 로봇에서의 음성인식을 위한 원거리 음성인식용 마이크의 성능을 평가하기 위한 기능을 구현한다. 특히 네트워크 로봇을 포함하는 로봇에서는 음성인식이 정상적으로 이루어져야지만 사용자를 인식하고 주변 상황을 인식할 수 있게 되므로, 그 로봇에서 사용되는 마이크의 선정을 위해서는 객관적인 평가 기준(criteria)이 필요하다. 이에 따라 본 발명에서는 음성 감쇠 정도의 측정, 음성 왜곡 정도의 측정, 음성의 감쇠 및 왜곡 정도의 동시 측정 방법을 제안한다. 이와 같이 로봇에서의 음성인식 기능을 위해 수치화가 가능한 마이크 선정에 관한 규격을 제안함으로써, 원거리에서 사용 시 감도가 좋고 왜곡이 되지 않은 음성이 입력되는 마이크를 선정할 수 있게 된다.
대표청구항▼
로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템에 있어서, 적어도 두 개 이상의 마이크의 성능 평가에 필요한 음성 신호를 저장하는 기준 음성 데이터베이스와,상기 마이크들 중 기준 마이크와 대상 마이크로 상기 기준 음성 데이터베이스로부터의 상기 음성 신호가 입력되면, 성능 평가 기준의 선택에 대응하여 상기 입력되는 음성 신호의 감쇠 및 왜곡 중 적어도 어느 하나를 측정하여 수치화하는 측정치 산출부와,상기 측정치 산출부에 의해 수치화된 측정 결과를 기준값과 비교하는 비교부와, 상기 비교 결과에 따라 상기 대상 마이크의 선
로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템에 있어서, 적어도 두 개 이상의 마이크의 성능 평가에 필요한 음성 신호를 저장하는 기준 음성 데이터베이스와,상기 마이크들 중 기준 마이크와 대상 마이크로 상기 기준 음성 데이터베이스로부터의 상기 음성 신호가 입력되면, 성능 평가 기준의 선택에 대응하여 상기 입력되는 음성 신호의 감쇠 및 왜곡 중 적어도 어느 하나를 측정하여 수치화하는 측정치 산출부와,상기 측정치 산출부에 의해 수치화된 측정 결과를 기준값과 비교하는 비교부와, 상기 비교 결과에 따라 상기 대상 마이크의 선정 여부를 결정하는 마이크 선정부를 포함함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.제 1항에 있어서, 상기 측정치 산출부는,상기 마이크로 입력되는 전체 음성 신호의 평균 신호대잡음비(Averaged SNR) 및 상기 음성 신호의 세그먼트별 신호대잡음비(Segmental SNR) 중 어느 하나를 이용하여 상기 음성 신호의 감쇠를 측정하여 수치화하는 것을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템. 제 1항에 있어서, 상기 측정치 산출부는,상기 기준 마이크 및 상기 대상 마이크 간의 음성 감쇠 비율을 이용하여 상기 음성 신호의 감쇠를 측정하여 수치화하는 것을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템. 제3항에 있어서, 상기 음성 감쇠 비율은 하기 수학식 1c에 의해 구해지는 것임을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템. [수학식 1c]상기 수학식 1c에서 Ts는 음성구간을 나타내며, Tn은 잡음 구간을 나타내고, smic1(t)는 기준 마이크에서의 음성 신호, smic2(t)는 비교 마이크에서의 음성 신호를 나타냄.제 1항에 있어서, 상기 측정치 산출부는, 로그 면적 비율(log area ratio), 로그 우도비 척도(Log-likelihood ratio measure) 및 켑스트랄 거리(Cepstral distance) 중 어느 하나를 이용하여 상기 음성 신호의 왜곡을 측정하여 수치화하는 것을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템. 제 1항에 있어서, 상기 측정치 산출부는, 이타구라-사이토 척도(Itakura-saito distortion measure), 가중 스펙트럼 슬로프 척도(Weighted spectral slope measure) 및 음성의 인지적 성능 평가(Perceptual Evaluation of Speech Quality) 중 어느 하나를 이용하여 상기 음성 신호의 왜곡을 측정하여 수치화하는 것을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템. 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템에 있어서, 적어도 두 개 이상의 마이크의 성능 평가에 필요한 음성 신호를 저장하는 기준 음성 데이터베이스와,상기 마이크들 중 기준 마이크와 대상 마이크로 상기 기준 음성 데이터베이스로부터의 상기 음성 신호가 입력되면, 상기 입력되는 음성 신호의 감쇠를 측정하기 위해 상기 마이크 간의 음성 감쇠 비율을 산출하는 측정치 산출부와,상기 측정치 산출부에 의해 산출된 결과를 기준값과 비교한 결과에 따라 상기 대상 마이크의 선정 여부를 결정하는 마이크 선정부를 포함함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.제 7항에 있어서, 상기 측정치 산출부는,상기 기준 마이크와 대상 마이크 각각의 음성 구간의 에너지와 잡음 구간의 에너지를 산출하고, 상기 기준 마이크에서의 음성 구간의 에너지와 잡음 구간의 에너지 간의 차이를 비교 마이크에서의 음성 구간의 에너지와 잡음 구간의 에너지 간의 차이로 나눈 후, 프리앰프의 이득 차이를 보정하기 위해 상기 비교 마이크에서의 잡음 구간의 에너지를 상기 기준 마이크에서의 잡음 구간의 에너지로 나눈 값을 곱한 후 로그를 취함으로써 상기 마이크 간의 음성 감쇠 비율을 산출함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.제 7항에 있어서, 상기 마이크 선정부는,상기 측정치 산출부에 의해 산출된 결과가 상기 기준값보다 작을 경우 상기 대상 마이크의 선정을 확정함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 시스템.로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법에 있어서, 적어도 두 개 이상의 마이크들 중 기준 마이크와 대상 마이크로 성능 평가에 필요한 음성 신호를 입력하는 과정과,상기 음성 신호가 입력되면, 상기 입력되는 음성 신호의 감쇠를 측정하기 위해 상기 마이크 간의 음성 감쇠 비율을 산출하는 과정과,상기 산출된 마이크 간의 음성 감쇠 비율을 기준값과 비교하는 과정과,상기 비교 결과에 따라 상기 대상 마이크의 선정 여부를 결정하는 과정을 포함함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법.제 10항에 있어서, 상기 마이크 간의 음성 감쇠 비율은 하기 수학식 1c에 의해 구해지는 것임을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법. [수학식 1c]상기 수학식 1c에서 Ts는 음성구간을 나타내며, Tn은 잡음 구간을 나타내고, smic1(t)는 기준 마이크에서의 음성 신호, smic2(t)는 비교 마이크에서의 음성 신호를 나타냄.제 10항에 있어서, 상기 대상 마이크의 선정 여부를 결정하는 과정은, 상기 산출된 마이크 간의 음성 감쇠 비율이 상기 기준값보다 작을 경우 상기 대상 마이크의 선정을 확정하는 과정임을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법.로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법에 있어서, 적어도 두 개 이상의 마이크들 중 기준 마이크와 대상 마이크로 성능 평가에 필요한 음성 신호를 입력하는 과정과,상기 음성 신호가 입력되면, 성능 평가 기준의 선택에 대응하여 상기 입력되는 음성 신호의 감쇠 및 왜곡 중 적어도 어느 하나를 측정하여 수치화하는 과정과,상기 수치화된 측정 결과를 기준값과 비교하는 과정과, 상기 비교 결과에 따라 상기 대상 마이크의 선정 여부를 결정하는 과정을 포함함을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법.제 13항에 있어서, 상기 수치화하는 과정은,상기 기준 마이크 및 상기 대상 마이크 간의 음성 감쇠 비율을 이용하여 상기 음성 신호의 감쇠를 측정하여 수치화하는 과정임을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법.제 14항에 있어서, 상기 음성 감쇠 비율은 하기 수학식 1c에 의해 구해지는 것임을 특징으로 하는 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가 방법. [수학식 1c]상기 수학식 1c에서 Ts는 음성구간을 나타내며, Tn은 잡음 구간을 나타내고, smic1(t)는 기준 마이크에서의 음성 신호, smic2(t)는 비교 마이크에서의 음성 신호를 나타냄.
연구과제 타임라인
LOADING...
LOADING...
LOADING...
LOADING...
LOADING...
이 특허를 인용한 특허 (1)
[한국]
이동 단말의 음성에서 노이즈 감소를 위한 방법 및 장치 |
리우 홍타오,
장 시아오펭
※ AI-Helper는 부적절한 답변을 할 수 있습니다.