최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기국가/구분 | 한국(KR)/등록특허 | |
---|---|---|
국제특허분류(IPC8판) |
|
|
출원번호 | 10-2017-7008484 (2017-03-28) | |
공개번호 | 10-2017-0046751 (2017-05-02) | |
등록번호 | 10-1991733-0000 (2019-06-17) | |
우선권정보 | 미국(US) 62/092,251 (2014-12-15);미국(US) 62/093,057 (2014-12-17);미국(US) 14/735,002 (2015-06-09) | |
국제출원번호 | PCT/US2015/065617 (2015-12-14) | |
국제공개번호 | WO 2016/100231 (2016-06-23) | |
번역문제출일자 | 2017-03-28 | |
DOI | http://doi.org/10.8080/1020177008484 | |
발명자 / 주소 |
|
|
출원인 / 주소 |
|
|
대리인 / 주소 |
|
|
심사청구여부 | 있음 (2017-03-28) | |
심사진행상태 | 등록결정(재심사후) | |
법적상태 | 등록 |
본 명세서에는 단대단 심층 학습을 이용하여 개발된 최신의 음성 인식 시스템의 실시예가 제시된다. 실시예에 있어서, 힘들게 설계된 처리 파이프라인에 의존하는 종래의 음성 시스템에 비해, 모델 구조가 훨씬 간단할 뿐만 아니라, 잡음이 있는 환경에서 사용 시 이러한 종래의 시스템 또한 성능이 떨어지는 경향이 있다. 반대로, 본 시스템의 실시예는, 배경 잡음, 잔향 또는 발언자 변이를 모델링하기 위한 수작업으로 설계된 컴포넌트를 필요로하는 대신, 이러한 영향에 로버스트한 함수를 직접 학습한다. 음소 사전뿐만 아니라, 심지어 “음소”의 개념
발언 집합 중의 각 발언에 대해: 스펙트로그램 프레임 집합을 포함하는 발언을 하나 또는 다수의 스펙트로그램 프레임의 문맥과 함께 전사 모델의 제1층에 입력하되, 상기 전사 모델의 제1층은 상기 스펙트로그램 프레임 집합으로부터의 각 스펙트로그램 프레임을 평가하는 단계; 상기 전사 모델로부터 상기 발언에 대한 예측된 문자 또는 문자 확률을 출력하는 단계; 및 상기 발언에 대한 예측 중의 착오를 측정하도록 손실을 컴퓨팅하는 단계; 실지 검증(ground truth) 문자가 주어진 상기 전사 모델의 예측된 출력의 기울기를 평가하는 단계;
※ AI-Helper는 부적절한 답변을 할 수 있습니다.