최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기
음성 인식은 인간과 컴퓨터가 자연스럽게 상호작용할 수 있도록 하는 인간에게 가장 손쉬운 휴먼 인터페이스 방법이다. 특히 음성을 이용한 인터페이스는 가장 인간 친화적이고 편리하며 자연스러운 방법으로 키보드, 마우스, 리모컨, 얼굴인식, 햅틱 등 여타 인터페이스 기술에서는 불가능한 원거리 명령전달, 유기적인 쌍방향 인터액션, 다양한 의사전달 등을 가능하게 해주기 때문에 휴먼 인터페이스를 위해서 반드시 필요한 기술이다.
일반적으로 연구실의 조용한 환경에서 한 화자의 음성만을 찾아내고 인식하는 음성 인터페이스 기술은 지금까지 상당히 많은 연구가 진행되어 왔다. 그러나 실제 환경에서는 화자는 원거리에 존재할 수 있고, 또한 주변에 높은 수준의 잡음이 혼재할 수 있기 때문에 인간의 음성만을 선택적으로 강화할 수 있어야만 원거리 음성인식의 성능을 높일 수 있다. 따라서 본 논문에서는 주변에 소음이 있는 환경에서 말하는 사람이 있는 방향의 소리만을 강화하여 음성 인식에 사용할 수 있도록 하는 것을 목표로 한다.
원거리 음성을 인식하기 위해 인간의 음성을 강화하는 beamforming 과정은 사용자의 위치를 미리 알고 있어야만 빔을 형성하여 특정한 위치의 신호만을 강화 할 수 있다. 하지만 실제 환경에서 사용자의 위치는 일정한 장소에 고정되어 있지 않고, 상황에 따라 변할 수 있기 때문에 사용자의 위치를 추적하는 sound source localization (...
저자 | 오상준 |
---|---|
학위수여기관 | 高麗大學校 大學院 |
학위구분 | 국내석사 |
학과 | 컴퓨터ㆍ電波通信工學科 컴퓨터學專攻 |
지도교수 | 陸東錫 |
발행연도 | 2012 |
총페이지 | xi, 46장 |
키워드 | 음원 위치 추적 음성 강화 Sound Source Localization Speech Enhancement |
언어 | kor |
원문 URL | http://www.riss.kr/link?id=T12868603&outLink=K |
정보원 | 한국교육학술정보원 |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.