$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석
Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition 원문보기

한국음향학회지= The journal of the acoustical society of Korea, v.21 no.3, 2002년, pp.330 - 338  

박영희 (서강대학교 컴퓨터학과 음성언어처리연구실) ,  정민화 (서강대학교 컴퓨터학과 음성언어처리연구실)

초록
AI-Helper 아이콘AI-Helper

대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

Abstract AI-Helper 아이콘AI-Helper

Spontaneous speech is ungrammatical as well as serious phonological variations, which make recognition extremely difficult, compared with read speech. In this paper, for conversational speech recognition, we analyze the transcriptions of the real conversational speech, and then classify the characte...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 대화체 연속음성의 특성을 분석하고 낭독체 인식 기술을 기반으로 대화특성을 반영하여 대화체 연속음성 인식을 위한 기본 인식 실험을 수행하였다.
  • 본 논문에서는 어절과 어절 사이에서 나타나는 잡음만을 대상으로 HMM 모델링하였다[2]. 각 잡음들의 특성에 따른 세분화된 HMM 모델링이 필요하지만, 본 논문에서는 한 개의 HMM 모델을 사용하였다.
  • 본 논문에서는 자연스러운 발화시 나타나는 대화 현상을 음성인식 측면에서 분류하고, 기본적인 낭독체 인식기술을 적용할 때의 문제점 및 개선 사항들에 대해 논의하고자 한다.
  • 이런 경우 형태소 분석에 상관없이 "예약하셨”을 무시할 것인지, 아니면 형태소 정보를 사용할 것 인지는 더 많은 연구를 필요로 한다. 본 논문에서는 조각난 단어도 형태소 분석을 수행하는 것을 원칙으로 하였다.
  • TP#1은 총 25개의 시나리오로 구성되어 있고, 25조가 한조당4개의 대화를 발화하여 총 100개의 대화로구성된다. 자연스러운 발화를 위해 여행사 직원에게만 자세한 정보를 주고 고객은 문의하면서 예약/변경/취소 등의 목적을 달성하도록 하였다. 즉 완성된 형태의 문장이 주어지지 않으므로 발화중간에 머뭇거림이나 반복, 수정, 재질문 등이 빈번히 일어나므로 실제 대화와 매우 유사하다.
본문요약 정보가 도움이 되었나요?

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로