$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

SVM을 이용한 음성채팅시스템의 성능 향상 방법
Performance Improvement Methods of a Spoken Chatting System Using SVM 원문보기

정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.4 no.6, 2015년, pp.261 - 268  

안혁주 (강원대학교 컴퓨터정보통신공학 전공) ,  이성희 (강원대학교 컴퓨터정보통신공학 전공) ,  송영길 (강원대학교 컴퓨터정보통신공학 전공) ,  김학수 (강원대학교 컴퓨터정보통신공학 전공)

초록
AI-Helper 아이콘AI-Helper

음성채팅시스템에서 사용자의 음성 질의는 자동음성인식기를 통하여 텍스트 질의로 변환된다. 만약 자동음성인식기의 1순위 결과가 틀린다면 이 오류는 그대로 음성채팅시스템에 전파된다. 자동음성인식기의 1순위 정밀도를 향상시키기 위하여 본 논문에서는 RankSVM을 이용하여 자동음성인식기의 n개 결과를 재순위화하는 후처리 모델을 제안한다. 채팅시스템을 학습하기 위해서는 대용량의 채팅 문장들이 필요하다. 만약 새로운 채팅 문장들이 학습데이터에 자주 추가되지 않는다면 채팅시스템의 응답은 금방 진부해질 것이다. 이러한 문제를 해결하기 위하여 본 논문에서는 SVM을 이용하여 TV와 영화 시나리오로부터 채팅 문장들을 자동으로 선택하는 데이터 수집 모델을 제안한다. 실험에서 제안된 후처리 모델은 후처리를 하지 않은 모델보다 정확률에서 4.4%, 재현율에서 6.4% 더 좋은 결과를 보였다. 그리고 제안된 데이터 수집 모델은 98.95%의 높은 정확률과 57.14%의 재현율을 보였다.

Abstract AI-Helper 아이콘AI-Helper

In spoken chatting systems, users'spoken queries are converted to text queries using automatic speech recognition (ASR) engines. If the top-1 results of the ASR engines are incorrect, these errors are propagated to the spoken chatting systems. To improve the top-1 accuracies of ASR engines, we propo...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 그러나 대부분의 개발자들은 공개되어 쉽게 사용할 수 있는 구글음성인식기를 이용하기 때문에 위 연구들을 쉽게 적용할 수 없다. 그래서 본 논문에서는 RankSVM(Support Vector Machine for Ranking)[12]을 이용한 후보문장 재순위화에 대한 연구를 제안한다. 제안 방법은 음성인식 결과가 단일문장이 아닌 후보문장이 존재할 것이라는 생각에 착안하였고 기존의 SVM(Support Vector Machine)[13]을 응용한 RankSVM 기계학습기법을 이용하여 후보문장을 재순위화한다.
  • 따라서 화자의 말을 인식하여 매칭할 수 있는 다양한 문장들이 채팅시스템 내에 존재해야 한다. 그래서 본 논문에서는 음성채팅기술의 성능 향상을 위해 음성인식 성능을 높이는 방법과 다양한 채팅 표현들을 수집할 수 있는 방법을 제안한다.
  • Kim(2009)이 제안하는 연구는 발화/응답 쌍을 빠르게 생성할 수 있으나 응답에 대한 표현이 다양하지 않다는 단점이 있다. 따라서 본 논문에서는 다양한 채팅표현을 비교적 적은 시간을 들여 가져올 수 있는 대본 말뭉치를 이용한 채팅 말뭉치 구축에 대한 연구를 제안한다. 제안 방법은 질문과 그에 대한 답변이 명백히 존재하고 표현이 다양한 대본 말뭉치를 이용하여 SVM 기계학습기법을 이용하여 발화/응답 쌍이 될 수 있는 문장을 판별하여 음성채팅시스템 말뭉치에 추가한다.
  • 본 논문에서는 채팅시스템의 성능 향상을 위해 입력에 대한 재현율을 높이기 위한 두 가지 방법을 제안한다. 첫 번째는 음성인식 성능 향상을 위한 방법이고, 두 번째는 채팅 말뭉치에 다양한 표현을 수집하기 위한 방법이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
자동음성인식기의 1순위 결과가 틀린다면 어떤 현상이 일어나는가? 음성채팅시스템에서 사용자의 음성 질의는 자동음성인식기를 통하여 텍스트 질의로 변환된다. 만약 자동음성인식기의 1순위 결과가 틀린다면 이 오류는 그대로 음성채팅시스템에 전파된다. 자동음성인식기의 1순위 정밀도를 향상시키기 위하여 본 논문에서는 RankSVM을 이용하여 자동음성인식기의 n개 결과를 재순위화하는 후처리 모델을 제안한다.
본 논문에서 새로운 채팅 문장들이 학습데이터에 자주 추가되지 않는 문제를 어떻게 해결하였는가? 만약 새로운 채팅 문장들이 학습데이터에 자주 추가되지 않는다면 채팅시스템의 응답은 금방 진부해질 것이다. 이러한 문제를 해결하기 위하여 본 논문에서는 SVM을 이용하여 TV와 영화 시나리오로부터 채팅 문장들을 자동으로 선택하는 데이터 수집 모델을 제안한다. 실험에서 제안된 후처리 모델은 후처리를 하지 않은 모델보다 정확률에서 4.
음성채팅시스템에서 사용자의 음성 질의는 무엇으로 변환되는가? 음성채팅시스템에서 사용자의 음성 질의는 자동음성인식기를 통하여 텍스트 질의로 변환된다. 만약 자동음성인식기의 1순위 결과가 틀린다면 이 오류는 그대로 음성채팅시스템에 전파된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. iOS 8-Siri [Internet], http://www.apple.com/kr/ios/siri/ (2014. 11. 26). 

  2. S-Voice [Internet], http://ko.wikipedia.org/wiki/S_보이스 (2014. 11. 26). 

  3. LG OptimusUI [Internet], http://ko.wikipedia.org/wiki/LG_옵티머스_UI (2014. 11. 26). 

  4. Ki-Seung Lee, "Study on the Improvement of Speech Recognizer by Using Time Scale Modification," The Journal of the Acoustical Society of Korea, Vol.23 No.6, pp.462-472, 2004. 

  5. Chang-young Lee, "Comparison of Male/Female Speech Features and Improvement of Recognition Performance by Gender-Specific Speech Recognition," Journal of The Korea Institute of Information and Communication Engineering, Vol.5, No.6, pp.568-574, 2010. 

  6. Jungho Cho, "A Spectral Compensation Method for Noise Robust Speech Recognition," Journal of the Institute of Electronics Engineers of Korea, Vol.49-IE, No.2, pp.9-17, 2012. 

  7. Sook-Nam Choi, Hyun-Yeol Chung, "Noise Robust Speech Recognition Based on Parallel Model Combination Adaptation Using Frequency-Variant," The Journal of the Acoustical Society of Korea, Vol.32, No.3, pp.252-261, 2013. 

  8. Tae-woong Choi, Soon-hyob Kim, "Gamma-tone Feature Extraction Acoustic Modeling for Improving Speech Recotnition Performance," The Korean Institute of Information Technology, Vol.10, No.11, pp.155-160, 2012. 

  9. Md. Afzal Hossan, Sheeraz Memon, and Mark A Gragory, "A Novel Approch for MFCC Feature Extraction," ICSPCS, pp.1-5, 2010. 

  10. DongHee Lim, SeungShik Kang, and DuSeong Chang, "Word Spacing Error Correction for the Postprocessing of Speech Recognition," Korea Computer Congress, Vol.33, No.1, pp.25-27, 2006. 

  11. WonMoon Song, EunJu Kim, and MyungWon Kim, "Post-Processing of Speech Recognition Using User Utterance Sequential Pattern," Korea Computer Congress, pp.709-711, 2005. 

  12. Thorsten Joachims, Support Vector Machine for Ranking, Cornell University, 2009, [Internet] http://www.cs.cornell.edu/people/tj/svm_light/svm_rank.html (2014.11.26). 

  13. Thorsten Joachims, Support Vector Machine(light), Cornell University, 2008, [Internet] http://svmlight.joachims.org/(2014. 11. 26). 

  14. Simsimi [Internet], http://developer.simsimi.com/2002 (2014. 11. 26). 

  15. Jonghwan Kim, Duseong Chang, and Harksoo Kim, "Statistical Generation of Korean Chatting Sentences Using Multiple Feature Information," Korean Journal of Cognitive Science, Vol.20, No.4, pp.421-437, 2009. 

  16. Sejong Corpus [Internet], http://www.sejong.or.kr/ (2014. 11. 26). 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로