$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

언어장애인의 스마트스피커 접근성 향상을 위한 개인화된 음성 분류 기법
Personalized Speech Classification Scheme for the Smart Speaker Accessibility Improvement of the Speech-Impaired people 원문보기

스마트미디어저널 = Smart media journal, v.11 no.11, 2022년, pp.17 - 24  

이승권 (마인드로직 머신러닝) ,  최우진 (한국공학대학교 컴퓨터공학부) ,  전광일 (한국공학대학교 컴퓨터공학부)

초록
AI-Helper 아이콘AI-Helper

음성인식 기술과 인공지능 기술을 기반으로 한 스마트스피커의 보급으로 비장애인뿐만 아니라 시각장애인이나 지체장애인들도 홈 네트워크 서비스를 연동하여 주택의 전등이나 TV와 같은 가전제품을 음성을 통해 쉽게 제어할 수 있게 되어 삶의 질이 대폭 향상되었다. 하지만 언어장애인의 경우 조음장애나 구음장애 등으로 부정확한 발음을 하게 됨으로서 스마트스피커의 유용한 서비스를 사용하는 것이 불가능하다. 본 논문에서는 스마트스피커에서 제공되는 기능 중 일부 서비스를 대상으로 언어장애인이 이용할 수 있도록 개인화된 음성분류기법을 제안한다. 본 논문에서는 소량의 데이터와 짧은 학습시간으로도 언어장애인이 구사하는 문장의 인식률과 정확도를 높여 스마트스피커가 제공하는 서비스를 실제로 이용할 수 있도록 하는 것이 목표이다. 본 논문에서는 ResNet18 모델을 fine tuning하고 데이터 증강과 one cycle learning rate 최적화 기법을 추가하여 적용하였으며, 실험을 통하여 30개의 스마트스피커 명령어 별로 10회 녹음한 후 3분 이내로 학습할 경우 음성분류 정확도가 95.2% 정도가 됨을 보였다.

Abstract AI-Helper 아이콘AI-Helper

With the spread of smart speakers based on voice recognition technology and deep learning technology, not only non-disabled people, but also the blind or physically handicapped can easily control home appliances such as lights and TVs through voice by linking home network services. This has greatly ...

주제어

참고문헌 (17)

  1. Smart speaker household penetration rate in the?United States from 2014 to 2025* (2020),?https://www.statista.com/statistics/1022847/united?-states-smart-speaker-household-penetration/?(accessed Nov., 11, 2021). 

  2. 장애인차별금지 및 권리구제에 관한 법률시행령,?시행 2016. 2. 3 [대통령령 제 26944호] 

  3. 국가정보화기본법, 시행 2018. 8. 22 [법률 제15369?호, 2018. 2. 21., 일부개정] 

  4. 한국형 웹 콘텐츠 접근성지침 2.1, 미래창조과학부?국립전파연구원) 2015년 3월 

  5. 모바일 애플리케이션 콘텐츠 접근성 지침 2.0 (한국정보통신기술협회) 2015년 12월 

  6. C. Espana-Bonet and J. A. Fonollosa,?"Automatic speech recognition with deep neural?networks for impaired speech," in Third?International Conference on Advances in Speech?and Language Technologies for Iberian?Languages. Springer, pp. 97-107, Nov. 2016. 

  7. Biadsy, F., Weiss, R. J., Moreno, P. J.,?Kanvesky, D., and Jia, Y. Parrotron: An?end-to-end speech-to-speech conversion model?and its applications to hearing-impaired speech?and speech separation. arXiv preprint?arXiv:1904.04169, 2019. 

  8. J. Cattiau, "How ai can improve products for?people with impaired speech," 2019. [Online].?Available :?https://blog.google/outreach-initiatives/accessibility/impaired-speech-recognition/ (accessed Oct. 8,?2021). 

  9. 김종우, 윤기현, 허진혁, 전광일, "합성곱 신경망을?이용한 언어장애인용 음성인식," 한국소프트웨어종?합학술대회(KSC2019)논문집, 제46권, 제2호,?1600-1602쪽, 2019년 12월 

  10. 김남호, 최지영, "로그인 과정에서의 화자인증 메커니즘을 이용한 사용자인증 방안 연구," 한국스마?트미디어저널, 제8권, 제3호, 23-30쪽, 2019년 9월 

  11. 이승권, 최우진, 전광일, "언어장애인의 음성문장?인식을 위한 알고리즘 비교," 한국스마트미디어학회 추계학술대회논문집, 제9권, 제2호, 13-15쪽,?2020년 11월 

  12. Fadhilah Rosdi, Mumtaz Begum Mustafa, Siti?Salwah Salim and Nor Azan Mat Zin,?"Automatic Speech Intelligibility Detection for?Speakers with Speech Impairments: The?Identification of Significant Speech Features,"?Sains Malaysiana, Vol. 48, No. 12, 2019. 

  13. Colin Lea, Zifang Huang, Lauren Tooley, Zeinab?Liaghat, Shri Thelapurath, Leah Findlater, Jeffrey P. Bigham, "Nonverbal Sound Detection?for Disordered Speech," IEEE ICASSP,?Singapore, May, 2022. 

  14. Cai S, Lillianfeld L, Seaver K, Green JR,?Brenner MP, Nelson PQ, Sculley D, "A?Voice-Activated Switch for Persons with Motor?and Speech Impairments: Isolated-Vowel?Spotting Using Neural Networks," InterSpeech,?2021. 

  15. Smith, L.N., Topin, N.: Super-convergence: very?fast training of neural networks using large?learning rates (2018). arXiv:1708.07120 

  16. Leslie N. Smith, "Cyclical Learning Rates for?Training Neural Networks," 2017 IEEE Winter?Conference on Applications of Computer Vision?(WACV), Santa Rosa, USA, Mar. 2017. 

  17. https://github.com/ARBasharat/AudioClassification?(accessed Sep. 8, 2022) 

관련 콘텐츠

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로