$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

음성 분류 인공신경망을 활용한 자폐아 치료용 로봇의 지능화 동작 연구
Motion Study of Treatment Robot for Autistic Children Using Speech Data Classification Based on Artificial Neural Network 원문보기

전기전자학회논문지 = Journal of IKEEE, v.23 no.4, 2019년, pp.1440 - 1447  

이진규 (Dept. of Electrical Engineering, Semyung University) ,  이보희 (Dept. of Electrical Engineering, Semyung University)

초록
AI-Helper 아이콘AI-Helper

현재 아이들의 자폐스펙트럼장애 유병률이 한층 더 높게 보고되고 있으며 다양한 형태의 장애 징후를 보이고 있다. 특히 이들은 사회적 의사소통 영역에서 의사소통장애로 인한 대화에 어려움을 겪고 있으며 이를 훈련을 통해 개선 시킬 필요가 대두된다. 이를 위해 본 연구에서는 사전 연구를 통해 설계된 로봇에 장착된 마이크를 통해 음성 정보를 취득하고 이러한 정보를 이용하여 지능적인 동작을 만드는 방식을 제안한다. 음성 정보를 로봇 동작으로 분류하기 위해 인공신경망을 이용하였으며 여러 신경망 기법중 합성곱 방식을 기본으로 한 순환신경망을 결합하여 정확도를 향상시키려고 하였다. 입력 음성 데이터의 전처리는 MFCC를 이용하여 분석하였으며 여러 데이터 정규화 및 인공신경망 최적화 기법을 활용하여 로봇의 동작을 추정하였다. 아울러 설계된 인공신경망은 기존에 사용한 구조 및 사람이 개입하여 분석하는 방법과의 정확도 비교 실험을 진행하여 분석 결과가 높은 정확도를 나타냈다. 향후 보다 높은 정확도를 가질 수 있는 로봇 동작을 설계하여 실제의 자폐아 치료 및 교육 환경에서 적용할 수 있기 위하여 다양한 형태의 데이터를 수집하고 효율적으로 전처리하는 방식에 대한 연구가 요구된다.

Abstract AI-Helper 아이콘AI-Helper

Currently, the prevalence of autism spectrum disorders in children is reported to be higher and shows various types of disorders. In particular, they are having difficulty in communication due to communication impairment in the area of social communication and need to be improved through training. T...

주제어

표/그림 (15)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 그림 5는 터치 데이터 패턴에 따른 로봇 동작 분류를 나타내며 여러 위치의 터치 데이터를 신경망 구조에서 분류하여 특정 동작을 한다. 이러한 사전연구를 기반으로 본 연구에서는 음성 정보를 이용한 로봇의 지능적 동작 설계를 위해 추가적인 음성데이터 처리 및 인공신경망 설계를 통하여 로봇의지능화 및 자폐아 치료 분야에 활용도를 높인다.
  • 앞에서 설명한 MFCC 특징 추출을 통해 생성된 이미지는 인공신경망에 입력되는데 사전 연구에서 음성 데이터 분류에 사용된 인공신경망 구조는 그림10에서 나타낸 것과 같이 음성의 데이터 특징을 고려하여 시간 순차적 데이터 처리에 적합한 LSTM (Long Short Term Memory)으로 히든 레이어를 구성하고 FC(Fully Connected layer)를 통해 동작을 분류하도록 설계되었다. 하지만 이러한 구조는 낮은 정확도로 로봇 동작이 제한되었으며 이에 본 연구에서는 향상된 정확도로 로봇의 효용 가치를 높여 실제 자폐아 치료에 활용될 수 있도록 인공신경망 구조를 설계한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
RNN의 특징은? 요즘은 이러한 전통적인 합성곱 신경망 구조를 개선하여 정확도를 향상시키는 목적으로 순환신경망(RNN)을 추가한 구조가 이용되고 있다[8]. 이와 같은 구조는 RNN의 순차적인 입력과 역동적인 시간적 행동을 처리하는 특징을 이용하여 이미지 정보에서 시간적인 의존성을 활용하기 위해 RNN을 추가로 사용하는데 이러한 방법은 공간과 시간적 맥락을 결합하여 모델링 하므로 다른 전통적인 방법과 단일RNN보다 CRNN 구조가 가장 높은 성능을 보인다[9,10]. 이러한 구조로 인공신경망을 설계할 때 일반적으로 데이터셋이 제한되는 환경에서 큰 사이즈의 네트워크는 많은 수의 파라미터를 가지며 이러한 네트워크가 더 확대되면 과적합되기 쉬워지는 단점이 존재하여 CNN의 성공을 이끌어내기 위해 필수적인pooling 동작과 여러 스케일의 특징을 동시에 추출할 수 있는 Inception 기법을 이용하여 최적화한다[11].
자폐스펙트럼장애를 가진 아동들에게 현장실험에서 고양이 로봇을 이용한 놀이 및 통합감각치료, 언어치료 등에 로봇을 통해 장난감 또는 동물 보방 치료를 한 이유는? 또한, 미국정신의학회가 발간한 DSM-5에서는자폐스펙트럼장애로 진단되기 위해서는 사회적 의사소통 영역의 3가지 항목과 제한적이고 반복적인 영역에 적어도 2가지 항목이 공통적으로 해당되어야 한다고 규정하고 있고 여러 항목 중 DSM-5의자폐스펙트럼장애 심각도 수준에 따르면 사회적의사소통의 초기 심각도 단계는 의사소통에 참여하지만 다른 사람들과 대화를 주고받는 데에는 실패할 수 있으며 친구들을 만들기 위한 시도는 괴상하고 대개 실패한다[2]. 이와 같이 자폐스펙트럼장애를 가진 아동들은 대부분 모방행동과 의사소통적 행동이 적고 비전형적인 눈 맞춤을 하며 장난감을 이용한 모방행동과 기능적 활용이 적기 때문에 의사소통 영역에서 언어성 의사소통장애를 훈련시킬 필요가 있다. 이에 따라 사전연구를 거쳐 현장실험에서 장난감 또는 동물 모방 치료를 목적으로 고양이 로봇을 이용한 놀이 및 통합감각치료, 언어치료 등에 로봇이 사용되었으며 추가적으로 언어성 의사소통장애 훈련에 중점을 두어 로봇의 향상된 지능적인 동작 설계를 위해 기존의 현장실험에서의 동작과 더불어 인공신경망 기반의 음성 정보를 활용한 지능화 동작을 제안한다.
음성 정보를 이용해 로봇을 동작시키기 위해 어떤 과정이 필요한가? 음성 정보를 이용하여 로봇을 동작시키기 위해서는 음성 데이터가 인공신경망에 입력되도록 적합하게 전처리를 거쳐야 한다. 이를 위해 음성 데이터는 음성 분류에 많이 사용되는 MFCC (Mel-Frequency Cepstral Coefficient)를 이용하여 이미지로 생성하는 전처리 과정을 거친다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. Kyung-Sook Lee, Hyeon-Sook Yoon, Huiseung Jeong, Hui-jeong Yoo, "A Study on Early Screening of Young Children with Autism Spectrum Disorder in Korea and Its Support System," Journal of the Korean Association for Persons with Autism(JKAPA), vol.15, no.2, pp.93-120, 2015. 

  2. Jang-Won Moon, Byeong-Jong Jeong, "Issues and Tasks for Autism Spectrum Disorders in the DSM-5," Journal of Emotional & Behavioral Disorders(JEBD), vol.34, no.3, pp.251-270, 2018. 

  3. Nadia Jmour, Sehla Zayen, Afef Abdelkrim, "Convolutional neural networks for image classification," 2018 International Conference on Advanced Systems and Electric Technologies (IC_ASET), pp.397-402, 2018. DOI: 10.1109/ASET.2018.8379889 

  4. Sharath Adavanne, Pasi Pertila, Tuomas Virtanen, "Sound event detection using spatial features and convolutional recurrent neural network," 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 771-775, 2017. DOI: 10.1109/ICASSP.2017.7952260 

  5. Zahra Shah, Minsu Kim, Gil-Jin Jang, "Image Pattern Classification Using MFCC and HMM," 2018 IEEE International Conference on Consumer Electronics-Asia (ICCE-Asia), pp.1-4, 2018. DOI: 10.1109/ICCE-ASIA.2018.8552112 

  6. Chandrasekhar Paseddula, Suryakanth V. Gangashetty, "DNN based Acoustic Scene Classification using Score Fusion of MFCC and Inverse MFCC," 2018 IEEE 13th International Conference on Industrial and Information Systems (ICIIS), pp.18-21, 2018. DOI: 10.1109/ICIINFS.2018.8721379 

  7. Elvira Sukma Wahyuni, "Arabic speech recognition using MFCC feature extraction and ANN classification," 2017 2nd International conferences on Information Technology, Information Systems and Electrical Engineering (ICITISEE), pp.22-25, 2018. DOI: 10.1109/ICITISEE.2017.8285499 

  8. Chi Zhang, Thang Nguyen, Shagan Sah, Raymond Ptucha, Alexander Loui, Carl Salvaggio, "Batchnormalized recurrent highway networks," 2017 IEEE International Conference on Image Processing (ICIP), pp.640-644, 2018. DOI: 10.1109/ICIP.2017.8296359 

  9. Jose Bermudez Castro, Raul Queiroz Feitosa, Patrick Nigri Happ, "An Hybrid Recurrent Convolutional Neural Network for Crop Type Recognition Based on Multitemporal Sar Image Sequences," IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium, pp.3824-3827, 2018. DOI: 10.1109/IGARSS.2018.8517280 

  10. Lichao Mou, Xiao Xiang Zhu, "A Recurrent Convolutional Neural Network for Land Cover Change Detection in Multispectral Images," IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium, pp.4363-4366, 2018. DOI: 10.1109/IGARSS.2018.8517375 

  11. Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich, "Going deeper with convolutions," 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.1-9, 2015. DOI: 10.1109/CVPR.2015.7298594 

  12. Toshi Sinha, Brijesh Verma, Ali Haidar, "Optimization of convolutional neural network parameters for image classification," 2017 IEEE Symposium Series on Computational Intelligence (SSCI), pp.1-7, 2018. DOI: 10.1109/SSCI.2017.8285338 

  13. Cecilia F. Silva, Clauirton A. Siebra, "An investigation on the use of convolutional neural network for image classification in embedded systems," 2017 IEEE Latin American Conference on Computational Intelligence (LA-CCI), pp.1-6, 2018. DOI: 10.1109/LA-CCI.2017.8285727 

  14. Ekachai Phaisangittisagul, "An Analysis of the Regularization Between L2 and Dropout in Single Hidden Layer Neural Network," 2016 7th International Conference on Intelligent Systems, Modelling and Simulation (ISMS), pp.174-179, 2017. DOI: 10.1109/ISMS.2016.14 

  15. Mirco Ravanelli, Philemon Brakel, Maurizio Omologo, Yoshua Bengio, "Batch-normalized joint training for DNN-based distant speech recognition," 2016 IEEE Spoken Language Technology Workshop (SLT), pp.28-34, 2017. DOI: 10.1109/SLT.2016.7846241 

  16. Cesar Laurent, Gabriel Pereyra, Philemon Brakel, Ying Zhang, Yoshua Bengio, "Batch normalized recurrent neural networks," 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp.2657-2661, 2016. DOI: 10.1109/ICASSP.2016.7472159 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로