[논문]시니어 사용자를 위한 챗봇활용 음성인식 스피커 개발 방법

노건호; 이경용; 문미경

doi:10.7471/ikeee.2018.22.2.330

시니어 사용자를 위한 챗봇활용 음성인식 스피커 개발 방법
An Approach to Develop a Speech Recognition Speaker Using Chatbot for Senior Users 원문보기

전기전자학회논문지 = Journal of IKEEE, v.22 no.2, 2018년, pp.330 - 338

노건호 (Division of Computer Engineering, Dongseo University) , 이경용 (Division of Computer Engineering, Dongseo University) , 문미경 (Division of Computer Engineering, Dongseo University)

초록
AI-Helper

인구 고령화가 진행됨에 따라 혼자 사는 1인 가구의 증가로 인해 외로움, 소외감, 우울증 등 각종 부정적인 문제가 사회 전반에 걸쳐 증가하고 있다. 이로 인해 혼자 자립생활을 하는 노인층을 위해 심리적 불안감 해소, 위험 상태의 인지, 가족 안부 확인 등을 손쉽게 할 수 있는 IT기술의 요구가 더욱 높아지고 있다. 본 논문에서는 시니어 사용자가 집에서 음성으로 간단한 대화식 명령을 줄 수 있고 사용자의 상태를 모니터링 할 수 있는 음성인식 스피커의 개발내용에 대해 기술한다. 이 스피커는 사용자 음성 분석과 챗봇 서비스를 통해 대화 내용을 파악하고 사용자가 원하는 서비스를 연결하여 그 결과를 다시 음성으로 제공해준다. 시니어 사용자가 본 스피커를 사용함으로써 자연스러운 대화기능을 통해 말벗이 되어 심리적 안정을 취할 수 있으며, 상태 모니터링 기능을 통해 위험 상태 인지를 좀 더 용이하게 할 수 있을 것으로 기대한다.

Abstract ▼ AI-Helper

As population aging progresses, there is a growing demand for IT technology that can relieve the psychological anxiety of the elderly living alone, recognize the dangerous situation, and check the family members' affection. In this paper, we describe the development of a speech recognition speaker that enable senior users to give simple interactive commands by voice and monitor the status of the user. The speaker analyzes the user's voice, grasps the conversation contents through the chatbot, connects the desired service to the user, and provides the result again by voice. By using this speaker, senior users can feel relaxed by natural conversation, and can monitor the status of danger more easily.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

본 논문에서는 시니어 사용자가 집에서 음성으로 간단한 대화식 명령을 줄 수 있고 사용자의 상태를 모니터링 할 수 있는 음성인식 스피커의 개발내용에 대해 기술한다. 이 스피커는 사용자 음성 분석과 챗봇 서비스를 통해 대화 내용을 파악하고 사용자가 원하는 서비스를 연결하여 그 결과를 다시 음성으로 제공해준다.
본 논문에서는 시니어 사용자가 집에서 음성으로 대화식 명령을 줌으로써 문자 또는 메일을 보내고, 날씨를 확인할 수 있는 간단한 서비스를 받을 수 있는 음성인식 스피커의 개발내용에 대해 기술하였다. 이 스피커는 사용자 음성 분석과 챗봇 서비스를 통해 대화 내용을 파악하고 사용자가 원하는 서비스를 연결하여 그 결과를 다시 음성으로 제공해준다.
사용자들은 자신에게 꼭 필요하고, 원하는 기능만을 가진 하나의 인공지능 스피커를 필요로 할 것이다. 이러한 문제점을 해결하기 위해 본 논문에서는 확장성이 뛰어난 라즈베리파이를 사용하여 사용자가 필요한 기능을 추가하거나 제거하기가 용이하도록 하여 개개인에게 다양한 맞춤형 서비스를 제공할 수 있도록 한다.

제안 방법

Webhook 테스트 및 구현을 위해 Google Firebase의 Cloud Functions을 활용하여 날씨 API에 날짜인 ‘date’, 지역인 ‘geo-city’ 파라미터를 전송하여 날씨 데이터를 수신한다.
마이크로부터 입력되는 시니어 사용자의 음성을 텍스트로 변환하기 위한 STT(speech To Text) 모듈로 Google의 Cloud Speech API를 사용한다. 구글 서버에 음성 데이터를 보내고 피드백을 받는 형태로써, API 사용 조건을 맞추기 위해 마이크로부터 16,00 Hz 이상의 샘플링 속도로 음성을 인식할 수 있게 설정하였다. 처리된 텍스트를 음성으로 다시 합성하는 경우 네이버의 Clova Speech Synthesis를 사용하여 응답 데이터를 구성하였다.
본 논문에서는 초소형, 초저가 PC이며 뛰어난 확장성과 범용성을 자랑하는 라즈베리파이를 사용하여 음성 인식 및 서버와의 통신 기능을 처리하고 라즈베리파이 확장 보드에서에는 각종 센서들을 관리하도록 구성한다. 확장보드에서 라즈베리파이에 전원을 공급함으로써 확장보드에서 스위치 제어로 모든 전원을 컨트롤할 수 있도록 구성한다.
본 논문에서 개발한 시니어 사용자를 위한 챗봇 활용 음성인식 스피커에 대한 전체 내용을 도식화하면 그림 1과 같다. 본 스피커는 시니어 사용자가 요양원이나 집에서 날씨 정보, 문자 메시지 전송, 이메일 전송 등을 간단한 대화 형태로 사용할 수 있도록 해주며, 사용자의 기본 상태를 모니터링 할 수 있는 기능을 제공한다.
본 스피커에서는 움직임 인식 센서와 온/습도 센서를 이용하여 시니어 사용자에 대한 상태정보를 수집하여 데이터를 서버로 주기적으로 전송한다. 이를 통해 시니어 사용자의 상태와 집의 온습도를 수집함으로써 시니어 사용자의 상태를 실시간으로 모니터링하기 위한 관제 사이트를 구축하였다.
본 연구의 결과물은 시니어 사용자의 건강을 고려해서 편백나무를 이용하여 레이저 커팅기로 한층 씩 커팅 후 접합하는 방식으로 외형 시작품을 제작하였다.
사용자의 의도를 알아차리고, 그 의도에 맞는 결과를 반환하기 위한 챗봇 클라우드 서비스로 Dialogflow를 채택했다. Dialogflow는 자연어 대화를 기반으로 하는 인간과 컴퓨터 사이의 상호작용을 할 수 있는 기술을 제공하는 챗봇 플랫폼이다.
위와 같이 날씨 정보를 받아오는 것은 물론, 구글의 G-Mail과 페이스북의 페이스북 메신저를 연동하여 설정한 가족에게 음성 명령을 통해 메일 및 메시지를 전송할 수 있도록 하였다. 인터넷에서 메일을 보내기 위해 이용되는 우편 전송 프로토콜, 즉 SMTP(Simple Mail Transper Protocol)를 이용하게 된다.
처리된 텍스트를 음성으로 다시 합성하는 경우 네이버의 Clova Speech Synthesis를 사용하여 응답 데이터를 구성하였다. 음성으로 변환될 텍스트를 HTTP 통신으로 음성 합성 서버에 전송하여 파라미터로 지정된 음색과 속도로 음성을 합성한 뒤 그 결과를 반환한다.
본 스피커에서는 움직임 인식 센서와 온/습도 센서를 이용하여 시니어 사용자에 대한 상태정보를 수집하여 데이터를 서버로 주기적으로 전송한다. 이를 통해 시니어 사용자의 상태와 집의 온습도를 수집함으로써 시니어 사용자의 상태를 실시간으로 모니터링하기 위한 관제 사이트를 구축하였다.

대상 데이터

본 스피커는 해운대 구청을 통하여 22명의 시니어 사용자를 확보하여 교육을 시행하였으며 2017년 12월 ~ 1월 이들을 대상으로 시범 운영을 진행하였다. 그림 12는 시범운영을 진행한 시니어 사용자들의 설문조사 결과이다.
인터넷에서 메일을 보내기 위해 이용되는 우편 전송 프로토콜, 즉 SMTP(Simple Mail Transper Protocol)를 이용하게 된다. 본 연구에서는 파이썬에서 제공하는 포털 사이트의 SMPT 서버를 이용할 수 있는 SMPT 라이브러리를 사용하여 구현하였으며, 그 과정은 그림 8과 같다.
구글 서버에 음성 데이터를 보내고 피드백을 받는 형태로써, API 사용 조건을 맞추기 위해 마이크로부터 16,00 Hz 이상의 샘플링 속도로 음성을 인식할 수 있게 설정하였다. 처리된 텍스트를 음성으로 다시 합성하는 경우 네이버의 Clova Speech Synthesis를 사용하여 응답 데이터를 구성하였다. 음성으로 변환될 텍스트를 HTTP 통신으로 음성 합성 서버에 전송하여 파라미터로 지정된 음색과 속도로 음성을 합성한 뒤 그 결과를 반환한다.

이론/모형

마이크로부터 입력되는 시니어 사용자의 음성을 텍스트로 변환하기 위한 STT(speech To Text) 모듈로 Google의 Cloud Speech API를 사용한다. 구글 서버에 음성 데이터를 보내고 피드백을 받는 형태로써, API 사용 조건을 맞추기 위해 마이크로부터 16,00 Hz 이상의 샘플링 속도로 음성을 인식할 수 있게 설정하였다.
본 논문에서는 페이스북 메신저를 파이썬에서 이용할 수 있도록 제작된 fbchat 모듈을 이용한다. fbchat 모듈은 페이스북에서 제공하는 API를 활용하여 파이썬에서 간편하게 페이스북 메시지 기능을 이용할 수 있도록 만들어진 모듈이다.

성능/효과

또한 85%의 시니어 사용자는 본 스피커에 대해 만족스럽다고 답변하였다. 대부분의 시니어 사용자는 스마트폰에서 통화, 메시지(카카오톡 포함) 전송을 주요 기능으로 사용하고 있었으며, 시니어 사용자 모두가 본 스피커의 사용 용이성이 스마트폰보다 우수하다고 답변하였다. 또한 60%의 시니어 사용자는 일일 10회 이상 본 스피커를 사용하였다.

후속연구

또한 60%의 시니어 사용자는 일일 10회 이상 본 스피커를 사용하였다. 따라서 본 스피커를 활용한다면 시니어 사용자의 상태를 사전에 파악할 수 있어 사회적 이슈가 되고 있는 고독사 문제를 해결할 것으로 예상된다.
본 스피커는 기존 인공지능 스피커와 달리 라즈베리파이(Raspberry Pi)를 사용하여 제작하였기 때문에 하드웨어 모듈 확장성이 용이하며, 시니어 사용자에게 특화된 서비스를 제공한다. 시니어 사용자가 본 스피커를 사용함으로써 자연스러운 대화기능을 통해 말벗이 되어 심리적 안정을 취할 수 있으며, 상태 모니터링 기능을 통해 위험 상태 인지를 좀 더 용이하게 할 수 있을 것으로 기대한다.
향후 연구에서는 스피커에 치매 초기 증상을 파악하기 위한 자가진단 테스트를 대화식으로 주고받을 수 있는 기능을 추가하여 치매 골든타임을 줄일 수 있도록 할 계획이다.

질의응답

핵심어	질문	논문에서 추출한 답변
	챗봇이란?	챗봇은 채팅(Chat ing)이 가능한 로봇(Robot) 프로그램의 의미로써 마치 사람과 채팅을 하듯이 프로그램과 대화를 할 수 있는 기술이다 [4]. 챗봇은 사람들이 필요로 하는 서비스와 데이터를 적시에 찾아주는 등 수많은 기업과 개인을 연결해 주는 연결고리 역할을 하고 있다.
	챗봇은 어떤 역할을 하고 있는가?	챗봇은 채팅(Chat ing)이 가능한 로봇(Robot) 프로그램의 의미로써 마치 사람과 채팅을 하듯이 프로그램과 대화를 할 수 있는 기술이다 [4]. 챗봇은 사람들이 필요로 하는 서비스와 데이터를 적시에 찾아주는 등 수많은 기업과 개인을 연결해 주는 연결고리 역할을 하고 있다. 대부분 챗봇은 가입자 5억 명 이상을 보유하고 있는 메신저 플랫폼 -왓츠앱(WhatApp), 위챗(WeChat), 라인(Line) 등-에서 다양한 서비스를 제공하고 있다.
	페이스북 메신저의 경우, '페이스북 메시지' 혹은 '페이스북 메시지 보내줘'와 같은 명령에서 자연어 처리 과정 중 '페이스북 메시지'를 찾아내어 해당 서비스를 처리하는데 이와 같은 기능을 통해 얻는 장점은?	페이스북 메신저의 경우, ‘페이스북 메시지’ 혹은 ‘페이스북 메시지 보내줘’라는 명령에서 자연어 처리 과정 중 ‘페이스북 메시지’를 찾아내어 해당 서비스를 처리한다. 따라서 가족에게 연락을 해야 할 경우가 있을 때나 가족이 아닌 응급상황일 때 간단히 음성 명령으로 연락을 취할 수 있다.

참고문헌 (10)

"Finding a solution to low birth rate and aging society in local innovation cases," Ministry of the Interior and Safety, Local Government Officials Development Institute, 2017.11.
Gyu-A Kim and Man-Gon Park, "A Study on the Methods of Fault Analysis to Improve Safety in U-Healthcare System for Managing Emergency rescue for Seniors," Journal of Korea Multimedia Society, Vol.17, No 2, pp.170-179, 2014. DOI : 10.9717/kmms.2014.17.2.170

원문보기 상세보기
Eun-Sil Ha, "The implementation of Smart Care System for Dementia Patients," Journal of the Korea Academy Industrial Cooperation Society, Vol. 15, No. 6, pp.3832-3840, 2014. DOI : 10.5762/KAIS.2014.15.6.3832

원문보기 상세보기
SEOUL NPO Center, Archive Curator,"Introduction to Concept and Case study of 'ChatBot' based on Artificial Intelligence," http://www.seoulnpocenter.kr/index.php, 2017.
Product Introduction - SKT NUGU, http://www.nugu.co.kr/product.jsp
GiGA Genie KT, Product Introduction, https://gigagenie.kt.com/main.do
Kakaomini, https://kakao.ai/product/kakaomini
Han-Seok Ryu, "Business Trends and Implications of Chatbot," DIGIECO Report, http://www.digieco.co.kr/KTFront/index.action, 2017.
Jin-Wook Ha, Sang-Hyuk Kim, "Past, Present and Future of Artificial Intelligent Speaker," Journal of the Korean Society Of Computer And Information, Vol. 25, No. 2, pp.1-8, 2017.
"Problems and Improvements of Artificial Intelligence (AI) Appliances : Focusing on Speech Recognition Speaker," Korean Consumer Agency, Servey report, pp.1-33, 2017.

저자의 다른 논문 :

LOADING...

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증