인구 고령화가 진행됨에 따라 혼자 사는 1인 가구의 증가로 인해 외로움, 소외감, 우울증 등 각종 부정적인 문제가 사회 전반에 걸쳐 증가하고 있다. 이로 인해 혼자 자립생활을 하는 노인층을 위해 심리적 불안감 해소, 위험 상태의 인지, 가족 안부 확인 등을 손쉽게 할 수 있는 IT기술의 요구가 더욱 높아지고 있다. 본 논문에서는 시니어 사용자가 집에서 음성으로 간단한 대화식 명령을 줄 수 있고 사용자의 상태를 모니터링 할 수 있는 음성인식 스피커의 개발내용에 대해 기술한다. 이 스피커는 사용자 음성 분석과 챗봇 서비스를 통해 대화 내용을 파악하고 사용자가 원하는 서비스를 연결하여 그 결과를 다시 음성으로 제공해준다. 시니어 사용자가 본 스피커를 사용함으로써 자연스러운 대화기능을 통해 말벗이 되어 심리적 안정을 취할 수 있으며, 상태 모니터링 기능을 통해 위험 상태 인지를 좀 더 용이하게 할 수 있을 것으로 기대한다.
인구 고령화가 진행됨에 따라 혼자 사는 1인 가구의 증가로 인해 외로움, 소외감, 우울증 등 각종 부정적인 문제가 사회 전반에 걸쳐 증가하고 있다. 이로 인해 혼자 자립생활을 하는 노인층을 위해 심리적 불안감 해소, 위험 상태의 인지, 가족 안부 확인 등을 손쉽게 할 수 있는 IT기술의 요구가 더욱 높아지고 있다. 본 논문에서는 시니어 사용자가 집에서 음성으로 간단한 대화식 명령을 줄 수 있고 사용자의 상태를 모니터링 할 수 있는 음성인식 스피커의 개발내용에 대해 기술한다. 이 스피커는 사용자 음성 분석과 챗봇 서비스를 통해 대화 내용을 파악하고 사용자가 원하는 서비스를 연결하여 그 결과를 다시 음성으로 제공해준다. 시니어 사용자가 본 스피커를 사용함으로써 자연스러운 대화기능을 통해 말벗이 되어 심리적 안정을 취할 수 있으며, 상태 모니터링 기능을 통해 위험 상태 인지를 좀 더 용이하게 할 수 있을 것으로 기대한다.
As population aging progresses, there is a growing demand for IT technology that can relieve the psychological anxiety of the elderly living alone, recognize the dangerous situation, and check the family members' affection. In this paper, we describe the development of a speech recognition speaker t...
As population aging progresses, there is a growing demand for IT technology that can relieve the psychological anxiety of the elderly living alone, recognize the dangerous situation, and check the family members' affection. In this paper, we describe the development of a speech recognition speaker that enable senior users to give simple interactive commands by voice and monitor the status of the user. The speaker analyzes the user's voice, grasps the conversation contents through the chatbot, connects the desired service to the user, and provides the result again by voice. By using this speaker, senior users can feel relaxed by natural conversation, and can monitor the status of danger more easily.
As population aging progresses, there is a growing demand for IT technology that can relieve the psychological anxiety of the elderly living alone, recognize the dangerous situation, and check the family members' affection. In this paper, we describe the development of a speech recognition speaker that enable senior users to give simple interactive commands by voice and monitor the status of the user. The speaker analyzes the user's voice, grasps the conversation contents through the chatbot, connects the desired service to the user, and provides the result again by voice. By using this speaker, senior users can feel relaxed by natural conversation, and can monitor the status of danger more easily.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 시니어 사용자가 집에서 음성으로 간단한 대화식 명령을 줄 수 있고 사용자의 상태를 모니터링 할 수 있는 음성인식 스피커의 개발내용에 대해 기술한다. 이 스피커는 사용자 음성 분석과 챗봇 서비스를 통해 대화 내용을 파악하고 사용자가 원하는 서비스를 연결하여 그 결과를 다시 음성으로 제공해준다.
본 논문에서는 시니어 사용자가 집에서 음성으로 대화식 명령을 줌으로써 문자 또는 메일을 보내고, 날씨를 확인할 수 있는 간단한 서비스를 받을 수 있는 음성인식 스피커의 개발내용에 대해 기술하였다. 이 스피커는 사용자 음성 분석과 챗봇 서비스를 통해 대화 내용을 파악하고 사용자가 원하는 서비스를 연결하여 그 결과를 다시 음성으로 제공해준다.
사용자들은 자신에게 꼭 필요하고, 원하는 기능만을 가진 하나의 인공지능 스피커를 필요로 할 것이다. 이러한 문제점을 해결하기 위해 본 논문에서는 확장성이 뛰어난 라즈베리파이를 사용하여 사용자가 필요한 기능을 추가하거나 제거하기가 용이하도록 하여 개개인에게 다양한 맞춤형 서비스를 제공할 수 있도록 한다.
제안 방법
Webhook 테스트 및 구현을 위해 Google Firebase의 Cloud Functions을 활용하여 날씨 API에 날짜인 ‘date’, 지역인 ‘geo-city’ 파라미터를 전송하여 날씨 데이터를 수신한다.
마이크로부터 입력되는 시니어 사용자의 음성을 텍스트로 변환하기 위한 STT(speech To Text) 모듈로 Google의 Cloud Speech API를 사용한다. 구글 서버에 음성 데이터를 보내고 피드백을 받는 형태로써, API 사용 조건을 맞추기 위해 마이크로부터 16,00 Hz 이상의 샘플링 속도로 음성을 인식할 수 있게 설정하였다. 처리된 텍스트를 음성으로 다시 합성하는 경우 네이버의 Clova Speech Synthesis를 사용하여 응답 데이터를 구성하였다.
본 논문에서는 초소형, 초저가 PC이며 뛰어난 확장성과 범용성을 자랑하는 라즈베리파이를 사용하여 음성 인식 및 서버와의 통신 기능을 처리하고 라즈베리파이 확장 보드에서에는 각종 센서들을 관리하도록 구성한다. 확장보드에서 라즈베리파이에 전원을 공급함으로써 확장보드에서 스위치 제어로 모든 전원을 컨트롤할 수 있도록 구성한다.
본 논문에서 개발한 시니어 사용자를 위한 챗봇 활용 음성인식 스피커에 대한 전체 내용을 도식화하면 그림 1과 같다. 본 스피커는 시니어 사용자가 요양원이나 집에서 날씨 정보, 문자 메시지 전송, 이메일 전송 등을 간단한 대화 형태로 사용할 수 있도록 해주며, 사용자의 기본 상태를 모니터링 할 수 있는 기능을 제공한다.
본 스피커에서는 움직임 인식 센서와 온/습도 센서를 이용하여 시니어 사용자에 대한 상태정보를 수집하여 데이터를 서버로 주기적으로 전송한다. 이를 통해 시니어 사용자의 상태와 집의 온습도를 수집함으로써 시니어 사용자의 상태를 실시간으로 모니터링하기 위한 관제 사이트를 구축하였다.
본 연구의 결과물은 시니어 사용자의 건강을 고려해서 편백나무를 이용하여 레이저 커팅기로 한층 씩 커팅 후 접합하는 방식으로 외형 시작품을 제작하였다.
사용자의 의도를 알아차리고, 그 의도에 맞는 결과를 반환하기 위한 챗봇 클라우드 서비스로 Dialogflow를 채택했다. Dialogflow는 자연어 대화를 기반으로 하는 인간과 컴퓨터 사이의 상호작용을 할 수 있는 기술을 제공하는 챗봇 플랫폼이다.
위와 같이 날씨 정보를 받아오는 것은 물론, 구글의 G-Mail과 페이스북의 페이스북 메신저를 연동하여 설정한 가족에게 음성 명령을 통해 메일 및 메시지를 전송할 수 있도록 하였다. 인터넷에서 메일을 보내기 위해 이용되는 우편 전송 프로토콜, 즉 SMTP(Simple Mail Transper Protocol)를 이용하게 된다.
처리된 텍스트를 음성으로 다시 합성하는 경우 네이버의 Clova Speech Synthesis를 사용하여 응답 데이터를 구성하였다. 음성으로 변환될 텍스트를 HTTP 통신으로 음성 합성 서버에 전송하여 파라미터로 지정된 음색과 속도로 음성을 합성한 뒤 그 결과를 반환한다.
본 스피커에서는 움직임 인식 센서와 온/습도 센서를 이용하여 시니어 사용자에 대한 상태정보를 수집하여 데이터를 서버로 주기적으로 전송한다. 이를 통해 시니어 사용자의 상태와 집의 온습도를 수집함으로써 시니어 사용자의 상태를 실시간으로 모니터링하기 위한 관제 사이트를 구축하였다.
대상 데이터
본 스피커는 해운대 구청을 통하여 22명의 시니어 사용자를 확보하여 교육을 시행하였으며 2017년 12월 ~ 1월 이들을 대상으로 시범 운영을 진행하였다. 그림 12는 시범운영을 진행한 시니어 사용자들의 설문조사 결과이다.
인터넷에서 메일을 보내기 위해 이용되는 우편 전송 프로토콜, 즉 SMTP(Simple Mail Transper Protocol)를 이용하게 된다. 본 연구에서는 파이썬에서 제공하는 포털 사이트의 SMPT 서버를 이용할 수 있는 SMPT 라이브러리를 사용하여 구현하였으며, 그 과정은 그림 8과 같다.
구글 서버에 음성 데이터를 보내고 피드백을 받는 형태로써, API 사용 조건을 맞추기 위해 마이크로부터 16,00 Hz 이상의 샘플링 속도로 음성을 인식할 수 있게 설정하였다. 처리된 텍스트를 음성으로 다시 합성하는 경우 네이버의 Clova Speech Synthesis를 사용하여 응답 데이터를 구성하였다. 음성으로 변환될 텍스트를 HTTP 통신으로 음성 합성 서버에 전송하여 파라미터로 지정된 음색과 속도로 음성을 합성한 뒤 그 결과를 반환한다.
이론/모형
마이크로부터 입력되는 시니어 사용자의 음성을 텍스트로 변환하기 위한 STT(speech To Text) 모듈로 Google의 Cloud Speech API를 사용한다. 구글 서버에 음성 데이터를 보내고 피드백을 받는 형태로써, API 사용 조건을 맞추기 위해 마이크로부터 16,00 Hz 이상의 샘플링 속도로 음성을 인식할 수 있게 설정하였다.
본 논문에서는 페이스북 메신저를 파이썬에서 이용할 수 있도록 제작된 fbchat 모듈을 이용한다. fbchat 모듈은 페이스북에서 제공하는 API를 활용하여 파이썬에서 간편하게 페이스북 메시지 기능을 이용할 수 있도록 만들어진 모듈이다.
성능/효과
또한 85%의 시니어 사용자는 본 스피커에 대해 만족스럽다고 답변하였다. 대부분의 시니어 사용자는 스마트폰에서 통화, 메시지(카카오톡 포함) 전송을 주요 기능으로 사용하고 있었으며, 시니어 사용자 모두가 본 스피커의 사용 용이성이 스마트폰보다 우수하다고 답변하였다. 또한 60%의 시니어 사용자는 일일 10회 이상 본 스피커를 사용하였다.
후속연구
또한 60%의 시니어 사용자는 일일 10회 이상 본 스피커를 사용하였다. 따라서 본 스피커를 활용한다면 시니어 사용자의 상태를 사전에 파악할 수 있어 사회적 이슈가 되고 있는 고독사 문제를 해결할 것으로 예상된다.
본 스피커는 기존 인공지능 스피커와 달리 라즈베리파이(Raspberry Pi)를 사용하여 제작하였기 때문에 하드웨어 모듈 확장성이 용이하며, 시니어 사용자에게 특화된 서비스를 제공한다. 시니어 사용자가 본 스피커를 사용함으로써 자연스러운 대화기능을 통해 말벗이 되어 심리적 안정을 취할 수 있으며, 상태 모니터링 기능을 통해 위험 상태 인지를 좀 더 용이하게 할 수 있을 것으로 기대한다.
향후 연구에서는 스피커에 치매 초기 증상을 파악하기 위한 자가진단 테스트를 대화식으로 주고받을 수 있는 기능을 추가하여 치매 골든타임을 줄일 수 있도록 할 계획이다.
질의응답
핵심어
질문
논문에서 추출한 답변
챗봇이란?
챗봇은 채팅(Chat ing)이 가능한 로봇(Robot) 프로그램의 의미로써 마치 사람과 채팅을 하듯이 프로그램과 대화를 할 수 있는 기술이다 [4]. 챗봇은 사람들이 필요로 하는 서비스와 데이터를 적시에 찾아주는 등 수많은 기업과 개인을 연결해 주는 연결고리 역할을 하고 있다.
챗봇은 어떤 역할을 하고 있는가?
챗봇은 채팅(Chat ing)이 가능한 로봇(Robot) 프로그램의 의미로써 마치 사람과 채팅을 하듯이 프로그램과 대화를 할 수 있는 기술이다 [4]. 챗봇은 사람들이 필요로 하는 서비스와 데이터를 적시에 찾아주는 등 수많은 기업과 개인을 연결해 주는 연결고리 역할을 하고 있다. 대부분 챗봇은 가입자 5억 명 이상을 보유하고 있는 메신저 플랫폼 -왓츠앱(WhatApp), 위챗(WeChat), 라인(Line) 등-에서 다양한 서비스를 제공하고 있다.
페이스북 메신저의 경우, '페이스북 메시지' 혹은 '페이스북 메시지 보내줘'와 같은 명령에서 자연어 처리 과정 중 '페이스북 메시지'를 찾아내어 해당 서비스를 처리하는데 이와 같은 기능을 통해 얻는 장점은?
페이스북 메신저의 경우, ‘페이스북 메시지’ 혹은 ‘페이스북 메시지 보내줘’라는 명령에서 자연어 처리 과정 중 ‘페이스북 메시지’를 찾아내어 해당 서비스를 처리한다. 따라서 가족에게 연락을 해야 할 경우가 있을 때나 가족이 아닌 응급상황일 때 간단히 음성 명령으로 연락을 취할 수 있다.
참고문헌 (10)
"Finding a solution to low birth rate and aging society in local innovation cases," Ministry of the Interior and Safety, Local Government Officials Development Institute, 2017.11.
Gyu-A Kim and Man-Gon Park, "A Study on the Methods of Fault Analysis to Improve Safety in U-Healthcare System for Managing Emergency rescue for Seniors," Journal of Korea Multimedia Society, Vol.17, No 2, pp.170-179, 2014. DOI : 10.9717/kmms.2014.17.2.170
Eun-Sil Ha, "The implementation of Smart Care System for Dementia Patients," Journal of the Korea Academy Industrial Cooperation Society, Vol. 15, No. 6, pp.3832-3840, 2014. DOI : 10.5762/KAIS.2014.15.6.3832
SEOUL NPO Center, Archive Curator,"Introduction to Concept and Case study of 'ChatBot' based on Artificial Intelligence," http://www.seoulnpocenter.kr/index.php, 2017.
Han-Seok Ryu, "Business Trends and Implications of Chatbot," DIGIECO Report, http://www.digieco.co.kr/KTFront/index.action, 2017.
Jin-Wook Ha, Sang-Hyuk Kim, "Past, Present and Future of Artificial Intelligent Speaker," Journal of the Korean Society Of Computer And Information, Vol. 25, No. 2, pp.1-8, 2017.
"Problems and Improvements of Artificial Intelligence (AI) Appliances : Focusing on Speech Recognition Speaker," Korean Consumer Agency, Servey report, pp.1-33, 2017.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.