최근 음성 인식과 합성 등 필요 기술이 실용화 단계로 접어들면서 AI 스피커(Artificial Intelligence Speaker)와 같은 사람-컴퓨터 간 음성 대화 인터페이스(Voice User Interface, 이하'VUI') 기반의 다양한 상품들이 나오고 있다. AI 스피커에서 사용되는 VUI는 사용자와 AI 에이전트간 음성을 매개로 하여 Multi-Turn이 가능하며, NUI(Natural UserInterface) 환경에서 경험적 생태계를 주도할 수 있는 핵심적인 ...
최근 음성 인식과 합성 등 필요 기술이 실용화 단계로 접어들면서 AI 스피커(Artificial Intelligence Speaker)와 같은 사람-컴퓨터 간 음성 대화 인터페이스(Voice User Interface, 이하'VUI') 기반의 다양한 상품들이 나오고 있다. AI 스피커에서 사용되는 VUI는 사용자와 AI 에이전트간 음성을 매개로 하여 Multi-Turn이 가능하며, NUI(Natural UserInterface) 환경에서 경험적 생태계를 주도할 수 있는 핵심적인 인터랙션 수단으로 인지되고 있다. 하지만, 음성합성 기술 품질의 발전에도 불구하고, 문장구성, 대화이해도 부족 등 사용자 불편요인이 발생하고 있으며, VUI 사용성 저하 및 서비스 경험의 질을 떨어뜨려 서비스 사용 단절로까지 이어질 수 있다. 또한 시장초기 상황으로 사용자 관점에서 VUI를 담당하는 인공지능 에이전트(AI Agent) 음성품질에 관한 접근 연구는 전무한 상태이다. 이에 이 연구에서는 VUI 기반의 서비스를 이용하고 이를 수용하는 사용자 관점에서 VUI의 핵심적인 음성품질(친밀감, 음성속성, 정서표현, 명료성, 자연스러움, 이해가능성, 반응성 등)을 음성 관련 선행연구를 기반으로 도출하고, 사회적 실재감 및 지각된 가치를 통해 지속사용의도에 미치는 관계를 실제 AI 스피커 사용자 416명을 대상으로 실증적으로 검증하고자 하였다. 주요 분석결과는 다음과 같다. 첫째, 인공지능 에이전트의 음성품질 요인 친밀감, 정서표현, 이해가능성, 반응성이 사회적 실재감에 정(+)의 영향을 미치는 것으로 나타났다. 둘째, 인공지능 에이전트의 음성품질 요인 중 친밀감, 정서표현, 명료성, 이해가능성, 반응성 요인이 지각된 디바이스의 가치에 정(+)의 영향을 미치는 것으로 나타났다. 셋째, 사회적 실재감은 지각된 가치에 정(+)에 영향을 미쳤으며, 사회적 실재감과 지각된 가치는 지속사용의도에도 정(+)의 영향을 미치는 것으로 나타나, 에이전트를 사람처럼 느끼는 실재감이 증가하면 지각된 디바이스의 가치와 함께 서비스의 지속적인 사용의도도 함께 증가하는 것으로 검증되었다. 반면, 음성속성과 자연스러움은 사회적 실재감과 지각된 디바이스의 가치에 미치는 영향은 나타나지 않았으며, 명료성 요인의 경우 사회적 실재감에는 부(-)의 영향을 미치는 것으로 나타났다. 이상의 연구결과를 토대로, 이 연구의 의의 및 시사점을 제시하면 다음과 같다. 첫째, 이 연구에서는 음성에 대한 기술적 차원과 감성적 차원의 가치에 대한 고찰을 통해 컴퓨터가 만들어낸 인공지능 에이전트의 음성품질 주요 요인을 규명하였다. 둘째, 이 연구에서는 인공지능 에이전트의 음성품질이 미치는 사회적 실재감과의 관계뿐만 아니라 사회적 실재감이 지각된 가치와 지속사용의도와의 관계를 규명하였다. 셋째, 인공지능 에이전트의 음성품질 요인 중 명료성 요인이 디바이스가 갖는 기술적 품질 측면과 인공지능 에이전트와의 감정적 상호작용 측면에서 차이를 확인하였다. 이를 통해 향후 인공지능 에이전트의 음성에 대한 사회적 실재감과 가치를 높이기위해 보다 중점적으로 개발 및 관리가 이루어져야 할 핵심 품질요인을 제시할 수 있었다고 볼 수 있다.
최근 음성 인식과 합성 등 필요 기술이 실용화 단계로 접어들면서 AI 스피커(Artificial Intelligence Speaker)와 같은 사람-컴퓨터 간 음성 대화 인터페이스(Voice User Interface, 이하'VUI') 기반의 다양한 상품들이 나오고 있다. AI 스피커에서 사용되는 VUI는 사용자와 AI 에이전트간 음성을 매개로 하여 Multi-Turn이 가능하며, NUI(Natural UserInterface) 환경에서 경험적 생태계를 주도할 수 있는 핵심적인 인터랙션 수단으로 인지되고 있다. 하지만, 음성합성 기술 품질의 발전에도 불구하고, 문장구성, 대화이해도 부족 등 사용자 불편요인이 발생하고 있으며, VUI 사용성 저하 및 서비스 경험의 질을 떨어뜨려 서비스 사용 단절로까지 이어질 수 있다. 또한 시장초기 상황으로 사용자 관점에서 VUI를 담당하는 인공지능 에이전트(AI Agent) 음성품질에 관한 접근 연구는 전무한 상태이다. 이에 이 연구에서는 VUI 기반의 서비스를 이용하고 이를 수용하는 사용자 관점에서 VUI의 핵심적인 음성품질(친밀감, 음성속성, 정서표현, 명료성, 자연스러움, 이해가능성, 반응성 등)을 음성 관련 선행연구를 기반으로 도출하고, 사회적 실재감 및 지각된 가치를 통해 지속사용의도에 미치는 관계를 실제 AI 스피커 사용자 416명을 대상으로 실증적으로 검증하고자 하였다. 주요 분석결과는 다음과 같다. 첫째, 인공지능 에이전트의 음성품질 요인 친밀감, 정서표현, 이해가능성, 반응성이 사회적 실재감에 정(+)의 영향을 미치는 것으로 나타났다. 둘째, 인공지능 에이전트의 음성품질 요인 중 친밀감, 정서표현, 명료성, 이해가능성, 반응성 요인이 지각된 디바이스의 가치에 정(+)의 영향을 미치는 것으로 나타났다. 셋째, 사회적 실재감은 지각된 가치에 정(+)에 영향을 미쳤으며, 사회적 실재감과 지각된 가치는 지속사용의도에도 정(+)의 영향을 미치는 것으로 나타나, 에이전트를 사람처럼 느끼는 실재감이 증가하면 지각된 디바이스의 가치와 함께 서비스의 지속적인 사용의도도 함께 증가하는 것으로 검증되었다. 반면, 음성속성과 자연스러움은 사회적 실재감과 지각된 디바이스의 가치에 미치는 영향은 나타나지 않았으며, 명료성 요인의 경우 사회적 실재감에는 부(-)의 영향을 미치는 것으로 나타났다. 이상의 연구결과를 토대로, 이 연구의 의의 및 시사점을 제시하면 다음과 같다. 첫째, 이 연구에서는 음성에 대한 기술적 차원과 감성적 차원의 가치에 대한 고찰을 통해 컴퓨터가 만들어낸 인공지능 에이전트의 음성품질 주요 요인을 규명하였다. 둘째, 이 연구에서는 인공지능 에이전트의 음성품질이 미치는 사회적 실재감과의 관계뿐만 아니라 사회적 실재감이 지각된 가치와 지속사용의도와의 관계를 규명하였다. 셋째, 인공지능 에이전트의 음성품질 요인 중 명료성 요인이 디바이스가 갖는 기술적 품질 측면과 인공지능 에이전트와의 감정적 상호작용 측면에서 차이를 확인하였다. 이를 통해 향후 인공지능 에이전트의 음성에 대한 사회적 실재감과 가치를 높이기위해 보다 중점적으로 개발 및 관리가 이루어져야 할 핵심 품질요인을 제시할 수 있었다고 볼 수 있다.
주제어
#AI 스피커 음성대화 인터페이스 인공지능 에이전트 음성품질 사회적 실재감 지각된 디바이스의 가치 지속사용의도 AI Speaker Voice User Interface AI Agent Voice Quality Social Presence Perceived Value of Device Continuance Use Intention
학위논문 정보
저자
김정기
학위수여기관
연세대학교 정보대학원
학위구분
국내석사
학과
UX/콘텐츠 전공
지도교수
최준호
발행연도
2018
총페이지
vii, 93장
키워드
AI 스피커 음성대화 인터페이스 인공지능 에이전트 음성품질 사회적 실재감 지각된 디바이스의 가치 지속사용의도 AI Speaker Voice User Interface AI Agent Voice Quality Social Presence Perceived Value of Device Continuance Use Intention
※ AI-Helper는 부적절한 답변을 할 수 있습니다.