[보고서]지능운영아키텍처기반 지능형 인터렉티브 기술: I2T-iOA

김종환

지능운영아키텍처기반 지능형 인터렉티브 기술: I2T-iOA
Intelligent interactive technology based on intelligence operating architecture: I2T-iOA 원문보기

보고서 정보
주관연구기관	한국과학기술원 Korea Advanced Institute of Science and Technology
연구책임자	김종환
보고서유형	최종보고서
발행국가	대한민국
언어	한국어
발행년월	2017-12
과제시작연도	2016
주관부처	미래창조과학부 Ministry of Science, ICT and Future Planning
등록번호	TRKO202100004108
과제고유번호	1711044075
사업명	개인연구지원
DB 구축일자	2021-07-03
키워드	멀티모달 인식.사람의 행동 모델링.사용자 의도 파악.상황 정보 추론.멀티미디어 서비스.지능 운영 구조.사람-컴퓨터 상호작용.사용자 중심의 개발 플랫폼.지능슈퍼에이전트.Multi-modal perception.Human behavior modelling.Human intention reading.Context reasoning.Multimedia service.Intelligence operating architecture.Human-computer interaction.UDREAM.Intelligent super agent.

초록 ▼

□ 연구의 목적 및 내용
본 과제는 1) 상황정보 인식기술, 2) 멀티모달 인터페이스 기술, 3) 멀티 상호작용을 위한 의사 결정 기술, 4) 선호도 기반 의사 결정 기술, 5) 적응형 개인화 인터페이스, 6) 지식기반 서비스 인터페이스 기술, 7) 지능슈퍼에이전트를 통한 기술 통합 등 총 7개의 세부주제로 나누어 연구한다.
1주제에서는 지식 기반 서비스를 사용자에게 제공하기 위해 RGB-D 정보로부터 사람이 활동하는 환경의 의미정보를 얻는 알고리즘을 개발하고, 2주제에서는 로봇이 인간의 분위기 및 감정을 인식하기 위해 얼굴, 제스처 및 음성으로부터 사용자의 정서를 파악하는 알고리즘을 개발한다. 3주제에서는 로봇이 여러 사람과 다대일 상호작용을 위한 의사 결정 및 행동 선택 알고리즘을 개발하며, 4주제에서는 FCM을 이용하여서 사용자의 선호도가 고려된 의사 결정 메커니즘을 연구한다. 5주제에서는 로봇이 사람의 말을 듣고 질문에 답하는 VQA 시스템에 관한 연구를 진행하며, 6주제에서는 개인 특화 서비스를 위한 사용자의 성향 파악을 스마트폰 사용 패턴 분석을 통해 알아내는 연구를 하도록 한다. 마지막으로, 7주제에서는 UDREAM 플랫폼으로 개발된 알고리즘들을 에이전트화하여 지식기반 서비스를 위한 지능슈퍼에이전트를 개발한다.

□ 연구결과
본 과제의 성과로, 1주제에서는 RGB-D 센서 기반 상황정보 파악을 위한 3차원 지도 생성 알고리즘을 개발하였다. 개발한 알고리즘을 통해 동적인 환경에서 기존의 방법들보다 더 정확한 시각 주행거리를 추정할 수 있었다. 2주제에서는 음성/제스처/표정 기반 사용자 감정인식 연구를 수행하였다. 음성으로부터 MFCC 특징점을 추출하고, DNN을 이용하여 사용자의 감정 인식을 수행하였다. 또한, 표정으로부터는 FAP 특징점을 정의하고, 제스쳐로부터는 24가지의 특징점을 정의하여 ARTMAP으로 학습시켜 감정을 인식하였다. 또한 퍼지 적분을 통해 다중 모달리티를 융합하여 인식률을 높일 수 있었다. 3주제에서는 멀티 상호작용을 위한 의사결정 및 행동 선택 알고리즘을 개발하였다. 이를 위해 샴쌍둥이 형태의 로봇 플랫폼을 제안하고, 행동 선택 알고리즘을 개발하여 로봇과 상호작용할 수 있었다. 4주제에서는 선호도 기반 FCM을 이용한 의사 결정을 연구하였다. 사용자 선호도를 고려한 의사 결정을 위해 DMQEA-FCM 알고리즘을 개발하였으며, 예제 데이터셋을 이용하여 성능을 검증하였다. 5주제에서는 dynamic memory network (DMN)을 바탕으로 visual question answering (VQA) 시스템을 실제 로봇에 적용하여 사용자가 질문을 했을 때, 원하는 답변을 할 수 있었다. 6주제에서는 개인 특화 서비스 제공을 위한 실시간 업데이트 기술을 개발하였다. 사용자의 스마트폰 앱 사용 내역을 시간과 행동에 따라 분석하여, 현재 사용자의 위험 상황을 파악할 수 있었다. 7주제에서는 인간-로봇 상호작용에 필요한 다양한 기능들을 모듈화하고, 이를 바탕으로 자율 대화 시나리오, 원격 운용 시나리오 등을 보였다.

□ 연구결과의 활용계획
개발된 I²T-iOA를 이용하면 사람이 느끼는 감정을 컴퓨터와 로봇 및 스마트 디바이스가 인식할 수 있게 되어 보다 자연스러운 상호작용이 가능하여 이들로부터 효율적인 지식기반 서비스를 제공받을 수 있다. I²T-iOA를 적용한 인간-컴퓨터/로봇/디바이스 상호작용이 개발되면, 이를 이용하여 사용자가 원하는 다양한 지식기반 서비스의 제공이 가능하기에 I²T-iOA의 상용화가 가능할 것이다. 또한, 지식기반 서비스의 핵심기술 개발을 통하여 스마트 서비스의 품질이 개선되어, 이로부터 기업의 새로운 수익 구조 창출이 가능하다.

(출처 : 연구결과 요약문 5p)

Abstract ▼

□ Purpose& contents
This project comprises seven subsections: 1) recognition and classification of big user data, 2) inference for customized user service, and 3) integrated agent implementation. In addition, the three middle projects are divided into seven subsections: 1) recognition of context information, 2) multimodal interface, 3) decision making algorithm for multi-interaction, 4) preference based decision making, 5) adaptive customizing interface, 6) knowledge based service interface, and 7) integration of technologies using intelligent super agent.
Subsection 1 develops an algorithm that recognizes the semantic information of environment from RGB-D data to provide knowledge based services. Subsection 2 develops an algorithm that identifies user emotion from face, gesture and audio information to enable robots to understand the mood and emotion. Subsection 3, 4 conduct researches regarding decision making and behavior selection algorithms for robot’s many to one interaction and for user’s preference. In subsection 5, VQA system which robots listen to people and answer questions is developed. Subection 6 conducts research on user preference identification through smartphone usage analysis for customized services. Lastly, subsection 7 implements all technologies as agents using UDREAM platform and an intelligent super agent for knowledge based services.

□ Result
In subsection 1, 3D map generation algorithm based on RGB-D camera for identification of context has been developed. The developed algorithm shows better performance compared to conventional methods in estimating visual odometry in dynamic environments. In subsection 2, research on user emotion recognition based on voice and gesture has been conducted. MFCC features are extracted from voice and user’s emotion is recognized through DNN. Furthermore, FAP feature is defined from facial expression and 24 features are defined from gesture. These features are learned using ARTMAP for recognition of emotion. In addition, fuzzy integrals were able to improve recognition rate by fusing multiple modalities. In subsection 3, decision making and behavior selection algorithm for multi interaction has been developed. For this, a Siamese robot platform is suggested, behavior selection algorithm is developed and users can interact with the robot. In subsection 4, research on decision making using preference based FCM. DMQEA-FCM algorithm which considers user preference for decision making has been developed and the performance has been verified using examplary dataset. In subsection 5, we implemented a visual question answering (VQA) system based on dynamic memory network (DMN) and applied it to a real robot, In subsection 6, real-time update technique for offering customized service has been developed. The adequate app for current time and user’s situation is extracted by analyzing user smartphone app usage according to time and behavor. In subsection 7, we modularized various functions needed for HRI, and showed autonomous dialogue scenarios and remote operation scenarios.

□ Expected Contribution
The developed I2T-iOA enables computers, robots, and smart devices to recognize the emotion humans feel, which allows a natural interaction and efficient knowledge based service. The commercialization of I2T-iOA is possible because developing a human-computer/robot/device interaction service which adopts I2T-iOA will offer various knowledge-based services that match user’s need. Furthermore, the development of fundamental technologies for knowledge-based services will imporve the quality of smart services, from which companies will create new profits.

(출처 : SUMMARY 6p)

목차 Contents

표지 ... 1
목차 ... 3
연구계획 요약문 ... 4
연구결과 요약문 ... 5
한글요약문 ... 5
SUMMARY ... 6
연구내용 및 결과 ... 7
1. 연구개발과제의 개요 ... 7
2. 국내외 기술개발 현황 ... 8
3. 연구수행 내용 및 결과 ... 9
4. 목표달성도 및 관련분야에의 기여도 ... 72
5. 연구결과의 활용계획 ... 75
6. 연구과정에서 수집한 해외 과학기술정보 ... 76
7. 주관연구책임자 대표적 연구실적 ... 80
8. 참고문헌 ... 80
9. 연구성과 ... 82
10. 국가과학기술지식정보서비스에 등록한 연구시설‧장비 현황 ... 88
11. 연구개발과제 수행에 따른 연구실 등의 안전조치 이행실적 ... 88
12. 기타사항 ... 88
[별첨1] 대 표 연 구 성 과 ... 89
[별첨2] 세부 목표 관련 증빙 ... 99
끝페이지 ... 106

표/그림 (101)

표 Wrapper, filter 방법을 이용한 특징점 선택
표 Q-gate lookup table
표 UCI dataset
표 다른 알고리즘과의 성능 비교
표 CNN 구조
표 Haar cascades classifier를 통하여 인식된 얼굴
표 얼굴표정 데이터 수집기
표 CK+ 데이터 셋 예시
표 CNN기반 사용자 정서 이해기술
표 CNN 기반 사용자 정서 이해기술 실험 영상 스냅샷
표 IMU and IMU receiver
표 IMU angle notation
표 Demonstrator with IMUs
표 Experiment
표 HBKL 구조 예시
표 BHAN 구조 (O: 물체노드, B: 행동노드, E: 효과노드)
표 BHAM 구조 (O: 물체노드, B: 행동노드, E: 효과노드)
표 HBKL 학습 및 사용자 의도 파악 알고리즘
표 공을 이용한 곰돌 가상 로봇과 사용자 사이의 상호작용 실험 시퀀스
표 상호작용 중 학습된 HBKL과 전이 확률
표 상호작용 중 업데이트된 유틸리티 값
표 큰 박스 형태의 블록에 대해 학습된 BHAN 과 효과 노드 값
표 작은 박스 형태의 블록에 대해 학습된 BHAN 과 효과 노드 값
표 실린더 형태의 블록에 대해 학습된 BHAN 과 효과 노드 값
표 캡슐 형태의 블록에 대해 학습된 BHAN 과 효과 노드 값
표 Φ2를 이용한 퍼지 척도 할당 방법
표 회귀 억제의 적용 예시. (a) 원본 이미지. (b) 회귀 억제 적용 전의 전체 평가 값. 검은 색 동그라미는 최대 전체 평가 값의 위치. (c) 적용된 회귀 억제 값. (d) 회귀 억제 적용 이후의 전체 평가 값
표 사용한 얼굴 로봇
표 사람 1명과의 상호작용에서의 시선 제어
표 사람 3명과의 상호작용에서의 시선 제어
표 성향 설문조사 결과 예시
표 설향 설문조사 결과
표 DREAM 방법론의 개념
표 DREAM 방법론 기반의 로봇 시스템 구조
표 에이전트 데이터베이스
표 에이전트 매니저
표 UDREAM을 이용한 마우스 제어 실험의 데이터 흐름도
표 UDREAM을 이용한 마우스 제어 실험
표 RGB-D 센서를 이용한 시각 주행 거리 측정 예시
표 동적인 환경에서의 추정된 배경모델
표 동적인 환경에서의 추정된 배경모델
표 얻어진 다중 해상도 트리 기반 3차원 지도
표 3차원 지도를 통해 로봇을 이용한 팔궤적 생성
표 IEMOCAP 데이터의 음성분류 성능 비교
표 ARTMAP 표정 감정 분류기의 구조도
표 ARTMAP과 다른 알고리즘의 성능 비교
표 ARTMAP 제스처 감정 인식 구조도
표 샴쌍둥이 로봇의 모습
표 샴쌍둥이 로봇의 지능 아키텍처
표 발달형 장기기억의 구조
표 샴쌍둥이 로봇의 3-D 시뮬레이터
표 샴쌍둥이 로봇의 7개의 내부 상태 정보
표 샴쌍둥이 로봇의 3개의 상황 정보
표 샴쌍둥이 로봇의 38개의 행동
표 발달형 장기기억의 계수
표 샴쌍둥이 로봇의 행동 선택 빈도 (DI: 인지한 상황이 강한 객체, NDI: 나머지 객체)
표 사람이 많은 환경에서 얼굴 표정 발현 빈도의 변화
표 사람이 멀리 있는 환경에서 제스처 발현 빈도의 변화
표 로봇이 생성하고 지운 이동 행동(movement)의 수
표 Diagram of DMQEA-FCM
표 Reference FCM의 값 변화. 대략 8~10 iteration이 지나면 수렴한다
표 사용자의 objective node들에 대한 선호도. 1이 가장 높은 선호도를 나타낸다
표 손과 물체간의 거리를 이용한 finite state machine
표 학습을 위한 ART 모델
표 RGB-D 센서와 열상센서간의 자동 캘리브레이션 과정
표 물체 검출 과정
표 (a) 화분에 물주기, (b) 쥬스 만들기, (c) 장난감 정리하기, (d) 토스트로 빵굽기
표 2차원 App 사용 기록 공간
표 특정 활동에 종속적인 App
표 특정 시간에 종속적인 App
표 가공된 App 사용 기록의 구조
표 사용자 0108530****의 App 사용 기록
표 사용자 0109719***의 App 사용 기록
표 기존의 스마트폰, 컴퓨터 앱
표 UDREAM 요소 기술 개발
표 UDREAM을 이용한 시선제어 서비스 개념도
표 시선제어 서비스를 제공하기 위한 데이터 흐름도
표 물체(Object), 얼굴(face), 움직임(movement) 기반 시선제어
표 얼굴 로봇을 이용한 얼굴 인식(face recognition) 기반 시선제어
표 실생활에서의 의미 지도 예시
표 동적인 움직임으로 인해 잘못 추정된 3차원 특징점 지도
표 배경모델을 고려한 ORB-SLAM으로 추정된 3차원 특징점지도
표 제안하는 시각 SLAM방식을 사용하여, 다중 해상도 기반의 트리구조로 표현된 3차원 지도
표 평면 제거 기법을 통한 물체검출 결과
표 CNN 기반의 물체 인식 결과
표 퍼지 척도에 따른 인식률 차이
표 App 사용 기록의 구조
표 App 초기 화면
표 저장된 App 사용 기록
표 대화 생성 기술 및 원격 운용기술의 세부 에이전트 및 통신
표 대화 생성 및 원격 운용기술의 통합 구조
표 원격 운용 기술 구현 환경
표 자율적으로 생성된 대화
표 얼굴 감지 및 자동 시선제어
표 원격 제스처 표현 및 화상 채팅 실험
표 DEMO 알고리즘의 구조도
표 nonsingleton type-2 FLS 시스템
표 Collaborative filtering을 알기 쉽게 그린 그림. 비슷한 성향을 지닌 유저들을 분리하여 생산품을 그에 맞게 개별화하여 판매한다
표 FALA 학습을 이용한 App 사용 예측
표 ROS 기본 구조
표 ROS에서 rxgraph 기능을 이용해 표현된 그래프 구조

과제명(ProjectTitle) :	-
연구책임자(Manager) :	-
과제기간(DetailSeriesProject) :	-
총연구비 (DetailSeriesProject) :	-
키워드(keyword) :	-
과제수행기간(LeadAgency) :	-
연구목표(Goal) :	-
연구내용(Abstract) :	-
기대효과(Effect) :	-

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 제목(한글), 저자명(한글), 발행일자, 전자원문, 초록(한글), 초록(영문) 관리번호, 제목(한글), 제목(영문), 저자명(한글), 저자명(영문), 주관연구기관(한글), 주관연구기관(영문), 발행일자, 총페이지수, 주관부처명, 과제시작일, 보고서번호, 과제종료일, 주제분류, 키워드(한글), 전자원문, 키워드(영문), 입수제어번호, 초록(한글), 초록(영문), 목차
저장형식	Text(ASCII format) Excel format
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

지능운영아키텍처기반 지능형 인터렉티브 기술: I2T-iOA
Intelligent interactive technology based on intelligence operating architecture: I2T-iOA 원문보기