감정은 학습능력, 행동, 판단력 등 삶의 많은 부분에 영향을 끼치므로 인간의 본질을 이해하는 데 중요한 역할을 한다. 그러나 감정은 개인이 느끼는 강도가 다르며, 시각 영상 자극을 통해 감정을 유도하는 경우 감정이 지속적으로 유지되지 않는다. 이러한 문제점을 극복하기 위하여 총 4가지 감정자극(행복, 슬픔, 공포, 보통) 시 생체신호(뇌전도, 맥파, 피부전도도, 피부 온도)를 획득하고, 이로부터 특징을 추출하여 분류기의 입력으로 사용하였다. 감정 패턴을 확률적으로 해석하여 다른 공간으로 매핑시켜주는 역할을 하는 Restricted Boltzmann Machine (RBM)과 Multilayer Neural Network (MNN)의 은닉층노드를 이용하여 비선형적인 성질의 감정을 구별하는 Deep Belief Network (DBN) 감정 패턴 분류기를 설계하였다. 그 결과, DBN의 정확도(약 94%)는 오류 역전파 알고리즘의 정확도(약 40%)보다 높은 정확도를 가지며 감정 패턴 분류기로서 우수성을 가짐을 확인하였다. 이는 향후 인지과학 및 HCI 분야 등에서 활용 가능할 것으로 사료된다.
감정은 학습능력, 행동, 판단력 등 삶의 많은 부분에 영향을 끼치므로 인간의 본질을 이해하는 데 중요한 역할을 한다. 그러나 감정은 개인이 느끼는 강도가 다르며, 시각 영상 자극을 통해 감정을 유도하는 경우 감정이 지속적으로 유지되지 않는다. 이러한 문제점을 극복하기 위하여 총 4가지 감정자극(행복, 슬픔, 공포, 보통) 시 생체신호(뇌전도, 맥파, 피부전도도, 피부 온도)를 획득하고, 이로부터 특징을 추출하여 분류기의 입력으로 사용하였다. 감정 패턴을 확률적으로 해석하여 다른 공간으로 매핑시켜주는 역할을 하는 Restricted Boltzmann Machine (RBM)과 Multilayer Neural Network (MNN)의 은닉층 노드를 이용하여 비선형적인 성질의 감정을 구별하는 Deep Belief Network (DBN) 감정 패턴 분류기를 설계하였다. 그 결과, DBN의 정확도(약 94%)는 오류 역전파 알고리즘의 정확도(약 40%)보다 높은 정확도를 가지며 감정 패턴 분류기로서 우수성을 가짐을 확인하였다. 이는 향후 인지과학 및 HCI 분야 등에서 활용 가능할 것으로 사료된다.
Emotion affects many parts of human life such as learning ability, behavior and judgment. It is important to understand human nature. Emotion can only be inferred from facial expressions or gestures, what it actually is. In particular, emotion is difficult to classify not only because individuals fe...
Emotion affects many parts of human life such as learning ability, behavior and judgment. It is important to understand human nature. Emotion can only be inferred from facial expressions or gestures, what it actually is. In particular, emotion is difficult to classify not only because individuals feel differently about emotion but also because visually induced emotion does not sustain during whole testing period. To solve the problem, we acquired bio-signals and extracted features from those signals, which offer objective information about emotion stimulus. The emotion pattern classifier was composed of unsupervised learning algorithm with hidden nodes and feature vectors. Restricted Boltzmann machine (RBM) based on probability estimation was used in the unsupervised learning and maps emotion features to transformed dimensions. The emotion was characterized by non-linear classifiers with hidden nodes of a multi layer neural network, named deep belief network (DBN). The accuracy of DBN (about 94 %) was better than that of back-propagation neural network (about 40 %). The DBN showed good performance as the emotion pattern classifier.
Emotion affects many parts of human life such as learning ability, behavior and judgment. It is important to understand human nature. Emotion can only be inferred from facial expressions or gestures, what it actually is. In particular, emotion is difficult to classify not only because individuals feel differently about emotion but also because visually induced emotion does not sustain during whole testing period. To solve the problem, we acquired bio-signals and extracted features from those signals, which offer objective information about emotion stimulus. The emotion pattern classifier was composed of unsupervised learning algorithm with hidden nodes and feature vectors. Restricted Boltzmann machine (RBM) based on probability estimation was used in the unsupervised learning and maps emotion features to transformed dimensions. The emotion was characterized by non-linear classifiers with hidden nodes of a multi layer neural network, named deep belief network (DBN). The accuracy of DBN (about 94 %) was better than that of back-propagation neural network (about 40 %). The DBN showed good performance as the emotion pattern classifier.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 DBN의 우수성을 확인하기 위하여 유사한 방법으로 학습되지만 RBM을 사용하지 않는 오류 역전파 알고리즘을 통하여 두 알고리즘의 성능을 분석해보고자 했다. 또한, 시각 자극에서 감정 유발이 잘 되는 구간을 학습데이터로 사용하여 DBN 및 오류 역전파 알고리즘을 학습한 후 같은 5개의 테스트 데이터를 이용하여 성능을 분석했다.
본 논문에서는 뇌파, 맥파, 피부전도도, 피부 온도를 기반으로 하는 특징을 입력으로 사용하기 위하여 측정된 생체신호로부터 특징벡터를 추출했다.
본 논문에서는 뇌파, 맥파, 피부전도도, 피부 온도에 기반을 둔 다양한 생체신호로부터 감정 패턴 분류기의 입력데이터를 추출했다. 어떠한 생체신호가 입력으로 사용되는가에 따라 분류기의 성능은 변화한다.
본 연구에서는 감정 판별의 한계를 해결하기 위하여 감정 자극 시 중추신경계 및 자율신경계의 생체신호를 종합적으로 획득하여 객관적인 판별을 하고자 했다. 또한, 영상 자극에서 획득된 감정 신호를 연속적으로 보기 위하여 생체신호를 창 이동(Sliding Window) 시켜주어 특징을 추출했다.
본 연구의 목적은 영상정보의 시각자극에 의해 유발된 감정을 생체신호를 통해 확률적으로 해석하여 정확도가 높은 감정 패턴 분류기를 구현하는 것이다.
가설 설정
자극유발 영상 시작 후 초기 5분 데이터는 감정의 유발이 일어나지 않는다는 가정 하에 이를 제외한 55분 데이터에서 특징을 추출했다. 특징은 획득 데이터에 5분 기반 창(Window)을 사용하여 계산하였으며 30초씩 창 이동(Sliding Window)을 하였다.
제안 방법
DBN을 이용한 감정 패턴 분류기를 설계하기 위하여 임의로 RBM의 초기 조건을 설정하여 주었다. 본 논문에서는 학습률은 0.
RBM 구성 시 학습률은 지역 최적화를 막아주고 속도를 조절해주는 역할을 하므로 각 층별로 반복 횟수에 따라 오차를 비교했다. Fig.
피험자의 생체신호는 BIOPAC MP 150TM을 이용하여 측정하였으며 1 kHz로 샘플링 한 뇌파, 맥파, 피부전도도 및 피부 온도 데이터를 획득하였다. 뇌파는 10-20 시스템을 기준으로 하여 전두엽(F3, F4)과 두정엽(C3, C4)에서측정되었으며, 기준전극으로 피험자의 왼쪽 귀를 사용하였다. 맥파는 왼손 검지, 피부전도도는 왼손 중지와 약지, 피부온도는 왼손 소지에서 측정되었다(Choi, 2011).
다음으로 RBM의 배치데이터의 개수를 결정하기 위하여 데이터를 한 개씩 넣어주는 패턴모드에서 학습 데이터의 개수인 320개를 모두 넣는 경우까지를 비교하여 보았다.
, 2010). 따라서 뇌파에서는 전두엽(F3, F4)과 두정엽(C3, C4) 총 네 군데 영역에서 각 3개의 주파수 파워특징을 추출하여 총 12개의 특징벡터를 사용하였다
두 번째 층 역시 노드 개수가 늘어들수록 시작 오차가 줄어들지만, 노드 개수가 어느 정도 이상이 되면 시작 오차가 커지고 열 번 반복 후에도 오차가 다른 경우보다 커지는 것을 확인할 수 있다. 따라서 열 번 반복 후 오차가 가장 작은 3개를 두 번째 층의 노드 개수로 설정했다.
또한, 맥파의 간접 유도를 통하여 맥파 전달시간 특징을 추출했다. 맥파 신호를 통한 R 피크 및 맥파 주기의 최하점을 이용하여 혈류량의 시차를 맥파 전달시간으로 정의하며 맥파 전달시간의 평균과 표준편차를 특징으로 선택하였다.
본 논문에서는 DBN의 우수성을 확인하기 위하여 유사한 방법으로 학습되지만 RBM을 사용하지 않는 오류 역전파 알고리즘을 통하여 두 알고리즘의 성능을 분석해보고자 했다. 또한, 시각 자극에서 감정 유발이 잘 되는 구간을 학습데이터로 사용하여 DBN 및 오류 역전파 알고리즘을 학습한 후 같은 5개의 테스트 데이터를 이용하여 성능을 분석했다.
본 연구에서는 감정 판별의 한계를 해결하기 위하여 감정 자극 시 중추신경계 및 자율신경계의 생체신호를 종합적으로 획득하여 객관적인 판별을 하고자 했다. 또한, 영상 자극에서 획득된 감정 신호를 연속적으로 보기 위하여 생체신호를 창 이동(Sliding Window) 시켜주어 특징을 추출했다. 개인 또는 영상에 따른 감정의 모호함을 해결하기 위해 사용한 방법인 비교사학습을 통하여 진행되는 RBM으로 확률을 기반으로 감정을 판별하여 주었다(Chen & Murray, 2003).
또한, 맥파의 간접 유도를 통하여 맥파 전달시간 특징을 추출했다. 맥파 신호를 통한 R 피크 및 맥파 주기의 최하점을 이용하여 혈류량의 시차를 맥파 전달시간으로 정의하며 맥파 전달시간의 평균과 표준편차를 특징으로 선택하였다. 맥파 전달시간의 평균은 Equation 7을 이용하여 계산하며 R∼ P는 R 피크와 맥파의 최하점 사이의 시간 간격을 나타내며 the # of R∼ P는 간격들의 개수를 나타낸다.
본 논문에서는 이와 같은 특성을 가지는 DBN을 이용하여 감정 패턴 분류기를 구성했다. RBM은 개인 또는 영상에 의하여 발생하는 감정을 확률적으로 판단하여 가중치를 갱신하며, 입력으로 사용된 특징들을 다른 차원으로 매핑시켜주는 역할을 한다.
DBN을 이용한 감정 패턴 분류기를 설계하기 위하여 임의로 RBM의 초기 조건을 설정하여 주었다. 본 논문에서는 학습률은 0.1, 배치데이터의 수는 10개,RBM의 반복 횟수는 10번으로 임의 설정 값을 통하여 노드 개수와 RBM 층의 개수를 먼저 정하였다.
본 연구에서는 시각자극인 비디오 영상을 통하여 행복, 슬픔, 공포, 보통 시의 4가지 감정상태에 대한 생체신호를 취득하였다. 사용된 감정유발 영상은 각각 ‘맘마미아(mamma mia)’, ‘풀빵엄마’, ‘쏘우3 (saw3)’, ‘역사스페셜’이다.
통계적인 방법으로 특징에 따라 피험자별 감정분류의 차이를 확인하는 데는 한계가 있어 감정 패턴 분류기를 설계하여 감정을 판별하고자 한다. 분류기의 성능은 정규화 된 데이터를 이용하여 5-fold Cross Validation 과정을 통해 검증하였다.
피험자는 아무런 자극이 없는 상태로 30분간 휴식을 취한 후 진행되었다. 실험은 총 75분으로 구성되었으며, 처음 15분 동안은 다큐멘터리 영상을 시청하도록 하여 참조 값을 측정하였고 나머지 60분 동안은 감정유발 영상을 시청하도록 진행되었다. 총 4개의 감정유발 영상을 하루에 한 개씩 시청하여 총4일 간 실험을 진행하였다(Choi, 2011).
우수한 성능을 가지는 감정 패턴 분류기를 설계하는 방법으로 본 연구에서는 DBN를 이용한 다층 신경회로망을 구성했다. 본 연구에서 설계된 감정 패턴 분류기는 시각 영상 자극을 통한 인간의 감정을 판별할 때 우수한 성능을 가질 것으로 보이며, 추후 인지과학 및 HCI 분야 등에서 활용 가능할 것으로 보인다(Cowie et al.
위와 같은 결과들을 통하여 본 논문에서는 감정 패턴 분류를 위한 DBN을 설계하기 위한 최종 조건으로 총층의 개수는 3개, 각 층의 노드 개수는 첫 번째 층부터 4개, 3개, 2개로 설정하였으며, 학습률은 0.5, 배치데이터의 개수는 20개, 반복 횟수는 10번으로 설정하였다
이에 따라 본 논문에서는 시각 영상 자극을 활용하는 경우, 감정 유발 및 판별의 정확도가 떨어지는 한계가 있기 때문에 이를 해결하기 위하여 생체신호를 이용하여 교사학습 및 확률적 해석과 비교사학습이 이루어지는 Deep Belief Network (DBN) 모델링을 통해 보다 높은 정확도를 가지는 향상된 감정 상태 분류기를 설계하였다.
그러나 열 번의 반복을 거쳤을 경우 노드 수가 커질수록 노드 간 오차가 줄어든다. 첫 번째 층의 경우에는 시작 오차와 상관없이 열 번의 반복을 거치면 오차가 비슷해지는 것을 볼 수 있으므로 적당한 열 번의 반복을 통한 오차 수렴 정도와 계산 복잡도를 고려하여 첫 번째 층의 노드 개수는 4개로 설정했다.
실험은 총 75분으로 구성되었으며, 처음 15분 동안은 다큐멘터리 영상을 시청하도록 하여 참조 값을 측정하였고 나머지 60분 동안은 감정유발 영상을 시청하도록 진행되었다. 총 4개의 감정유발 영상을 하루에 한 개씩 시청하여 총4일 간 실험을 진행하였다(Choi, 2011).
통계적인 방법으로 특징에 따라 피험자별 감정분류의 차이를 확인하는 데는 한계가 있어 감정 패턴 분류기를 설계하여 감정을 판별하고자 한다. 분류기의 성능은 정규화 된 데이터를 이용하여 5-fold Cross Validation 과정을 통해 검증하였다.
자극유발 영상 시작 후 초기 5분 데이터는 감정의 유발이 일어나지 않는다는 가정 하에 이를 제외한 55분 데이터에서 특징을 추출했다. 특징은 획득 데이터에 5분 기반 창(Window)을 사용하여 계산하였으며 30초씩 창 이동(Sliding Window)을 하였다. 이에 따라 한 개의 감정자극 실험에서 100개의 데이터를 얻을 수 있었으며, 피험자 1명당 400개의 데이터 세트를 추출하였다.
피부 온도는 감정에 따라 체온이 올라가거나 떨어지는 반응을 보이기 때문에 구간에 따른 온도의 평균과 표준편차 총 2가지를 특징으로 선정했다. 피부 온도의 특징은 Equation 12와 Equation 13에 의하여 구할 수 있으며 T는 시간을 나타낸다(Haag et al.
피부전도도는 250 Hz로 측정된 신호를 20 Hz로 다운샘플링(Down-sampling)하여 특징을 추출하였다. 감정에 따른 전압 차이를 보기 위해 피부전도도의 평균 및 표준편차를 특징으로 선택하였으며 이는 Equation 9와 Equation 10에 의하여 구할 수 있다.
대상 데이터
세 번째 층에서는 마지막 반복 시 오차가 배치데이터의 개수에 따라 차이를 가졌으나 시작 오차는 큰 차이를 보이지 않음을 확인할 수 있다. 따라서 배치데이터의 개수는 알고리즘의 속도를 고려하여 오차가 크게 차이가 없는 20개로 설정했다.
사용된 감정유발 영상은 각각 ‘맘마미아(mamma mia)’, ‘풀빵엄마’, ‘쏘우3 (saw3)’, ‘역사스페셜’이다.
특징은 획득 데이터에 5분 기반 창(Window)을 사용하여 계산하였으며 30초씩 창 이동(Sliding Window)을 하였다. 이에 따라 한 개의 감정자극 실험에서 100개의 데이터를 얻을 수 있었으며, 피험자 1명당 400개의 데이터 세트를 추출하였다.
피험자는 건강에 이상이 없는 평균 60세의 노년층 여성 10명을 대상으로 진행되었다. 피험자의 생체신호는 BIOPAC MP 150TM을 이용하여 측정하였으며 1 kHz로 샘플링 한 뇌파, 맥파, 피부전도도 및 피부 온도 데이터를 획득하였다.
피험자는 건강에 이상이 없는 평균 60세의 노년층 여성 10명을 대상으로 진행되었다. 피험자의 생체신호는 BIOPAC MP 150TM을 이용하여 측정하였으며 1 kHz로 샘플링 한 뇌파, 맥파, 피부전도도 및 피부 온도 데이터를 획득하였다. 뇌파는 10-20 시스템을 기준으로 하여 전두엽(F3, F4)과 두정엽(C3, C4)에서측정되었으며, 기준전극으로 피험자의 왼쪽 귀를 사용하였다.
데이터처리
4가지 감정 별 조건에 따라 추출되는 24개의 특징값들에 대해 일원분산분석과 Tukey 사후검정을 시행하였다. 일원분산분석 결과 맥파의 SDNN, RMSSD,주파수파워비(LF/HF), 맥파전달속도의 표준편차, 체온 평균 특징에 대해서 일부 피험자의 경우 유의미한 차이를 확인하지 못하였으나 나머지 특징들에서는 유의미한 차이(P<0.
어떠한 생체신호가 입력으로 사용되는가에 따라 분류기의 성능은 변화한다. 따라서 생체신호에 따른 DBN의 성능을 분석하고자 하였으며 이는 Table 2를 통하여 나타내었고, 정확도는 5-fold Cross Validation의 평균 정확도를 사용했다.
표준편차는 SD로 나타내었으며 Equation 8을 통하여 구하였다(Malik & Camm, 1990).
이론/모형
피부전도도는 250 Hz로 측정된 신호를 20 Hz로 다운샘플링(Down-sampling)하여 특징을 추출하였다. 감정에 따른 전압 차이를 보기 위해 피부전도도의 평균 및 표준편차를 특징으로 선택하였으며 이는 Equation 9와 Equation 10에 의하여 구할 수 있다. 아래 식들의 N은 샘플 수를 의미한다.
개인 또는 영상에 따른 감정의 모호함을 해결하기 위해 사용한 방법인 비교사학습을 통하여 진행되는 RBM으로 확률을 기반으로 감정을 판별하여 주었다(Chen & Murray, 2003).
영점교차율은 감정의 변화에 따라 교감신경이 활발해지며 진동이 일어나고, 이를 통해 에너지가 집중되는 주파수 영역을 보여준다. 영점교차율은 신호의 미분(Differential)을 통하여 검출할 수 있고 이는 Equation 11를 이용하여 구한다. s는 신호의 크기, w는 창함수이며 N개의 샘플된 신호에서 n부터 m까지의 구간의 영점교차율을 구한다(Lisetti & Nasoz,2004).
성능/효과
Table 1에서 볼 수 있듯이 DBN는 모두 90% 이상으로 평균 94%의 정확도를 가졌으며 오류 역전파 알고리즘의 평균 정확도인 40% 보다 50% point 더 높은 정확도를 가지는 것을 확인할 수 있다. 감정 유발이 잘 되는 구간을 학습데이터로 사용한 경우 DBN의결과가 가장 우수함을 확인할 수 있었으며 DBN의 경우보다 평균 정확도가 약 0.
75%의 정확도를 가졌다. 가장 낮은 정확도를 가지는 경우는 피부 온도만 사용한 경우로 약 25%의 정확도를 가졌으며, 맥파만 사용하였을 경우 역시 33%로 낮은 정확도를 가졌다.
Table 1에서 볼 수 있듯이 DBN는 모두 90% 이상으로 평균 94%의 정확도를 가졌으며 오류 역전파 알고리즘의 평균 정확도인 40% 보다 50% point 더 높은 정확도를 가지는 것을 확인할 수 있다. 감정 유발이 잘 되는 구간을 학습데이터로 사용한 경우 DBN의결과가 가장 우수함을 확인할 수 있었으며 DBN의 경우보다 평균 정확도가 약 0.75% 더 높은 것을 볼 수 있었지만 뚜렷하게 큰 차이는 보이지 않았다.
추출한 모든 생체신호인 뇌파, 맥파, 피부전도도, 피부 온도를 입력으로 사용한 경우 DBN은 약 94%의 가장 높은 정확도를 가졌다. 다음으로 피부 온도를 제외한 뇌파, 맥파, 피부전도도를 사용하였을 경우 약 87.75%의 정확도를 가졌다. 가장 낮은 정확도를 가지는 경우는 피부 온도만 사용한 경우로 약 25%의 정확도를 가졌으며, 맥파만 사용하였을 경우 역시 33%로 낮은 정확도를 가졌다.
4개의 노드를 가지는 RBM 층을 쌓은 후 두 번째 층 역시 첫 번째 층과 같이 오차를 구했다. 두 번째 층 역시 노드 개수가 늘어들수록 시작 오차가 줄어들지만, 노드 개수가 어느 정도 이상이 되면 시작 오차가 커지고 열 번 반복 후에도 오차가 다른 경우보다 커지는 것을 확인할 수 있다. 따라서 열 번 반복 후 오차가 가장 작은 3개를 두 번째 층의 노드 개수로 설정했다.
두 번째로 RBM을 통하여 DBN을 구성하므로 오류 역전파 알고리즘이 가지는 문제점을 해결할 수 있었으나 DBN를 설계하는 과정에서 학습률, 배치데이터 개수, 학습 횟수 등의 가변적인 요소가 존재하였다. 이러한 요소들을 더욱 최적화시켜줄 수 있다면 감정 패턴 분류기의 성능이 개선될 가능성을 가진다.
먼저 DBN은 RBM의 노드 개수 및 층수에 따라 성능이 결정되는데 노드 개수와 층수가 높을수록 복잡도가 증가하므로 판별의 정확도를 높이지만 너무 높은 층을 올리게 되면 오히려 알고리즘 성능이 떨어지는 결과를 가지게 되므로 적당한 노드 개수를 찾고 RBM 층을 쌓는 것이 중요하다. 두 번째로 학습률은 너무 낮으면 알고리즘 속도가 느려지고 너무 크면 지역 최저점에 빠지는 문제를 가진다. 세 번째로 초기입력을 데이터 하나하나 입력하는 패턴모드(Pattern Mode)로 선택할 것인가 한꺼번에 여러 개의 데이터를 입력으로 사용하는 배치모드(Batch Mode)를 선택할 것인가에 따라 성능이 바뀔 수 있다.
한 종류의 생체신호만 사용한 경우 뇌파를 제외하고 모두 50% 미만의 정확도를 가졌으며 뇌파 역시 51%의 정확도를 가짐을 볼 수 있다. 두 종류의 생체신호를 사용한 경우는 한 종류의 생체신호만 사용한 경우와 비교하여 정확도가 높아졌으나 맥파와 피부 온도를 생체신호로 사용한 경우 37.5%의 낮은 정확도를 가지는 것을 확인할 수 있다. 이와 반대로 뇌파와 피부전도도를 사용한 경우 78.
생체신호 별로 DBN의 성능을 비교한 결과 중추신경계 및 자율신경계의 특징을 모두 사용한 경우가 가장 좋은 성능을 보임을 확인했다. 또한, 생체신호가 하나만 특징으로 들어간 경우 50% 정도 혹은 그 이하의 정확도를 가지며 감정 패턴 분류기로서 좋은 성능을 가지지 못함을 확인하였다. 그러나 중추신경계 신호인 뇌파의 경우 특징으로 뇌파신호만 사용되어도 51%의 정확도를 확인하였으며, 이에 따라 뇌파가 감정 판별을 하는데 주요한 역할을 함을 볼 수 있다.
본 논문에서는 반복 수행을 통한 DBN의 설계 결과 평균 정확도가 94%인 감정 패턴 분류기의 구현이 가능했다. 또한, 이는 RBM을 사용하지 않고 랜덤한가중치 값을 통하여 분류하는 오류 역전파 알고리즘의 평균 정확도인 40% 보다 50% point 높은 정확도를 가지므로 감정 패턴 분류기로서 우수한 성능을 가짐을 알 수 있다.
본 논문에서는 반복 수행을 통한 DBN의 설계 결과 평균 정확도가 94%인 감정 패턴 분류기의 구현이 가능했다. 또한, 이는 RBM을 사용하지 않고 랜덤한가중치 값을 통하여 분류하는 오류 역전파 알고리즘의 평균 정확도인 40% 보다 50% point 높은 정확도를 가지므로 감정 패턴 분류기로서 우수한 성능을 가짐을 알 수 있다.
생체신호 별로 DBN의 성능을 비교한 결과 중추신경계 및 자율신경계의 특징을 모두 사용한 경우가 가장 좋은 성능을 보임을 확인했다. 또한, 생체신호가 하나만 특징으로 들어간 경우 50% 정도 혹은 그 이하의 정확도를 가지며 감정 패턴 분류기로서 좋은 성능을 가지지 못함을 확인하였다.
세 번째 층 및 네 번째 층의 오차는 노드 개수가 변화해도 큰 차이를 보이지 않았으며 반복 횟수에 따라서도 많은 변화가 없었다. 따라서 세 번째 층은 열 번의 반복 후 가장 작은 오차를 가지는 2개의 노드를 선택했다.
배치데이터의 개수는 줄어들수록 오차가 작아짐을 세 개의 층 모두에서 확인할 수 있다. 세 번째 층에서는 마지막 반복 시 오차가 배치데이터의 개수에 따라 차이를 가졌으나 시작 오차는 큰 차이를 보이지 않음을 확인할 수 있다. 따라서 배치데이터의 개수는 알고리즘의 속도를 고려하여 오차가 크게 차이가 없는 20개로 설정했다.
그러나 학습률이 높은 경우에는 오차가 크게 줄어듦을 볼 수 있다. 세 번째 층에서의 결과를 확인하면 학습률이 높은 경우에는 오차의 변화가 있음을 알 수 있다. 하지만 학습률이 1 이상인 경우 오차가 다른 경우에 비해 높은 것을 볼 수 있으며 같은 반복 횟수 내에서 지역 최적화 될 가능성을 가지므로 학습률은 0.
두 번째로 학습률은 너무 낮으면 알고리즘 속도가 느려지고 너무 크면 지역 최저점에 빠지는 문제를 가진다. 세 번째로 초기입력을 데이터 하나하나 입력하는 패턴모드(Pattern Mode)로 선택할 것인가 한꺼번에 여러 개의 데이터를 입력으로 사용하는 배치모드(Batch Mode)를 선택할 것인가에 따라 성능이 바뀔 수 있다. 적당한 크기의 배치데이터 크기는 알고리즘의 성능을 높이며 학습 시간을 줄일 수 있다.
5%의 비교적 높은 정확도를 가졌으며 이는 뇌파, 맥파 그리고 피부 온도를 사용한 경우와 같은 정확도를 가짐을 볼 수 있다. 세종류의 생체신호를 사용한 경우는 모두 오류 역전파 알고리즘을 사용한 결과보다 우수한 정확도를 가짐을 확인할 수 있었으나 뇌파를 제외한 생체신호들을 사용한 경우 57.25%로 뇌파를 생체신호로 선택한 경우에 비하여 낮은 정확도를 보임을 알 수 있다.
일원분산분석 결과 맥파의 SDNN, RMSSD,주파수파워비(LF/HF), 맥파전달속도의 표준편차, 체온 평균 특징에 대해서 일부 피험자의 경우 유의미한 차이를 확인하지 못하였으나 나머지 특징들에서는 유의미한 차이(P<0.05)를 확인하였다.
추출한 모든 생체신호인 뇌파, 맥파, 피부전도도, 피부 온도를 입력으로 사용한 경우 DBN은 약 94%의 가장 높은 정확도를 가졌다. 다음으로 피부 온도를 제외한 뇌파, 맥파, 피부전도도를 사용하였을 경우 약 87.
또한, 뇌파와 피부전도도만을 사용한 경우는 뇌파, 맥파, 피부 온도를 사용한 경우와 같은 정확도를 보이므로 실험의 복잡도 및 계산 복잡도를 고려한다면 분류기가 같은 성능을 내는 경우 뇌파와 피부전도도를 통한 감정의 분류도 가능할 것으로 사료된다. 피부 온도는 가장 낮은 정확도를 보였으며 피부 온도를 사용한 경우 정확도는 많이 증가하지 않는 것을 보았다. 이는 피부 온도가 외부 요인에 민감하므로 감정자극에 의하여서도 변하지만, 외부온도 즉, 실내온도 등의 영향도 받기 때문으로 사료된다.
후속연구
이러한 요소들을 더욱 최적화시켜줄 수 있다면 감정 패턴 분류기의 성능이 개선될 가능성을 가진다. 따라서 이와 같은 가변적인 요소를 최적화시켜줄 수 있는 추가 연구가 필요할 것으로 사료된다.
마지막으로 본 연구에서는 알고리즘을 확률적으로 해석하였으나 한 명의 개인 데이터로부터 확률적 학습을 하였기 때문에 각각의 개인마다 알고리즘의 조건을 최적화해야 한다는 한계점을 가진다. 따라서 추후에는 알고리즘의 일반화를 통하여 모든 피험자 데이터를 만족하게 하는 알고리즘 구현에 관한 연구가 필요하다.
감정 판별 시 80%가 넘는 정확도를 가지는 모델을 설계하기 위해서는 생체신호를 세 가지 이상 사용하여야 하며, 이때 뇌파와 피부전도도는 반드시 사용되어야 하는 특징으로 볼 수 있다. 또한, 뇌파와 피부전도도만을 사용한 경우는 뇌파, 맥파, 피부 온도를 사용한 경우와 같은 정확도를 보이므로 실험의 복잡도 및 계산 복잡도를 고려한다면 분류기가 같은 성능을 내는 경우 뇌파와 피부전도도를 통한 감정의 분류도 가능할 것으로 사료된다. 피부 온도는 가장 낮은 정확도를 보였으며 피부 온도를 사용한 경우 정확도는 많이 증가하지 않는 것을 보았다.
향후 감정 패턴 분류기의 설계를 위한 실험 시 시각 영상 자극이 모든 피험자에게 작용이 되는지에 관한 고찰이 필요하며 더 효율적인 실험 프로토콜을 통한 데이터 획득이 필요하다. 또한, 데이터 획득 과정에서 피험자는 노년층 여성을 대상으로 하였는데 이는 앞으로 다양한 연령층과 성별을 대상으로 데이터를 획득하여 비교할 수 있을 것으로 보인다.
마지막으로 본 연구에서는 알고리즘을 확률적으로 해석하였으나 한 명의 개인 데이터로부터 확률적 학습을 하였기 때문에 각각의 개인마다 알고리즘의 조건을 최적화해야 한다는 한계점을 가진다. 따라서 추후에는 알고리즘의 일반화를 통하여 모든 피험자 데이터를 만족하게 하는 알고리즘 구현에 관한 연구가 필요하다.
우수한 성능을 가지는 감정 패턴 분류기를 설계하는 방법으로 본 연구에서는 DBN를 이용한 다층 신경회로망을 구성했다. 본 연구에서 설계된 감정 패턴 분류기는 시각 영상 자극을 통한 인간의 감정을 판별할 때 우수한 성능을 가질 것으로 보이며, 추후 인지과학 및 HCI 분야 등에서 활용 가능할 것으로 보인다(Cowie et al., 2001).
향후 감정 패턴 분류기의 설계를 위한 실험 시 시각 영상 자극이 모든 피험자에게 작용이 되는지에 관한 고찰이 필요하며 더 효율적인 실험 프로토콜을 통한 데이터 획득이 필요하다. 또한, 데이터 획득 과정에서 피험자는 노년층 여성을 대상으로 하였는데 이는 앞으로 다양한 연령층과 성별을 대상으로 데이터를 획득하여 비교할 수 있을 것으로 보인다.
참고문헌 (20)
Chen, H., & Murray, A. F. (2003). Continuous Restricted Boltzmann Machine with an Implementable Training Algorithm. In Vision, Image and Signal Processing, IEEE Proceeding-, 150(3), 153-158.
Choi, W. (2011). A Classification Analysis of Negative Emotion Based on PPG Signal Using Fuzzy-Ga. master's thesis, Yonsei University, Seoul.
Cowie, R., Douglas-Cowie, E., Tsapatsoulis, N., Votsis, G., Kollias, S., Fellenz, W., & Taylor, J. G. (2001). Emotion Recognition in Human-Computer Interaction. Signal Processing Magazine, IEEE, 18(1), 32-80.
Guang-yuan, L., & Min, H. (2009). Emotion Recognition of Physiological Signals Based on Adaptive Hierarchical Genetic Algorithm. In 2009 World Congress on Computer Science and Information Engineering, 670-674.
Haag, A., Goronzy, S., Schaich, P., & Williams, J. (2004). Emotion Recognition Using Bio-Sensors: First Steps Towards an Automatic System. In Tutorial and Research Workshop on Affective Dialogue Systems, 36-48.
Hinton, G. E., Osindero, S., & Teh, Y.-W. (2006). A Fast Learning Algorithm for Deep Belief Nets. Neural Computation, 18(7), 1527-1554.
Jerritta, S., Murugappan, M., Nagarajan, R., & Wan, K. (2011). Physiological Signals Based Human Emotion Recognition: A Review. In Signal Processing and its Applications (CSPA), 2011 IEEE 7th International Colloquium on, 410-415.
Khashman, A. (2008). A Modified Backpropagation Learning Algorithm with Added Emotional Coefficients. Neural Networks, IEEE Transactions on, 19(11), 1896-1909.
Krause, R. (1987). Universals and Cultural Differences in the Judgments of Facial Expressions of Emotion. Journal of Personality and Social Psychology, 53(4), 712-717.
LeCun, Y., & Ranzato, M. (2013). Deep Learning Tutorial. In Tutorials in International Conference on Machine Learning (ICML13), Citeseer.
Lisetti, C. L., & Nasoz, F. (2004). Using Noninvasive Wearable Computers to Recognize Human Emotions from Physiological Signals. EURASIP Journal on Advances in Signal Processing, 11, 1-16.
Malik, M., & Camm, A. J. (1990). Heart Rate Variability. Clinical Cardiology, 13(8), 570-576.
Moretti, D. V., Babiloni, C., Binetti, G., Cassetta, E., Dal Forno, G., Ferreric, F., & Nobili, F. (2004). Individual Analysis of Eeg Frequency and Band Power in Mild Alzheimer's Disease. Clinical Neurophysiology, 115(2), 299-308.
Murugappan, M., Ramachandran, N., & Sazali, Y. (2010). Classification of Human Emotion from Eeg Using Discrete Wavelet Transform. Journal of Biomedical Science and Engineering, 3, 390-396.
Niu, X., Chen, L., & Chen, Q. (2011). Research on Genetic Algorithm Based on Emotion Recognition Using Physiological Signals. In 2011 International Conference on Computational Problem-Solving, 614-618.
Peng, Y., Zhu, J.-Y., Zheng, W.-L., & Lu, B.-L. (2014). Eeg-Based Emotion Recognition with Manifold Regularized Extreme Learning Machine. In Engineering in Medicine and Biology Society (EMBC), 2014 36th Annual International Conference of the IEEE, 974-977.
Schaaff, K., & Schultz, T. (2009). Towards Emotion Recognition from Electroencephalographic Signals. In 2009 3rd International Conference on Affective Computing and Intelligent Interaction and Workshops, 1-6.
Wang, D., & Shang, Y. (2013). Modeling Physiological Data with Deep Belief Networks. International of Journal Information and Education Technology (IJIET), 3(5), 505-511.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.