뇌파의 의사 결정 트리 분석과 가능성 기반 서포트 벡터 머신 분석을 통한 우울증 환자의 분류 EEG Classification for depression patients using decision tree and possibilistic support vector machines원문보기
우울증은 가장 유병율이 높은 '기분 장애'(mood disorder)의 일종으로, 약 20%의 인구가 일생동안 우울증 증상을 한번쯤 경험한다. 이러한 우울증은 크게 '우울 장애'(major depressive disorder)와 '양극성 장애'(bipolar disorder)로 구분된다. 환자의 질병 분류에 따라 사용되는 약과 의학적 처방이 다르기 때문에, 우울증 환자의 빠르고 정확한 진단 및 분류는 매우 중요하다. 기존의 다면성 인성검사(MMPI)와 같은 통계적인 방법이 우울증 환자의 진단을 위해 사용돼 왔으나, 장시간의 집중력을 요구하기 때문에 집중력 저하의 특징을 보이는 우울증 환자들에게 적용하는데 어려움이 있다. 이 논문에서는 이러한 문제를 해결하고자, 빠른 측정이 가능하고 측정동안 집중력을 요하지 않는 EEC 데이터의 분석을 통해 우울증 환자의 분류를 시도하였다. EEG 채널 간 정보 흐름에서의 비선형성과 근사 엔트로피(approximate entropy)의 크기를 속성(attribute)으로 사용하여 데이터 마이닝 기법 중 의사 결정 트리(decision tree)와 가능성 기반 서포트 벡터머신(possibilistic support vector machines) 통해 분석을 수행하였다. 30명의 주요 우울장애환자와 24명의 양극성 장애 환자를 통해 위의 분석을 수행한 결과 의사 결정 트리의 경우 85.19% 의 정확도를 가지며 분류해냈고, 가능성 기반 서포트 벡터머신의 경우 77.78%의 정확도를 보여줬다. 본 연구는 가능성 기반 서포트 벡터 머신 분석이 우울증 환자는 진단하고 분류하는데 유용하게 적용될 수 있는 가능성을 제시하고 있다.
우울증은 가장 유병율이 높은 '기분 장애'(mood disorder)의 일종으로, 약 20%의 인구가 일생동안 우울증 증상을 한번쯤 경험한다. 이러한 우울증은 크게 '우울 장애'(major depressive disorder)와 '양극성 장애'(bipolar disorder)로 구분된다. 환자의 질병 분류에 따라 사용되는 약과 의학적 처방이 다르기 때문에, 우울증 환자의 빠르고 정확한 진단 및 분류는 매우 중요하다. 기존의 다면성 인성검사(MMPI)와 같은 통계적인 방법이 우울증 환자의 진단을 위해 사용돼 왔으나, 장시간의 집중력을 요구하기 때문에 집중력 저하의 특징을 보이는 우울증 환자들에게 적용하는데 어려움이 있다. 이 논문에서는 이러한 문제를 해결하고자, 빠른 측정이 가능하고 측정동안 집중력을 요하지 않는 EEC 데이터의 분석을 통해 우울증 환자의 분류를 시도하였다. EEG 채널 간 정보 흐름에서의 비선형성과 근사 엔트로피(approximate entropy)의 크기를 속성(attribute)으로 사용하여 데이터 마이닝 기법 중 의사 결정 트리(decision tree)와 가능성 기반 서포트 벡터머신(possibilistic support vector machines) 통해 분석을 수행하였다. 30명의 주요 우울장애환자와 24명의 양극성 장애 환자를 통해 위의 분석을 수행한 결과 의사 결정 트리의 경우 85.19% 의 정확도를 가지며 분류해냈고, 가능성 기반 서포트 벡터머신의 경우 77.78%의 정확도를 보여줬다. 본 연구는 가능성 기반 서포트 벡터 머신 분석이 우울증 환자는 진단하고 분류하는데 유용하게 적용될 수 있는 가능성을 제시하고 있다.
Depression is the most common and widespread mood disorder. About 20% of the population might suffer a major, incapacitating episode of depression during their lifetime. This disorder can be classified into two types: major depressive disorders and bipolar disorder. Since pharmaceutical treatments a...
Depression is the most common and widespread mood disorder. About 20% of the population might suffer a major, incapacitating episode of depression during their lifetime. This disorder can be classified into two types: major depressive disorders and bipolar disorder. Since pharmaceutical treatments are different according to types of depression disorders, correct and fast classification is quite critical for depression patients. Yet, classical statistical method, such as minnesota multiphasic personality inventory (MMPI), have some difficulties in applying to depression patients, because the patients suffer from concentration. We used electroencephalogram (EEG) analysis method fer classification of depression. We extracted nonlinearity of information flows between channels and estimated approximate entropy (ApEn) for the EEG at each channel. Using these attributes, we applied two types of data mining classification methods: decision tree and possibilistic support vector machines (PSVM). We found that decision tree showed 85.19% accuracy and PSVM exhibited 77.78% accuracy for classification of depression, 30 patients with major depressive disorder and 24 patients having bipolar disorder.
Depression is the most common and widespread mood disorder. About 20% of the population might suffer a major, incapacitating episode of depression during their lifetime. This disorder can be classified into two types: major depressive disorders and bipolar disorder. Since pharmaceutical treatments are different according to types of depression disorders, correct and fast classification is quite critical for depression patients. Yet, classical statistical method, such as minnesota multiphasic personality inventory (MMPI), have some difficulties in applying to depression patients, because the patients suffer from concentration. We used electroencephalogram (EEG) analysis method fer classification of depression. We extracted nonlinearity of information flows between channels and estimated approximate entropy (ApEn) for the EEG at each channel. Using these attributes, we applied two types of data mining classification methods: decision tree and possibilistic support vector machines (PSVM). We found that decision tree showed 85.19% accuracy and PSVM exhibited 77.78% accuracy for classification of depression, 30 patients with major depressive disorder and 24 patients having bipolar disorder.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
우울증 증세 또한 뇌의 비정상적인 활동과 연관이 있음이 알려지면서 뇌의 활동 정도를 측정하는 방법이 우울증의 분류와 연관이 있을 것으로 생각되기 때문이다. 따라서 이 논문에서는, 우울 증상을 보이는 특정 환자에게서 뇌의 활동 정도를 뇌파(EEG)를 이용하여 측정하고, 그 데이터분석을 이용하여 우울증 환자의 질병 분류에 사용할 수 있는 가능성을 보였다.
이 논문에서는 우울증 환자의 분류를 위한 뇌파(EEG)를 사용한 방법을 제시하였다. 뇌파(EEG)를 통한 분석은 환자가 단순히 뇌파(EEG) 측정 장치를 부착하고 1~2분 동안 누워있으면 측정이 완료되고, 이렇게 측정된 데이터를 분석기에 넣어 결과가 나오는데 5분 이하가 소요되는 테스트이다.
제안 방법
EEG 측정은 총 16 위치(그림 1, F7, T3, Fpl, F3, C3, P3, 01, F8, T4, T5, T6, Fp2, F4, C4, P4, and 02)에 대하여 깨어있고 편하게 누워, 눈을 감은 상태에서 400Hz로 120초 동안 지속적으로 측정되었다(48000 data points at sampling frequency of 400 Hz).
두 환자 그룹의 뇌파의 차이를 판별하기 위해 데이터 마이닝(data mining) 기법을 사용하였으며, 데이터 마이닝 기법을 위한 속성 값으로 뇌파(EEG) 채널사이 정보흐름에서의 비성형도(nonlinearity) 양과 근사 엔트로피 (approximate en-tropy)의 크기를 속성으로 선택하였다. 즉, 16가지 채널의 가능한 두 채널간의 연결 120개(16C2)의 정보 흐름(information flow)에서 Tanaka의 비선형도(nonlinearity) 측정기법을 이용하여 얻어진 비선형도(nonlinearity) 값, 그리고 16 채널 각각의 위치에서느 근사 엔트로피(approximate entropy)값을 측정하고, 이를 이용하여 총 136개(비선형도 120개 + 근사 엔트로피 16개)의 속성(attributes)을 생성하였다(Bruhn, Jorgen et al.
12816) 모두 데이터마이닝의 속성(attribute)으로 사용하였다. 따라서 데이터마이닝에 사용된 테이블에는 각 환자의 EEG별로 32개의 속성(attribute)을 가지고 있으며, 주요 우울 환자(major depressive disorder) 30명, 양극성 장애(bipolar disorder) 24명에 대하여 각각 30 * 32, 24 * 32 테이블을 생성하고 이를 이용하여 데이터 마이닝 테크닉을 통해 분석하였다.
이 논문에서는 데이터마이닝(datamining)의 2가지 기술을 적용하여 환자를 분류하였다. 첫 번째 기법은 의사 결정트리(decision tree) 로써, 환자를 구분하는데 쓰이는 속성(attribute)을 손쉽게 확인할 수 있고 해석 또한 용이하다.
이러한 단점을 피하기 위해서 이 논문에서는 빠른 측정이 가능하고 측정동안 집중력을 요하지 않는 뇌파(EEG; electroencephalogram)의 분석을 통해 우울증 환자를 분류하였다. 우울증 증세 또한 뇌의 비정상적인 활동과 연관이 있음이 알려지면서 뇌의 활동 정도를 측정하는 방법이 우울증의 분류와 연관이 있을 것으로 생각되기 때문이다.
크기를 속성으로 선택하였다. 즉, 16가지 채널의 가능한 두 채널간의 연결 120개(16C2)의 정보 흐름(information flow)에서 Tanaka의 비선형도(nonlinearity) 측정기법을 이용하여 얻어진 비선형도(nonlinearity) 값, 그리고 16 채널 각각의 위치에서느 근사 엔트로피(approximate entropy)값을 측정하고, 이를 이용하여 총 136개(비선형도 120개 + 근사 엔트로피 16개)의 속성(attributes)을 생성하였다(Bruhn, Jorgen et al., 2000; Tanaka N et al., 2000).
대상 데이터
그림 1. 본 논문에서 사용된 16개의 채널 위치.
이 연구에서 우울증 분류에 사용된 환자는 주요 우울 장애(major depressive disorder) 환자 30명(나이: 평균=49.1666 표준편차 14.21045 남성: 10명 여성: 20명), 양극성 장애 bipolar disorder) 환자24명 (나이; 평균=37.75 표준편차 14.247 남성: 10명 여성: 14명)이다.
데이터처리
하지만 가능한 두 채널간의 연결 120개 (16C2)에는 채널간의 거리가 멀다거나, 정보의 흐름이 적어 의미가 없는 연결이 다수 존재한다. 따라서 두 그룹 간의 정보흐름(infdrmation flow)의 비선형도(nonlinearity)의 값의 차이를 T-검증(T-test)하여 p값이(p-val-ue) 0.3 초과인 채널 연결은, 두 환자그룹(주요 우울 장애와 양극성 장애)에서 통계적인 차이를 보이지 않는 것으로 간주하고 속성에서 삭제하였다. 그 결과 p값이 0.
이론/모형
근사 엔트로피(approximate entropy)의 경우 질병의 종류에 따라 다를 가능성이 있는 뇌 각 부분의 활성도를 측정하기 위해서 사용하였다(Steve Pincus, 1994 Bruhn, Jorgen et al., 2000). 근사 엔트로피(approximate entropy)의 경우 두 그룹 간에 차이를 T-검증을 통한 p값이(p-value) 앞의 비선형도(nonlinearity) 분석보다 작기 때문에 (평균: 0, 1742 표준편차: 0.
첫 번째 기법은 의사 결정트리(decision tree) 로써, 환자를 구분하는데 쓰이는 속성(attribute)을 손쉽게 확인할 수 있고 해석 또한 용이하다. 두번째 방법은 최근에 데이터의 클러스터링(chistering)과 분류(classifcation)에 많이 사용되고 있는 SVM(Support Vector Machine) 기법을 이용하였다. SVM기법은 의사 결정 트리 (Decision tree)와는 달리 몇 가지 속성(attribute)에만 의존하지 않고, 입력 데이터의 차원을 변경하면서 속성(attribute)들의 분석하기 때문에 조금 더 신빙성 있는 결과를 예측 할 수 있다(A Srivastava et al.
, 2005). 리브 원 아웃 메소드(leave-one-out method)를 사용하여 뇌파 데이터를 분석하였다. PSVM 기법을 통해 두 개의 그룹을 분류한 결과 77.
이 논문에서 사용한 SVM 메소드는 최근에 발표된 PSVM(Possibilistic support vector machines)을 사용하였다(Ki Young Lee. et al., 2005). 리브 원 아웃 메소드(leave-one-out method)를 사용하여 뇌파 데이터를 분석하였다.
이 논문에서는 의사 결정 트리(decision tree)의 그로잉 메소드(growing method) 알고리즘 중 QUEST를 이용하여 분석하였다(그림 2, SPSS사용. Significance level for splitting = 0.05, minimum parent node = 5, minimum child node = 5, maximum tree depth = 5 value interval = 10). 두 환자 그룹을 분류하는 첫 번째 속성(attribute) 값은 C3영역의 근사 엔트로피(approximate entropy)값의 크기로 0.
성능/효과
리브 원 아웃 메소드(leave-one-out method)를 사용하여 뇌파 데이터를 분석하였다. PSVM 기법을 통해 두 개의 그룹을 분류한 결과 77.7778%의 정확도를 보였다.
노드(node)3에 속하는 그룹의 경우 93, 3%가 양극성 장애에 해당되었으며, 노드(node)4에 속하는 그룹의 경우는 75%가 주요 우울증 환자로 판별되었다. 마찬가지로 노드(node)5에 속하는 그룹의 경우 83.
3%가 주요 우울환자로 분류되었고, 노드(node)6의 그룹에서는 80%가 양극성 장애환자로 구분되었다. 환자의 분류의 전체적인 정확도는 약 85.185%로 측정되었다.
후속연구
뇌파(EEG)를 통한 질병 진단이 아직까지 보편화가 되어있지 않고, 뇌파(EEG)의 어떠한 분석 기법이 가장 효용성이 있고 효율적인지 현 시점에서 밝혀지지 않았기 때문이다. 따라서 이 논문에서 제시된 뇌파(EEG) 분석 방법을 통해 환자의 질병 진단 빠르게 하되, 환자의 추후의 임상적인 증상에 기반을 두어 치료를 진행해가는 방향으로 사용되기를 제안한다. 마지막으로 뇌파(EEG)를 통한 질병의 분석 기법이 발전하기 위해 많은 분석 알고리즘의 개발 및 질병을 앓고 있는 환자의 뇌의 활동과 뇌파와의 관계에 대한 연구가 필요할 것이다.
따라서 이 논문에서 제시된 뇌파(EEG) 분석 방법을 통해 환자의 질병 진단 빠르게 하되, 환자의 추후의 임상적인 증상에 기반을 두어 치료를 진행해가는 방향으로 사용되기를 제안한다. 마지막으로 뇌파(EEG)를 통한 질병의 분석 기법이 발전하기 위해 많은 분석 알고리즘의 개발 및 질병을 앓고 있는 환자의 뇌의 활동과 뇌파와의 관계에 대한 연구가 필요할 것이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.