[논문]뇌파의 의사 결정 트리 분석과 가능성 기반 서포트 벡터 머신 분석을 통한 우울증 환자의 분류

심우현; 이기영; 채정호; 정재승; 이도헌

뇌파의 의사 결정 트리 분석과 가능성 기반 서포트 벡터 머신 분석을 통한 우울증 환자의 분류
EEG Classification for depression patients using decision tree and possibilistic support vector machines 원문보기

Bioinformatics and Biosystems, v.1 no.2, 2006년, pp.134 - 138

심우현 (한국과학기술원 바이오시스템학과) , 이기영 (한국과학기술원 바이오시스템학과) , 채정호 (가톨릭 의과대학교 신경정신과) , 정재승 (한국과학기술원 바이오시스템학과) , 이도헌 (한국과학기술원 바이오시스템학과)

초록
AI-Helper

우울증은 가장 유병율이 높은 '기분 장애'(mood disorder)의 일종으로, 약 20%의 인구가 일생동안 우울증 증상을 한번쯤 경험한다. 이러한 우울증은 크게 '우울 장애'(major depressive disorder)와 '양극성 장애'(bipolar disorder)로 구분된다. 환자의 질병 분류에 따라 사용되는 약과 의학적 처방이 다르기 때문에, 우울증 환자의 빠르고 정확한 진단 및 분류는 매우 중요하다. 기존의 다면성 인성검사(MMPI)와 같은 통계적인 방법이 우울증 환자의 진단을 위해 사용돼 왔으나, 장시간의 집중력을 요구하기 때문에 집중력 저하의 특징을 보이는 우울증 환자들에게 적용하는데 어려움이 있다. 이 논문에서는 이러한 문제를 해결하고자, 빠른 측정이 가능하고 측정동안 집중력을 요하지 않는 EEC 데이터의 분석을 통해 우울증 환자의 분류를 시도하였다. EEG 채널 간 정보 흐름에서의 비선형성과 근사 엔트로피(approximate entropy)의 크기를 속성(attribute)으로 사용하여 데이터 마이닝 기법 중 의사 결정 트리(decision tree)와 가능성 기반 서포트 벡터머신(possibilistic support vector machines) 통해 분석을 수행하였다. 30명의 주요 우울장애환자와 24명의 양극성 장애 환자를 통해 위의 분석을 수행한 결과 의사 결정 트리의 경우 85.19% 의 정확도를 가지며 분류해냈고, 가능성 기반 서포트 벡터머신의 경우 77.78%의 정확도를 보여줬다. 본 연구는 가능성 기반 서포트 벡터 머신 분석이 우울증 환자는 진단하고 분류하는데 유용하게 적용될 수 있는 가능성을 제시하고 있다.

Abstract ▼ AI-Helper

Depression is the most common and widespread mood disorder. About 20% of the population might suffer a major, incapacitating episode of depression during their lifetime. This disorder can be classified into two types: major depressive disorders and bipolar disorder. Since pharmaceutical treatments are different according to types of depression disorders, correct and fast classification is quite critical for depression patients. Yet, classical statistical method, such as minnesota multiphasic personality inventory (MMPI), have some difficulties in applying to depression patients, because the patients suffer from concentration. We used electroencephalogram (EEG) analysis method fer classification of depression. We extracted nonlinearity of information flows between channels and estimated approximate entropy (ApEn) for the EEG at each channel. Using these attributes, we applied two types of data mining classification methods: decision tree and possibilistic support vector machines (PSVM). We found that decision tree showed 85.19% accuracy and PSVM exhibited 77.78% accuracy for classification of depression, 30 patients with major depressive disorder and 24 patients having bipolar disorder.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

우울증 증세 또한 뇌의 비정상적인 활동과 연관이 있음이 알려지면서 뇌의 활동 정도를 측정하는 방법이 우울증의 분류와 연관이 있을 것으로 생각되기 때문이다. 따라서 이 논문에서는, 우울 증상을 보이는 특정 환자에게서 뇌의 활동 정도를 뇌파(EEG)를 이용하여 측정하고, 그 데이터분석을 이용하여 우울증 환자의 질병 분류에 사용할 수 있는 가능성을 보였다.
이 논문에서는 우울증 환자의 분류를 위한 뇌파(EEG)를 사용한 방법을 제시하였다. 뇌파(EEG)를 통한 분석은 환자가 단순히 뇌파(EEG) 측정 장치를 부착하고 1~2분 동안 누워있으면 측정이 완료되고, 이렇게 측정된 데이터를 분석기에 넣어 결과가 나오는데 5분 이하가 소요되는 테스트이다.

제안 방법

EEG 측정은 총 16 위치(그림 1, F7, T3, Fpl, F3, C3, P3, 01, F8, T4, T5, T6, Fp2, F4, C4, P4, and 02)에 대하여 깨어있고 편하게 누워, 눈을 감은 상태에서 400Hz로 120초 동안 지속적으로 측정되었다(48000 data points at sampling frequency of 400 Hz).
두 환자 그룹의 뇌파의 차이를 판별하기 위해 데이터 마이닝(data mining) 기법을 사용하였으며, 데이터 마이닝 기법을 위한 속성 값으로 뇌파(EEG) 채널사이 정보흐름에서의 비성형도(nonlinearity) 양과 근사 엔트로피 (approximate en-tropy)의 크기를 속성으로 선택하였다. 즉, 16가지 채널의 가능한 두 채널간의 연결 120개(₁₆C₂)의 정보 흐름(information flow)에서 Tanaka의 비선형도(nonlinearity) 측정기법을 이용하여 얻어진 비선형도(nonlinearity) 값, 그리고 16 채널 각각의 위치에서느 근사 엔트로피(approximate entropy)값을 측정하고, 이를 이용하여 총 136개(비선형도 120개 + 근사 엔트로피 16개)의 속성(attributes)을 생성하였다(Bruhn, Jorgen et al.
12816) 모두 데이터마이닝의 속성(attribute)으로 사용하였다. 따라서 데이터마이닝에 사용된 테이블에는 각 환자의 EEG별로 32개의 속성(attribute)을 가지고 있으며, 주요 우울 환자(major depressive disorder) 30명, 양극성 장애(bipolar disorder) 24명에 대하여 각각 30 * 32, 24 * 32 테이블을 생성하고 이를 이용하여 데이터 마이닝 테크닉을 통해 분석하였다.
이 논문에서는 데이터마이닝(datamining)의 2가지 기술을 적용하여 환자를 분류하였다. 첫 번째 기법은 의사 결정트리(decision tree) 로써, 환자를 구분하는데 쓰이는 속성(attribute)을 손쉽게 확인할 수 있고 해석 또한 용이하다.
이러한 단점을 피하기 위해서 이 논문에서는 빠른 측정이 가능하고 측정동안 집중력을 요하지 않는 뇌파(EEG; electroencephalogram)의 분석을 통해 우울증 환자를 분류하였다. 우울증 증세 또한 뇌의 비정상적인 활동과 연관이 있음이 알려지면서 뇌의 활동 정도를 측정하는 방법이 우울증의 분류와 연관이 있을 것으로 생각되기 때문이다.
크기를 속성으로 선택하였다. 즉, 16가지 채널의 가능한 두 채널간의 연결 120개(₁₆C₂)의 정보 흐름(information flow)에서 Tanaka의 비선형도(nonlinearity) 측정기법을 이용하여 얻어진 비선형도(nonlinearity) 값, 그리고 16 채널 각각의 위치에서느 근사 엔트로피(approximate entropy)값을 측정하고, 이를 이용하여 총 136개(비선형도 120개 + 근사 엔트로피 16개)의 속성(attributes)을 생성하였다(Bruhn, Jorgen et al., 2000; Tanaka N et al., 2000).

대상 데이터

그림 1. 본 논문에서 사용된 16개의 채널 위치.
이 연구에서 우울증 분류에 사용된 환자는 주요 우울 장애(major depressive disorder) 환자 30명(나이: 평균=49.1666 표준편차 14.21045 남성: 10명 여성: 20명), 양극성 장애 bipolar disorder) 환자24명 (나이; 평균=37.75 표준편차 14.247 남성: 10명 여성: 14명)이다.

데이터처리

하지만 가능한 두 채널간의 연결 120개 (₁₆C₂)에는 채널간의 거리가 멀다거나, 정보의 흐름이 적어 의미가 없는 연결이 다수 존재한다. 따라서 두 그룹 간의 정보흐름(infdrmation flow)의 비선형도(nonlinearity)의 값의 차이를 T-검증(T-test)하여 p값이(p-val-ue) 0.3 초과인 채널 연결은, 두 환자그룹(주요 우울 장애와 양극성 장애)에서 통계적인 차이를 보이지 않는 것으로 간주하고 속성에서 삭제하였다. 그 결과 p값이 0.

이론/모형

근사 엔트로피(approximate entropy)의 경우 질병의 종류에 따라 다를 가능성이 있는 뇌 각 부분의 활성도를 측정하기 위해서 사용하였다(Steve Pincus, 1994 Bruhn, Jorgen et al., 2000). 근사 엔트로피(approximate entropy)의 경우 두 그룹 간에 차이를 T-검증을 통한 p값이(p-value) 앞의 비선형도(nonlinearity) 분석보다 작기 때문에 (평균: 0, 1742 표준편차: 0.
첫 번째 기법은 의사 결정트리(decision tree) 로써, 환자를 구분하는데 쓰이는 속성(attribute)을 손쉽게 확인할 수 있고 해석 또한 용이하다. 두번째 방법은 최근에 데이터의 클러스터링(chistering)과 분류(classifcation)에 많이 사용되고 있는 SVM(Support Vector Machine) 기법을 이용하였다. SVM기법은 의사 결정 트리 (Decision tree)와는 달리 몇 가지 속성(attribute)에만 의존하지 않고, 입력 데이터의 차원을 변경하면서 속성(attribute)들의 분석하기 때문에 조금 더 신빙성 있는 결과를 예측 할 수 있다(A Srivastava et al.
, 2005). 리브 원 아웃 메소드(leave-one-out method)를 사용하여 뇌파 데이터를 분석하였다. PSVM 기법을 통해 두 개의 그룹을 분류한 결과 77.
이 논문에서 사용한 SVM 메소드는 최근에 발표된 PSVM(Possibilistic support vector machines)을 사용하였다(Ki Young Lee. et al., 2005). 리브 원 아웃 메소드(leave-one-out method)를 사용하여 뇌파 데이터를 분석하였다.
이 논문에서는 의사 결정 트리(decision tree)의 그로잉 메소드(growing method) 알고리즘 중 QUEST를 이용하여 분석하였다(그림 2, SPSS사용. Significance level for splitting = 0.05, minimum parent node = 5, minimum child node = 5, maximum tree depth = 5 value interval = 10). 두 환자 그룹을 분류하는 첫 번째 속성(attribute) 값은 C3영역의 근사 엔트로피(approximate entropy)값의 크기로 0.

성능/효과

리브 원 아웃 메소드(leave-one-out method)를 사용하여 뇌파 데이터를 분석하였다. PSVM 기법을 통해 두 개의 그룹을 분류한 결과 77.7778%의 정확도를 보였다.
노드(node)3에 속하는 그룹의 경우 93, 3%가 양극성 장애에 해당되었으며, 노드(node)4에 속하는 그룹의 경우는 75%가 주요 우울증 환자로 판별되었다. 마찬가지로 노드(node)5에 속하는 그룹의 경우 83.
3%가 주요 우울환자로 분류되었고, 노드(node)6의 그룹에서는 80%가 양극성 장애환자로 구분되었다. 환자의 분류의 전체적인 정확도는 약 85.185%로 측정되었다.

후속연구

뇌파(EEG)를 통한 질병 진단이 아직까지 보편화가 되어있지 않고, 뇌파(EEG)의 어떠한 분석 기법이 가장 효용성이 있고 효율적인지 현 시점에서 밝혀지지 않았기 때문이다. 따라서 이 논문에서 제시된 뇌파(EEG) 분석 방법을 통해 환자의 질병 진단 빠르게 하되, 환자의 추후의 임상적인 증상에 기반을 두어 치료를 진행해가는 방향으로 사용되기를 제안한다. 마지막으로 뇌파(EEG)를 통한 질병의 분석 기법이 발전하기 위해 많은 분석 알고리즘의 개발 및 질병을 앓고 있는 환자의 뇌의 활동과 뇌파와의 관계에 대한 연구가 필요할 것이다.
따라서 이 논문에서 제시된 뇌파(EEG) 분석 방법을 통해 환자의 질병 진단 빠르게 하되, 환자의 추후의 임상적인 증상에 기반을 두어 치료를 진행해가는 방향으로 사용되기를 제안한다. 마지막으로 뇌파(EEG)를 통한 질병의 분석 기법이 발전하기 위해 많은 분석 알고리즘의 개발 및 질병을 앓고 있는 환자의 뇌의 활동과 뇌파와의 관계에 대한 연구가 필요할 것이다.

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증