후두암은 유병율이 높지만 조기에 발견하면 90% 이상의 치유율과 발성기능의 보존이 가능하며 현재 음성분석을 이용한 진단법이 시도되고 있으나 정립된 선별검사법은 없는 실정이다. 성문전도검사(electroglottography, EGG)는 성대의 진동양상을 알 수 있는 비침습적 검사로서 발성과 음성합성의 연구에 많이 사용되고 있다. 본 연구는 EGG에서 관찰되는 파라미터들을 다층 퍼셉트론(multilayer perceptron)구조의 신경회로망(artificial neural network)으로 감별하는 기법을 이용하여 후두암 감별법에 대한 연구로서 부산대학교병원을 내원한 후두암 환자 10명과 양성후두질환 26명을 대상으로 새로 고안한 Electroglottograph(v1.0)를 이용하여 검사하고 이의 임상적 유용성을 평가하였다. EGG 파라미터인 closed quotient(CQ), speed quotient(SQ), speed index(SI), fundamental frequency(F0), Jitter, Shimmer 등은 MATLAB 6.5 (Mathwork, Inc.)로 작성한 분석 프로그램을 이용하여 추출하였다. 각 환자에서 추출된 EGG 파라미터들을 다층 퍼셉트론 구조의 신경회로망으로 감별하였다. CQ는 각 질환군 간에 유의한 차이가 없었지만 SQ, SI, Jitter, Shimmer 등은 성대질환의 특성에 따라 유의한 차이를 보였다. 신경회로망에서 감별한 결과 CQ를 제외한 SQ, SI, Jitter, Shimmer 등에서 71.3-90%의 후두암의 감별율을 보였다. 또한 SQ, SI, Jitter, Shimmer를 3개씩 조합한 실험에서는 SQ-Jitter-Shimmer와 SQ-SI-Shimmer의 후두암의 감별율이 93%로 가장 높았고, SQ-SI-Jitter 90.9%, SI-Jitter-Shimmer 88.6%로 전체적으로 85% 이상의 높은 감별율을 나타내었다. 이러한 결과는 EGG검사와 신경회로망을 이용한 양성과 악성 후두질환의 감별이 가능함을 시사한다. 향후 성대 질환의 병태생리를 대변할 수 있는 파라미터가 추가로 개발되고 분류 알고리듬이 개선된다면 EGG를 이용한 성대질환의 감별 진단이 보다 정확해질 것으로 사료되었다.
후두암은 유병율이 높지만 조기에 발견하면 90% 이상의 치유율과 발성기능의 보존이 가능하며 현재 음성분석을 이용한 진단법이 시도되고 있으나 정립된 선별검사법은 없는 실정이다. 성문전도검사(electroglottography, EGG)는 성대의 진동양상을 알 수 있는 비침습적 검사로서 발성과 음성합성의 연구에 많이 사용되고 있다. 본 연구는 EGG에서 관찰되는 파라미터들을 다층 퍼셉트론(multilayer perceptron)구조의 신경회로망(artificial neural network)으로 감별하는 기법을 이용하여 후두암 감별법에 대한 연구로서 부산대학교병원을 내원한 후두암 환자 10명과 양성후두질환 26명을 대상으로 새로 고안한 Electroglottograph(v1.0)를 이용하여 검사하고 이의 임상적 유용성을 평가하였다. EGG 파라미터인 closed quotient(CQ), speed quotient(SQ), speed index(SI), fundamental frequency(F0), Jitter, Shimmer 등은 MATLAB 6.5 (Mathwork, Inc.)로 작성한 분석 프로그램을 이용하여 추출하였다. 각 환자에서 추출된 EGG 파라미터들을 다층 퍼셉트론 구조의 신경회로망으로 감별하였다. CQ는 각 질환군 간에 유의한 차이가 없었지만 SQ, SI, Jitter, Shimmer 등은 성대질환의 특성에 따라 유의한 차이를 보였다. 신경회로망에서 감별한 결과 CQ를 제외한 SQ, SI, Jitter, Shimmer 등에서 71.3-90%의 후두암의 감별율을 보였다. 또한 SQ, SI, Jitter, Shimmer를 3개씩 조합한 실험에서는 SQ-Jitter-Shimmer와 SQ-SI-Shimmer의 후두암의 감별율이 93%로 가장 높았고, SQ-SI-Jitter 90.9%, SI-Jitter-Shimmer 88.6%로 전체적으로 85% 이상의 높은 감별율을 나타내었다. 이러한 결과는 EGG검사와 신경회로망을 이용한 양성과 악성 후두질환의 감별이 가능함을 시사한다. 향후 성대 질환의 병태생리를 대변할 수 있는 파라미터가 추가로 개발되고 분류 알고리듬이 개선된다면 EGG를 이용한 성대질환의 감별 진단이 보다 정확해질 것으로 사료되었다.
Background and Objectives : Electroglottography(EGG) is a non-invasive method of monitoring the vocal cord vibration by measuring the variation of physiological impedance across the vocal folds through the neck skin. It reveals especially the vocal fold contact area and is widely used for basic lary...
Background and Objectives : Electroglottography(EGG) is a non-invasive method of monitoring the vocal cord vibration by measuring the variation of physiological impedance across the vocal folds through the neck skin. It reveals especially the vocal fold contact area and is widely used for basic laryngeal researches, voice analysis and synthesis. The purpose of this study is to investigate the effectiveness of EGG parameters in differential diagnosis of laryngeal cancer. Materials and Methods : The author investigated 10 laryngeal cancer and 25 benign laryngeal disease patients who visited at the Department of Otolaryngology, Pusan National University Hospital. The EGG equipment was devised in the author's Department. Among various parameters of EGG, closed quotient(CQ), speed quotient(SQ), speed index(SI), Jitter, Shimmer, Fo were determined by an analysis program made with MATLAB 6.5$^{\circledR}$(Mathwork, Inc.). In order to differentiate various laryngeal diseases from pathologic voice signals, the author has used the electroglottographic parameters using the neural network of multilayer perceptron structure. Results : SQ, SI, Jitter and Shimmer values except those of CQ and Fo showed remarkable differences between benign and malignant laryngeal disease groups. From the artificial neural network, the percentage of differentiating the laryngeal cancer was over 80% in SQ, SI, Jitter, Shimmer except for CQ and Fo. These results indicated that it is possible to discriminate the benign and malignant laryngeal diseases by EGG parameters using the artificial neural network. Conclusion : If parameters of EGG which can reveal for the pathology of laryngeal diseases are additionally developed and the current classification algorithm is improved, the discrimination of laryngeal cancer will become much more accurate.
Background and Objectives : Electroglottography(EGG) is a non-invasive method of monitoring the vocal cord vibration by measuring the variation of physiological impedance across the vocal folds through the neck skin. It reveals especially the vocal fold contact area and is widely used for basic laryngeal researches, voice analysis and synthesis. The purpose of this study is to investigate the effectiveness of EGG parameters in differential diagnosis of laryngeal cancer. Materials and Methods : The author investigated 10 laryngeal cancer and 25 benign laryngeal disease patients who visited at the Department of Otolaryngology, Pusan National University Hospital. The EGG equipment was devised in the author's Department. Among various parameters of EGG, closed quotient(CQ), speed quotient(SQ), speed index(SI), Jitter, Shimmer, Fo were determined by an analysis program made with MATLAB 6.5$^{\circledR}$(Mathwork, Inc.). In order to differentiate various laryngeal diseases from pathologic voice signals, the author has used the electroglottographic parameters using the neural network of multilayer perceptron structure. Results : SQ, SI, Jitter and Shimmer values except those of CQ and Fo showed remarkable differences between benign and malignant laryngeal disease groups. From the artificial neural network, the percentage of differentiating the laryngeal cancer was over 80% in SQ, SI, Jitter, Shimmer except for CQ and Fo. These results indicated that it is possible to discriminate the benign and malignant laryngeal diseases by EGG parameters using the artificial neural network. Conclusion : If parameters of EGG which can reveal for the pathology of laryngeal diseases are additionally developed and the current classification algorithm is improved, the discrimination of laryngeal cancer will become much more accurate.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
저자는 성대진동에 대한 분석이 기존의 음성분석에 비해 분석오류가 적고, 성대의 병변을 보다 더 정확하게 진단할 수 있다는 전제하에 새로 고안한 EGG(vl.O)기기를 이용하여 정상 및 양성후두질환자와 후두암환자에서 closed quotient (CQ), speed quotient (SQ), speed in dex (SI), Jitter, Shimmer를 구한 후, 이 결과를 다층 퍼셉트론 (multilayer perceptron) 구조의 신경 회로망(arti ficial neural network) 을 이용하여 후두암의 감별이 가능한 지를 평가하고자 본 연구를 시행하였다.
제안 방법
고정하였다. 새로 고안한 EGG(vl.O) 와 현재 가장 많이 사용되고 있는 Laryngograph" (London UK) 를 이용하였으며, 각 기기의 아날로그 출력부를 개인용컴퓨터의 사운드 카드 입력부에 연결하여 동일한 조건에서 측정하였다. EGG(vl.
EGG 파라미터의 측정시 피검자의 기본주파수의 변화에 따른 측정 오류를 방지하기 위해 모음 /아/의 포먼트, 진폭, 대역폭 등의 주요 음향 파라메터를 분석한 결과를 토대로 포먼트 합성 소프트웨어인 SenSynPPC (Sensimetrics)를 이용하여 120Hz의 모음 /아/를 합성하고, 이 음성을 피검자에게 10초간 연속하여 들려주면서 이와 비슷한 음조로 발음하도록 연습시킨 후, 5회 발성한 음성 가운데 처음과 끝을 제외한 가장 안정된 부분을 선택하여 CQ, SQ, SI, Jitter, Shimmer, Fo를 구하였다. 통계분석 처리는 엑셀(Microsoft, USA)을 이용하여 평균과 표준편차를 구하였고, 이들 값 사이의 상관관계는 SPSS PC10.
분석 과정에서 EGG 파형의 기저선 변동을 보상하기 위해 고역통과필터를 사용하였으며 신호외의 잡음을 제거하기 위해 저역통과필터를 이용하였다. EGG의 한 주기에서 파라미터를 구하기위해서는 최고점, 최소점, 최대 기울기점, 최소 기울기점과 같은 특징점을 추출하고 EGG 및 미분 EGG(dEGG) 의 최대 최소값을 통해 특징점을 구하였다. 이 프로그램은 앞에서 제시한 파라미터의 값을 구하고 파라미터 값의 시간에 따른 변화를 보여주며 평균값도 제시하였다 (Fig.
두 기기의 성능을 비교하기 위하여 정상 성인 남자 20 명의 CQ, SQ, SI, Jitter, Shimmer 및 Fo 측정치와 상관계수를 구하였다. 피검자의 음조의 평균이 Laryngo- graph"를 이용한 경우에는 133.
7MHz의 고주파수 캐리어 신호를 가해 성대의 전기 임피던스 변화를 추출하였다. 또한 전극의 위치 및 개인적인 피부 임피던스의 차이를 극복하기 위하여 자동이득조절(automatic gain control) 기능을 회로에 첨가하였다. 수신부의 신호는 매우 미약하므로 검출된 캐리어신호를 공진 증폭기를 통하여 증폭하였으며, 증폭된 캐리어 신호에서 검파회로를 통하여 임피던스 변화에 따른 캐리어 신호의 진폭 변화를 검출하였다.
본 연구에서 사용한 신경회로망은 입력층, 은닉층, 그리고 출력층을 가지는 다층 퍼셉트론 구조를 갖고 있으며, 입력층은 2개의 뉴런으로 구성하여 질환을 분류할 수 있는 특징적인 파라미터를 입력하도록 하였고, 출력층은 분류하고자 하는 질환을 나타내며 2개의 뉴런으로 구성하였다. 은닉층은 발견법적(heuristic) 방법에 의해 6개의 뉴런으로 구성하였으며, 초기 학습률은 0.
부산대학교병원 이비인후과 음성 언어검사실에서 피검자를 편안한 자세로 앉게 하고 목을 고정시키고, 2개의 링전극을 갑상연골 외측 경부의 피부에 부착하여 압박붕대로 고정하였다. 새로 고안한 EGG(vl.
) 로작성한 EGG_dialog 프로그램에서 불러들인 후 분석하고 결과를 그래프로 제시하였다. 분석 과정에서 EGG 파형의 기저선 변동을 보상하기 위해 고역통과필터를 사용하였으며 신호외의 잡음을 제거하기 위해 저역통과필터를 이용하였다. EGG의 한 주기에서 파라미터를 구하기위해서는 최고점, 최소점, 최대 기울기점, 최소 기울기점과 같은 특징점을 추출하고 EGG 및 미분 EGG(dEGG) 의 최대 최소값을 통해 특징점을 구하였다.
또한 전극의 위치 및 개인적인 피부 임피던스의 차이를 극복하기 위하여 자동이득조절(automatic gain control) 기능을 회로에 첨가하였다. 수신부의 신호는 매우 미약하므로 검출된 캐리어신호를 공진 증폭기를 통하여 증폭하였으며, 증폭된 캐리어 신호에서 검파회로를 통하여 임피던스 변화에 따른 캐리어 신호의 진폭 변화를 검출하였다.
신경회로망에 각 후두질환의 CQ, SQ, SI, Jitter, Shimmer, Fo의 측정치를 입력하여 오차 역전파법 (error back propagation) 으로 학습시킨 후 학습된 판단에 의거하여 자동적으로 질환을 분류하는 시스템을 구현하였으며 이를 이용하여 정상, 양성후두질환 및 후두암의 분류율을 구하였다.9)
01 로 설정하였다. 신경회로망을 학습시 본 연구를 위하여 수집된 데이터의 갯수가 적기 때문에 학습과 검증에 동일한 데이터를 적용하여 본 실험을 수행하였다. 질환에 따른 데이터 갯수의 차이를 동일하게 맞추기 위해 갯수가 적은 경우에는 이를 복사하여 무작위로 다시 채워 넣어 수행하였다.
은닉층은 발견법적(heuristic) 방법에 의해 6개의 뉴런으로 구성하였으며, 초기 학습률은 0.01, 최대 학습횟수는 50,000회, 학습 도달 오차는 0.01 로 설정하였다. 신경회로망을 학습시 본 연구를 위하여 수집된 데이터의 갯수가 적기 때문에 학습과 검증에 동일한 데이터를 적용하여 본 실험을 수행하였다.
인체의 피부는 높은 직류 저항을 띠고 있으며 용량성이 존재한다. 피부의 전기저항을 극복하고 성대의 전기 저항 변화를 기록하기 위하여, 전극을 통하여 2.7MHz의 고주파수 캐리어 신호를 가해 성대의 전기 임피던스 변화를 추출하였다. 또한 전극의 위치 및 개인적인 피부 임피던스의 차이를 극복하기 위하여 자동이득조절(automatic gain control) 기능을 회로에 첨가하였다.
대상 데이터
2002년 8월부터 2002년 9월까지 부산대학교병원이비인후과에서 조직검사상 편평 상피세 포암으로 확진 된후두암 환자 남자 10명과 같은 기간동안 애성을 주소로본원을 방문하여 양성 후두질환으로 확인된 남자 26명을 대상으로 하였다. 질환별 분포는 성대 결절 6례 용종 10례.
라인케 부종 5례, 성대마비 5례이었다. 정상 대조군은 흡연력이 없고 후두병변과 조음에 이상이 없으면서 정상적인 발성이 가능한 성인 남자 20명을 대상으로하였다.
데이터처리
)로 작성한 Wav一read 프로그램을 이용하여 EGG파일로 저장하였다. Wav_read 로 저장한 데이터를 Matlab 6.5 (Mathwork, Inc.) 로작성한 EGG_dialog 프로그램에서 불러들인 후 분석하고 결과를 그래프로 제시하였다. 분석 과정에서 EGG 파형의 기저선 변동을 보상하기 위해 고역통과필터를 사용하였으며 신호외의 잡음을 제거하기 위해 저역통과필터를 이용하였다.
각 파라미터의 분석은 사운드 카드를 통해 입력된 신호를 Matlab 6.5 (Mathwork, Inc.)로 작성한 Wav一read 프로그램을 이용하여 EGG파일로 저장하였다. Wav_read 로 저장한 데이터를 Matlab 6.
32로 모든 피검자가 정상인이면서 안정된 발음을 하고 있기 때문으로 추정된다. 두 기기가 완벽한 상관도를보이지 않는 것은 두 기기를 동시에 측정하지 않은 결과로 추정되며 이상의 결과를 토대로 이후의 검사는 Ele- ctroglottograph (vl .0) 로 즉정하였다.
통계분석 처리는 엑셀(Microsoft, USA)을 이용하여 평균과 표준편차를 구하였고, 이들 값 사이의 상관관계는 SPSS PC10.KSPSS, Inc)을 이용하여 구하였다.
이론/모형
Matlab 6.51 (Mathwork, Inc.)를 이용하여 각 파라미터를 구하는 알고리즘을 프로그래밍하였다. CQ는 성대진동 1주기 중 성대가 닫혀 있는 시간의 비율로서 Fig.
성능/효과
EGG 파라미터 각각의 분별율을 알기 위해 일원변량분석 (one-way ANOVA)으로 처리한 결과 CQ와 Fo는정상 및 양성후두질환군과 후두암군간 유의한 차이가없었으나 SQ, SI는 성대마비 및 후두암군에서 정상군에비해 유의하게 낮은 수치를 보였고, Jitter와 Shimmer는 성대결절을 제외하고 모든 군간.유의한 차이를 나타내었다(Table 2).
SQ, SI, Jitter, Shimmer 모두를 조합하여 실험한 결과 후두암 감별율은 93%이었다(Table 6).
1 %로 가장 불량하였다(Table 4). SQ, SI, Jitter, Shimmer를 3개씩 조합한 실험에서는 SQ-Jitter-Shimmer와 SQ-SI-Shimmer의 후두암의 감별율이 각각 93%로 가장 높았고, SQ-SI-Jitter 90.9%, Si-Jitter-Shimmer 88.6%로 전체적으로 85% 이상의 높은 감별율을 나타내었다(Table 5).
각 파라미터의 분별율 실험에서 유의한 파라미터로 관찰된 SQ, SI, Jitter, Shimmer를 각각 2개씩 조합하여후두암 감별실험을 수행한 결과 Si-Jitter 조합이 후두암을 후두암으로 분류한 확률이 100% 정상과 양성후두질환을 정상과 양성으로 분류한 확률이 91.6%로 후두암의 감별율(predictability) 은 93.6%로 매우 높았으며, SQ-SI의 감별율은 82.1 %로 가장 불량하였다(Table 4). SQ, SI, Jitter, Shimmer를 3개씩 조합한 실험에서는 SQ-Jitter-Shimmer와 SQ-SI-Shimmer의 후두암의 감별율이 각각 93%로 가장 높았고, SQ-SI-Jitter 90.
검출된 성대 운동의 전기적 신호에서 잡음 제거를 위하여 저역통과필터를 거쳤으며, 성대 운동을 나타내는 출력 아날로그 신호는 외부기록기 또는 개인용 컴퓨터의 데이터 획득시스템 또는 사운드 카드의 마이크 입력단자를 통하여 전달하였다. 볼륨을 사용하여 출력신호가 적정 신호 크기가 되도록 조절하여 사용하였다.
결론적으로 EGG검사를 이용한 양성과 악성 후두질환의 감별율은 음성분석 파라미터에 의한 성적보다는 다소 불량하지만, EGG 파라미터로서도 양성과 악성 후두질환의 감별의 가능성이 있을 것으로 추정되었다. 향후성대 질환의 병태생리를 대변할 수 있는 파라미터의 개발이 더욱 필요하며, 분류 알고리즘의 개선이 진행된다면 EGG검사를 이용한 성대질환의 감별 진단이 보다 정확해질 것으로 사료된다.
다층 퍼셉트론 신경회로망을 이용하여 각각의 파라미터에 대한 실험에서 정상 및 양성후두질환군과 후두암군간 감별율은 SQ, SI, Jitter, Shimmer에서 통계적인 유의성이 있었으며, SQ에 의한 후두암의 감별율이 90%로가장 높았으나, 그외 1개의 파라미터를 이용한 경우 감별율은 17.9%에서 87.3%로 불량하였다(Table 3).
7% 였다고 보고하였다. 본 연구에서는 EGG 파라미터 측정치를 이용하여 다층 퍼셉트론(multilayer perceptron)구조의 신경회로망(artificial neural net work) 감별하는 기법으로 71.3~93%의 후두암의감별율을 보인 것은 음성분석 방법에 의한 감별과 병용함으로서 보다 정확한 감별이 가능할 것으로 기대된다.
이는 전극의 부착 부위와 발성하는 과정에서 음조가 변하기 때문에 완전한상관계수를 기대할 수 없음에도 불구하고 대체로 높은상관도를 나타내고 있다. 이중에서 성대접촉과 분리의구간별 분석을 나타내는 CQ, SQ와 SI는 상관도가 매우높으나 Jitter는 매우 낮은 상관도를 보였다. 이는 Lary- ngograph”에서는 피검자의 평균이 0.
후속연구
향후성대 질환의 병태생리를 대변할 수 있는 파라미터의 개발이 더욱 필요하며, 분류 알고리즘의 개선이 진행된다면 EGG검사를 이용한 성대질환의 감별 진단이 보다 정확해질 것으로 사료된다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.