심음은 심장의 기계적 현상 및 심장의 상태를 나타내는 중요한 지표이며 일반적으로 청진법을 이용하여 의사가 직접 판단한다. 이 때 심음과 심잡음의 주파수 대역 중 사람의 가청 주파수 대역을 벗어나는 범위가 존재하고, 이를 해결하기 위해 심음을 파동으로 시각화하여 기록한 심음도를 사용한다. 그러나 잡음에 비해 심음 신호의 세기가 작아 육안으로 판별하기 어려우며 판단 결과는 의사의 숙련도에 의존되기 때문에 정확도 및 신뢰도가 떨어지는 한계점이 있다. 따라서 심음도를 신호 처리하여 분석할 필요가 있다. 따라서 본 연구에서는 대표적인 음향 신호 처리 방법인 ...
심음은 심장의 기계적 현상 및 심장의 상태를 나타내는 중요한 지표이며 일반적으로 청진법을 이용하여 의사가 직접 판단한다. 이 때 심음과 심잡음의 주파수 대역 중 사람의 가청 주파수 대역을 벗어나는 범위가 존재하고, 이를 해결하기 위해 심음을 파동으로 시각화하여 기록한 심음도를 사용한다. 그러나 잡음에 비해 심음 신호의 세기가 작아 육안으로 판별하기 어려우며 판단 결과는 의사의 숙련도에 의존되기 때문에 정확도 및 신뢰도가 떨어지는 한계점이 있다. 따라서 심음도를 신호 처리하여 분석할 필요가 있다. 따라서 본 연구에서는 대표적인 음향 신호 처리 방법인 Mel-Frequency Cepstral Coefficient(MFCC), Linear Predictive Codes(LPC), Perceptual Linear Prediction(PLP)을 각각 심음도에 적용하여 분석하고, 이를 딥 러닝에 적용하여 심장의 정상 유무를 판별하는 알고리즘을 구현하여 정확도를 비교 평가하였다. 기존 연구와의 정확도를 비교 평가하기 위하여 10겹 교차 검증을 통하여 정확도를 계산한 결과, MFCC는 94.042.83%, LPC는 87.972.37%, PLP는 88.951.36%의 정확도를 가졌다. 또한 각 음향 신호 처리 방법에서 비용함수는 특정 Iteration에서 0에 가까운 값으로 수렴하기 시작하였으며, 정확도도 비용함수에서와 같은 Iteration에서 특정 값으로 수렴하기 시작하는 것을 확인하였다. 동일한 데이터 베이스를 이용한 선행 연구 중 가장 높은 정확도를 가진 연구와 비교하여 보았을 때, 본 연구에서 사용한 3가지 알고리즘 모두 더 높은 정확도를 가지며 그 중 MFCC가 가장 높은 정확도를 가지는 것을 확인할 수 있었다. 따라서 본 연구에서와 같이 심장의 정상 유무를 판단하는 것이 높은 신뢰도를 갖는 방법일 것으로 사료된다.
심음은 심장의 기계적 현상 및 심장의 상태를 나타내는 중요한 지표이며 일반적으로 청진법을 이용하여 의사가 직접 판단한다. 이 때 심음과 심잡음의 주파수 대역 중 사람의 가청 주파수 대역을 벗어나는 범위가 존재하고, 이를 해결하기 위해 심음을 파동으로 시각화하여 기록한 심음도를 사용한다. 그러나 잡음에 비해 심음 신호의 세기가 작아 육안으로 판별하기 어려우며 판단 결과는 의사의 숙련도에 의존되기 때문에 정확도 및 신뢰도가 떨어지는 한계점이 있다. 따라서 심음도를 신호 처리하여 분석할 필요가 있다. 따라서 본 연구에서는 대표적인 음향 신호 처리 방법인 Mel-Frequency Cepstral Coefficient(MFCC), Linear Predictive Codes(LPC), Perceptual Linear Prediction(PLP)을 각각 심음도에 적용하여 분석하고, 이를 딥 러닝에 적용하여 심장의 정상 유무를 판별하는 알고리즘을 구현하여 정확도를 비교 평가하였다. 기존 연구와의 정확도를 비교 평가하기 위하여 10겹 교차 검증을 통하여 정확도를 계산한 결과, MFCC는 94.042.83%, LPC는 87.972.37%, PLP는 88.951.36%의 정확도를 가졌다. 또한 각 음향 신호 처리 방법에서 비용함수는 특정 Iteration에서 0에 가까운 값으로 수렴하기 시작하였으며, 정확도도 비용함수에서와 같은 Iteration에서 특정 값으로 수렴하기 시작하는 것을 확인하였다. 동일한 데이터 베이스를 이용한 선행 연구 중 가장 높은 정확도를 가진 연구와 비교하여 보았을 때, 본 연구에서 사용한 3가지 알고리즘 모두 더 높은 정확도를 가지며 그 중 MFCC가 가장 높은 정확도를 가지는 것을 확인할 수 있었다. 따라서 본 연구에서와 같이 심장의 정상 유무를 판단하는 것이 높은 신뢰도를 갖는 방법일 것으로 사료된다.
Heart sounds are an important indicator of the heart’s mechanical phenomena and heart condition. The physicians usually evaluate the heart sound using the auscultation. At this time, there is a range of frequencies of the heart sound and the murmur noise that deviate from the human audible frequency...
Heart sounds are an important indicator of the heart’s mechanical phenomena and heart condition. The physicians usually evaluate the heart sound using the auscultation. At this time, there is a range of frequencies of the heart sound and the murmur noise that deviate from the human audible frequency band. To solve this problem, they use the phonocardiogram that is recorded by visualizing the heart sounds as a wave. However, since the magnitude of the heart sound is small compared to the murmur and the noise, it is hard to distinguish it from the naked eye. In the addition, there is a limit in accuracy and reliability because the diagnosis result depends on the proficiency of the physicians. Therefore, it is necessary to analyze the heart sounds by signal processing. In this study, we analyzed the each phonocardiogram by applying Mel-Frequency Cepstral Coefficient(MFCC), Linear Predictive Codes(LPC) and Perceptual Linear Prediction(PLP) respectively, which are representative audio signal processing methods. And we applied it to Deep Learning to implement the algorithm that distinguish whether the heart is normal, and the accuracy was compared and evaluated. In order to compare the accuracy with the previous studies, we calculated the accuracy by 10-fold cross validation. The accuracy of MFCC was 94.042.83%, LPC was 87.972.37% and PLP was 88.951.36%. Also, in each sound signal processing methods, the cost function starts to converge to a value close to 0 at certain iteration and it is confirmed that the accuracy starts to converge to a specific value at the same iteration as in the cost function. Compared with the study with the highest accuracy among the previous studies using the same database, all three algorithms used in this study have higher accuracy and MFCC has the highest accuracy. Therefore, it is considered to be a reliable method to distinguish whether the heart is normal as in this study.
Heart sounds are an important indicator of the heart’s mechanical phenomena and heart condition. The physicians usually evaluate the heart sound using the auscultation. At this time, there is a range of frequencies of the heart sound and the murmur noise that deviate from the human audible frequency band. To solve this problem, they use the phonocardiogram that is recorded by visualizing the heart sounds as a wave. However, since the magnitude of the heart sound is small compared to the murmur and the noise, it is hard to distinguish it from the naked eye. In the addition, there is a limit in accuracy and reliability because the diagnosis result depends on the proficiency of the physicians. Therefore, it is necessary to analyze the heart sounds by signal processing. In this study, we analyzed the each phonocardiogram by applying Mel-Frequency Cepstral Coefficient(MFCC), Linear Predictive Codes(LPC) and Perceptual Linear Prediction(PLP) respectively, which are representative audio signal processing methods. And we applied it to Deep Learning to implement the algorithm that distinguish whether the heart is normal, and the accuracy was compared and evaluated. In order to compare the accuracy with the previous studies, we calculated the accuracy by 10-fold cross validation. The accuracy of MFCC was 94.042.83%, LPC was 87.972.37% and PLP was 88.951.36%. Also, in each sound signal processing methods, the cost function starts to converge to a value close to 0 at certain iteration and it is confirmed that the accuracy starts to converge to a specific value at the same iteration as in the cost function. Compared with the study with the highest accuracy among the previous studies using the same database, all three algorithms used in this study have higher accuracy and MFCC has the highest accuracy. Therefore, it is considered to be a reliable method to distinguish whether the heart is normal as in this study.
주제어
#심음 음향신호 처리기법 Mel-Frequency Cepstral Coefficient Linear Predictive Codes Perceptual Linear Prediction 딥 러닝 Convolutional Neural Network Heart Sound Audio Signal Processing Deep Learning
학위논문 정보
저자
신수연
학위수여기관
연세대학교 대학원
학위구분
국내석사
학과
의공학과
지도교수
신태민
발행연도
2018
총페이지
ⅵ, 58장
키워드
심음 음향신호 처리기법 Mel-Frequency Cepstral Coefficient Linear Predictive Codes Perceptual Linear Prediction 딥 러닝 Convolutional Neural Network Heart Sound Audio Signal Processing Deep Learning
※ AI-Helper는 부적절한 답변을 할 수 있습니다.