지능형 보안관제 시스템은 영상을 중심으로 연구되어 왔다. 최근에는 영상과 음성의 융합으로 활발한 연구가 이루어지고 있고, 연구결과들은 보안시스템의 멀티모달화로 더욱 발전하고 있다. 멀티모달은 영상과 음성이 융합된 것이다. 영상의 사각지대를 청각센서로 보완하게 되어 더욱 지능화된 보안시스템으로 발전하였다. 그러나, 청각센서는 골목길이나 공원과 같은 야외환경에서 거리에 따라, 그리고, 다양한 소음에 의해 많은 한계를 지니고 있다. 본 논문에서는 야외환경에서 외이 형태의 집음기를 이용하고, 주변의 잡음제거를 위한 ...
지능형 보안관제 시스템은 영상을 중심으로 연구되어 왔다. 최근에는 영상과 음성의 융합으로 활발한 연구가 이루어지고 있고, 연구결과들은 보안시스템의 멀티모달화로 더욱 발전하고 있다. 멀티모달은 영상과 음성이 융합된 것이다. 영상의 사각지대를 청각센서로 보완하게 되어 더욱 지능화된 보안시스템으로 발전하였다. 그러나, 청각센서는 골목길이나 공원과 같은 야외환경에서 거리에 따라, 그리고, 다양한 소음에 의해 많은 한계를 지니고 있다. 본 논문에서는 야외환경에서 외이 형태의 집음기를 이용하고, 주변의 잡음제거를 위한 LMS 가변 필터링알고리즘을 적용하여 음원의 인지 성능을 향상시키고자 하였다. 사람 귀의 외이는 귓바퀴의 특이한 집음구조 때문에 원음의 3~6dB 정도를 증폭시킨다. 귓바퀴와 연결되어있는 외이도는 2.5~4kHz 대역에서 주파수 공명이 일어난다. 귓바퀴 부분이 열려있고, 고막 부분이 닫혀있는 관의 구조로 되어있기 때문이다. 이로 인하여 사람이 일반적으로 듣는 1.5~7kHz의 주파수 소리를 15~20dB 정도 증폭시킨다. 이러한 외이의 원리를 응용한 기구를 제작하여 원거리의 집음율을 높였다. 또한, 주변 잡음을 제거하고 가청대역의 음성을 강조하기 위하여, 입력된 음성의 품질에 따른 가변적인 주파수 대역의 필터계수를 적용하여 최소자승평균 가변 필터링을 수행하였다. 본 논문의 모의실험에서는 남녀 화자 각 10명으로부터 일반 마이크 환경일 때와 외이 형태의 집음기를 결합한 환경, 그리고, 3m, 5m ,7m의 거리 환경에 따라 발성을 하는 방식으로 음원의 인지성능 테스트를 실시하였다. 실험 결과, 5m 이상의 원거리에서 일반 마이크 방식에 비해 외이 형태의 집음기를 부착하고, 잡음 제거를 위한 가변 필터링 알고리즘을 적용한 방식이 10% 이상의 인지성능이 향상된 것을 확인하였다.
지능형 보안관제 시스템은 영상을 중심으로 연구되어 왔다. 최근에는 영상과 음성의 융합으로 활발한 연구가 이루어지고 있고, 연구결과들은 보안시스템의 멀티모달화로 더욱 발전하고 있다. 멀티모달은 영상과 음성이 융합된 것이다. 영상의 사각지대를 청각센서로 보완하게 되어 더욱 지능화된 보안시스템으로 발전하였다. 그러나, 청각센서는 골목길이나 공원과 같은 야외환경에서 거리에 따라, 그리고, 다양한 소음에 의해 많은 한계를 지니고 있다. 본 논문에서는 야외환경에서 외이 형태의 집음기를 이용하고, 주변의 잡음제거를 위한 LMS 가변 필터링 알고리즘을 적용하여 음원의 인지 성능을 향상시키고자 하였다. 사람 귀의 외이는 귓바퀴의 특이한 집음구조 때문에 원음의 3~6dB 정도를 증폭시킨다. 귓바퀴와 연결되어있는 외이도는 2.5~4kHz 대역에서 주파수 공명이 일어난다. 귓바퀴 부분이 열려있고, 고막 부분이 닫혀있는 관의 구조로 되어있기 때문이다. 이로 인하여 사람이 일반적으로 듣는 1.5~7kHz의 주파수 소리를 15~20dB 정도 증폭시킨다. 이러한 외이의 원리를 응용한 기구를 제작하여 원거리의 집음율을 높였다. 또한, 주변 잡음을 제거하고 가청대역의 음성을 강조하기 위하여, 입력된 음성의 품질에 따른 가변적인 주파수 대역의 필터계수를 적용하여 최소자승평균 가변 필터링을 수행하였다. 본 논문의 모의실험에서는 남녀 화자 각 10명으로부터 일반 마이크 환경일 때와 외이 형태의 집음기를 결합한 환경, 그리고, 3m, 5m ,7m의 거리 환경에 따라 발성을 하는 방식으로 음원의 인지성능 테스트를 실시하였다. 실험 결과, 5m 이상의 원거리에서 일반 마이크 방식에 비해 외이 형태의 집음기를 부착하고, 잡음 제거를 위한 가변 필터링 알고리즘을 적용한 방식이 10% 이상의 인지성능이 향상된 것을 확인하였다.
Intelligent surveillance systems have been subjected to research on video. Recently, research has been actively combine with video and sound. The results of the research are further advancing the multi-modal of the surveillance systems. It is a multi-modal system that combines video and sound. It ha...
Intelligent surveillance systems have been subjected to research on video. Recently, research has been actively combine with video and sound. The results of the research are further advancing the multi-modal of the surveillance systems. It is a multi-modal system that combines video and sound. It has been progressed to a more intelligent surveillance system by subsidiarily the blind spot of image with sound sensor. However, the sound sensor has many limitations due to the distance from the outside environment such as an alley or a park, and various noise. In this paper, we tried to improve the cognition performance of sound source by using an external ear type collector and applying a variable filtering algorithm of LMS for surrounding noise reduction in the outside environment. The external ear of the human amplifies about 3 to 6dB of the original sound due to the sound-collecting structure of the pinna. The auditory canal, which is connected to the pina, has resonance frequency in the 2.5 to 4kHz band. Because it is the tube structure which is open at the pina part and closed at the eardrum part. Thus, this amplifies about 15 to 20dB the frequency band of 1.5 to 7kHz that people generally hear. Using the principle of an external ear, we designed the external ear type collector to increase the collection rate of the far distance. For removing the environment noise and emphasizing the audio of the audible band, we also performed the variable filtering of LMS that applies the filter coefficient of the variable frequency band according to the quality of the input sound. In the simulation of this paper, we performed cognition performance tests in conditions as follow : first, 20 speakers (male : female = 1 : 1), second, normal microphone and an external ear type collector, third, 3m, 5m, and 7m distance. As a result of experiment, by using the external ear type collector and applying the variable filtering algorithm for the noise reduction, we confirmed that the cognition performance enhanced 10% or more against the normal microphone environment at a far distance of 5m or more.
Intelligent surveillance systems have been subjected to research on video. Recently, research has been actively combine with video and sound. The results of the research are further advancing the multi-modal of the surveillance systems. It is a multi-modal system that combines video and sound. It has been progressed to a more intelligent surveillance system by subsidiarily the blind spot of image with sound sensor. However, the sound sensor has many limitations due to the distance from the outside environment such as an alley or a park, and various noise. In this paper, we tried to improve the cognition performance of sound source by using an external ear type collector and applying a variable filtering algorithm of LMS for surrounding noise reduction in the outside environment. The external ear of the human amplifies about 3 to 6dB of the original sound due to the sound-collecting structure of the pinna. The auditory canal, which is connected to the pina, has resonance frequency in the 2.5 to 4kHz band. Because it is the tube structure which is open at the pina part and closed at the eardrum part. Thus, this amplifies about 15 to 20dB the frequency band of 1.5 to 7kHz that people generally hear. Using the principle of an external ear, we designed the external ear type collector to increase the collection rate of the far distance. For removing the environment noise and emphasizing the audio of the audible band, we also performed the variable filtering of LMS that applies the filter coefficient of the variable frequency band according to the quality of the input sound. In the simulation of this paper, we performed cognition performance tests in conditions as follow : first, 20 speakers (male : female = 1 : 1), second, normal microphone and an external ear type collector, third, 3m, 5m, and 7m distance. As a result of experiment, by using the external ear type collector and applying the variable filtering algorithm for the noise reduction, we confirmed that the cognition performance enhanced 10% or more against the normal microphone environment at a far distance of 5m or more.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.