인간의 청각기관은 소리의 방향과 거리인지에 있어서 여러 가지의 정보들을 복합적으로 이용한다. 이러한 양 귀에 들어오는 소리세기의 차이, 위상의 차이, 그리고 주파수 스펙트럼의 차이 등의 정보들을 종합적으로 포함하고 있는 것이 머리전달함수 (HRIF: Head Related Transfer Function)이다. 2채널 음향재생 시스템에서 이 머리전달함수를 이용하여 다채널 입체음향을 재생하는 방법이 많이 쓰이고 있다. 그러나 머리전달함수의 비개인화적인 특성 때문에 양쪽 귀까지의 거리가 같아지는 혼돈원추 상에서는 앞/뒤 방향 지각에 대한 혼돈을 주게 됨으로써 입체감을 저하시키게 된다. 본 논문에서는 입체음향을 생성하기 위해 머리전달함수를 사용하는 과정예서 발생하는 혼돈원추 문제점을 해결하기 위한 알고리즘을 제안한다. 각 머리전달함수의 주파수 차 및 인간의 청각 특성을 이용하여 각 방향에 해당하는 머리전달함수의 주파수 스펙트럼 특성을 조절하였다. 본 알고리즘의 성능을 평가하기 위하여 음상정위 테스트 및 청감 테스트를 실시하였으며 실험 결과 헤드폰을 기반으로 한 2채널 입체음향 시스템에서 향상된 입체음향을 재생하였다. 더불어 구현된 입체음향의 음질의 열화도 적음을 확인할 수 있었다.
인간의 청각기관은 소리의 방향과 거리인지에 있어서 여러 가지의 정보들을 복합적으로 이용한다. 이러한 양 귀에 들어오는 소리세기의 차이, 위상의 차이, 그리고 주파수 스펙트럼의 차이 등의 정보들을 종합적으로 포함하고 있는 것이 머리전달함수 (HRIF: Head Related Transfer Function)이다. 2채널 음향재생 시스템에서 이 머리전달함수를 이용하여 다채널 입체음향을 재생하는 방법이 많이 쓰이고 있다. 그러나 머리전달함수의 비개인화적인 특성 때문에 양쪽 귀까지의 거리가 같아지는 혼돈원추 상에서는 앞/뒤 방향 지각에 대한 혼돈을 주게 됨으로써 입체감을 저하시키게 된다. 본 논문에서는 입체음향을 생성하기 위해 머리전달함수를 사용하는 과정예서 발생하는 혼돈원추 문제점을 해결하기 위한 알고리즘을 제안한다. 각 머리전달함수의 주파수 차 및 인간의 청각 특성을 이용하여 각 방향에 해당하는 머리전달함수의 주파수 스펙트럼 특성을 조절하였다. 본 알고리즘의 성능을 평가하기 위하여 음상정위 테스트 및 청감 테스트를 실시하였으며 실험 결과 헤드폰을 기반으로 한 2채널 입체음향 시스템에서 향상된 입체음향을 재생하였다. 더불어 구현된 입체음향의 음질의 열화도 적음을 확인할 수 있었다.
To perceive the direction and the distance of a sound, we always use a couple of information. Head Related Transfer Function (HRTF) contains the information that sound arrives from a sound source to the ears of the listener, like differences of level, phase and frequency spectrum. For a reproduction...
To perceive the direction and the distance of a sound, we always use a couple of information. Head Related Transfer Function (HRTF) contains the information that sound arrives from a sound source to the ears of the listener, like differences of level, phase and frequency spectrum. For a reproduction system using 2 channels, we apply HRTF to many algorithms which make 3d sound. But it causes a problem to localize a sound source around a certain places which is called the cone-of-confusion. In this paper, we proposed the new algorithm to reduce the confusion of sound image localization. The difference of frequency spectrum and psychoacoustics theory are used to boost the spectral cue among each directions. To confirm the performance of the algorithm, informal listening tests are carried out. As a result, we can make the improved 3d sound in 2 channel system based on a headphone. Also sound quality of improved 3d sound is much better than conventional methods.
To perceive the direction and the distance of a sound, we always use a couple of information. Head Related Transfer Function (HRTF) contains the information that sound arrives from a sound source to the ears of the listener, like differences of level, phase and frequency spectrum. For a reproduction system using 2 channels, we apply HRTF to many algorithms which make 3d sound. But it causes a problem to localize a sound source around a certain places which is called the cone-of-confusion. In this paper, we proposed the new algorithm to reduce the confusion of sound image localization. The difference of frequency spectrum and psychoacoustics theory are used to boost the spectral cue among each directions. To confirm the performance of the algorithm, informal listening tests are carried out. As a result, we can make the improved 3d sound in 2 channel system based on a headphone. Also sound quality of improved 3d sound is much better than conventional methods.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
후)혼돈원추">혼돈 원추 상에서는 앞/뒤, 상/하 방향을 제대로 인지할 수 없게 된다. 따라서 본 논문에서는 이러한 단점들을 보완하여 2채널 시스템에서 보다 성능이 좋은 입체음향을 구현하기 위한 알고리즘을 제안하고자 한다. 본 논문의 2절에서는
본 논문에서 제안된 알고리즘의 성능을 평가하기 위한 첫 번째 테스트로 청취자가 개선된 음상의 방향을 지각하는지에 대한 평가를 수행하였다. 앞에서 말한 3가지 방법에 따라 생성된 앞/뒤 방향의
본 논문에서는 헤드폰 재생 시스템에서 비 개인화된 머리전달함수를 이용하여 입체음향을 생성할 때 발생하는 음상정위의 혼돈 문제를 개선하기 위한 알고리즘을 제안한다.
본 논문에서는 헤드폰 재생 시스템에서 비 개인화된 머리전달함수를 이용하여 입체음향을 생성할 때 발생하는 음상정위의 혼돈 문제를 개선하기 위한 알고리즘을 제안한다.
본 논문은 머리전달함수를 이용하여 보다 현실적인 입체음향을 생성하는 과정에서 발생하는 혼돈원추의 문제를 해결하기 위한 알고리즘을 제안한다. 제안된 알고리즘의 성능을 확인하기 위하여 헤드폰 환경에서 음상정위 테스트 및 청감 테스트를 수행하였다.
(f)의 스펙트럼 차를 고려한다. 이는 심리음향의 특성을 적용하기 위한 전처리 작업으로서 혼돈을 일으키는 방향의 HRTF 쌍의 유사 성분을 제거하고 해당 방향의 스펙트럼 특성을 확인하기 위함이다. 먼저
(f)의 스펙트럼 차를 고려한다. 이는 심리음향의 특성을 적용하기 위한 전처리 작업으로서 혼돈을 일으키는 방향의 HRTF 쌍의 유사 성분을 제거하고 해당 방향의 스펙트럼 특성을 확인하기 위함이다. 먼저
이에 본 연구에서는 머리전달힘수가 인간의 귀에 미치는 청각자극 에너지를 계산한 후 이를 바탕으로 하여 머리전달함수를 개선하는 알고리즘을 제안하고자 한다.
후)청각 지극">청각지극 에너지만 고려할 경우 가중치를 제대로 적용할 수 없게 된다. 이에 우세한 대역만을 강조하기 위하여 앞에서 계산한 주파수 차를 고려하는 부분을 추가시켜 준다. 일정 임계값 이상 주파수 차가 존재하는 부분에는 심리음향을 이용해 생성한 가중치를 적용시키지만 주파수 차가 크지 않은 부분은
가설 설정
헤드폰을 이용하여 가상음향을 재생하는 경우 사람이 음을 인지하는 요소가 청각기관으로 입사하는 음파에만 의존한다고 가정할 수 있다. 그렇다면 청각기관에서의 음을 직접 녹음하여
제안 방법
그러나 본 논문에서 제안하는 방법은 머리전달함수가 인간의 청각에 미치는 영향을 이용함으로서 음상을 정위하려는 방향이 변함에 따라 능동적으로 가중치를 생성할 수 있게 된다. 더불어
그러나 본 논문에서 제안하는 방법은 머리전달함수가 인간의 청각에 미치는 영향을 이용함으로서 음상을 정위하려는 방향이 변함에 따라 능동적으로 가중치를 생성할 수 있게 된다. 더불어
그러나 제안된 알고리즘을 이용하여 생성된 입체음향은 머리전달함수의 각 주파수 에너지가 인간의 청각에 미치는 영향을 고려한다. 그 결과로 각
이외에 Vocal sound는 인간의 음성 신호를 3차원 공간상에 정위시키는 상황에서의 성능을 확인하기 위해 사용하였다. 마지막으로 저주파 대역에의 에너지가 큰 신호에서의 성능 테스트를 위해 Helicopter sound를 사용하였다.
먼저 음상을 정위시키길 원하는 a 방향의 머리전달함수, HRTFa 및 이와 혼돈 방향인 b 방향의 머리전달함수, HRTFb에 푸리에 변환을 적용하여 주파수 영역으로 변환한다.
먼저 음상을 정위시키길 원하는 a 방향의 머리전달함수, HRTFa 및 이와 혼돈 방향인 b 방향의 머리전달함수, HRTFb에 푸리에 변환을 적용하여 주파수 영역으로 변환한다.
비교대상은 원 머리전달함수, 필터뱅크 방식 및 제안한 방식으로서 방위각 0/180°, 30/150°, 45/135°, 60°/120°의 네 방향에 대해서 테스트를 실시하였다.
성능을 평가하기 위한 두 번째 테스트로는 제안된 알고리즘을 통해 생성된 입체음향의 음질 변화 정도를 판단하기 위해 청감 테스트를 실시하였다.
후)입체 음향을">입체음향을 생성하는 과정에서 발생하는 혼돈원추의 문제를 해결하기 위한 알고리즘을 제안한다. 제안된 알고리즘의 성능을 확인하기 위하여 헤드폰 환경에서 음상정위 테스트 및 청감 테스트를 수행하였다. 테스트는 일반 생활 잡음이 존재하는 사무실 환경에서 수행되었으며 사용된 사운드 신호들은 오디오 CD 및 영화 DVD에서 추출된 44.
후)입체 음향을">입체음향을 생성하는 과정에서 발생하는 혼돈원추의 문제를 해결하기 위한 알고리즘을 제안한다. 제안된 알고리즘의 성능을 확인하기 위하여 헤드폰 환경에서 음상정위 테스트 및 청감 테스트를 수행하였다. 테스트는 일반 생활 잡음이 존재하는 사무실 환경에서 수행되었으며 사용된 사운드 신호들은 오디오 CD 및 영화 DVD에서 추출된 44.
후)첫 번째로">첫번째로 혼돈원추 상에서의 음상정위감을 개선하기 위하여 사용된 필터뱅크 알고리즘을 고려한다. 필터뱅크 알고리즘은 앞/뒤
후)첫 번째로">첫번째로 혼돈원추 상에서의 음상정위감을 개선하기 위하여 사용된 필터뱅크 알고리즘을 고려한다. 필터뱅크 알고리즘은 앞/뒤
후)입체 음향에">입체음향에 대한 음상정위 테스트 결과를 나타내고 있다. 표 2에서 제시한 음원에 대한 테스트를 수행한 후 각 혼돈방향에 따른 평균값을 제시하였다.
후)입체 음향에">입체음향에 대한 음상정위 테스트 결과를 나타내고 있다. 표 2에서 제시한 음원에 대한 테스트를 수행한 후 각 혼돈방향에 따른 평균값을 제시하였다.
대상 데이터
본 논문에서 제안된 알고리즘의 성능을 평가하기 위한 첫 번째 테스트로 청취자가 개선된 음상의 방향을 지각하는지에 대한 평가를 수행하였다. 앞에서 말한 3가지 방법에 따라 생성된 앞/뒤 방향의 입체음향 3가지를 들려준 후 앞/뒷 방향에 대해 인지하는 정확도를 측정하였으며 20대의 일반 남녀 10명을 대상으로 하였다.
후)방위 각">방위각
0/180°, 30/150°, 45/135°, 60°/120°의 네 방향에 대해서 테스트를 실시하였다. 입력사운드 신호로는 표 2와 같이 Classic, Vocal, Helicopter sound의 3가지를 사용하였다.
에서 KEMAR dummy head를 사용하여 즉정한 것을 사용하였다. 테스트 장비로는 청취자의 귀에 밀착되는 헤드폰 (audio-technica ATH-ES7), Pentium computer (Intel core2duo E8500)를 사용하였다. 그리고 재생시스템과
제안된 알고리즘의 성능을 확인하기 위하여 헤드폰 환경에서 음상정위 테스트 및 청감 테스트를 수행하였다. 테스트는 일반 생활 잡음이 존재하는 사무실 환경에서 수행되었으며 사용된 사운드 신호들은 오디오 CD 및 영화 DVD에서 추출된 44.1 kHz, 16 bits/sample 사운드 신호를 이용하였다. 사용된
이론/모형
Creating 3D sound using filterbank method (Aa 0°, Ele. 30s5).
후)평가기준으로는">평가 기준으로는
CCIR Recommendation에서 음질 평가를 위해 채택한 방법인 Degradation Category Rating (DCR) Method를 사용하였다. DCR Method는
후)평가기준으로는">평가 기준으로는 CCIR Recommendation에서 음질 평가를 위해 채택한 방법인 Degradation Category Rating (DCR) Method를 사용하였다. DCR Method는
성능/효과
후)방위 각">방위각 30°와 150°에 대한 앞 방향의 HRTF 스펙트럼 차를 나타내는 것이다. 1.5 kHz 이하에서는 방위각이 변해도 스펙트럼 차이는 크지 않지만 1.5 kHz 이상의 대역에서는 피크나 노치로 인하여 큰 변화를 나타냄을 확인할 수 있다. 또한
후)머리 전달함수의">머리전달함수의 각 주파수 에너지가 인간의 청각에 미치는 영향을 고려한다. 그 결과로 각 임계 대역마다 효과적으로 가중치를 생성 및 적용할 수 있으므로 보다 현실적인 느낌을 줄 수가 있다. 더불어 주파수 차를 이용하여 가능한 음질의 왜곡을 줄일 수 있다는 장점도 가지고 있다.
후)앞 방향이">앞방향이 우세한 대역이다. 그러나 8 kHz~10 kHz 근처에 존재하는 큰 에너지로 인하여 영향을 받음으로서 청각 에너지 비에서는 뒷방향이 우세한 것으로 판단되었다. 더불어 24번째 임계 대역 (12 kHz~15 kHz)에서는 앞 방향이 우세한 대역 및
후)증폭시켜주게">증폭시켜 주게 되어 정위감이 떨어지는 문제가 발생할 수도 있다. 그러나 본 논문에서는 주파수 차를 같이 고려해 줌으로서 음상을 정위하고자 하는 방향의 특성만을 강조해 주게 됨으로 그 성능을 향상 시킬 수 있다.
후)청각에너지">청각 에너지 비에서는 뒷방향이 우세한 것으로 판단되었다. 더불어 24번째 임계 대역 (12 kHz~15 kHz)에서는 앞 방향이 우세한 대역 및 뒷 방향이 우세한 대역이 혼재되어 있지만 청각 자극 에너지 비율은 뒷방향이 우세한 것으로 확인할 수 있다. 따라서 단순히 가중치만을 적용하게 된다면 혼돈 방향의 특성까지 같이
후)청각에너지">청각 에너지 비에서는 뒷방향이 우세한 것으로 판단되었다. 더불어 24번째 임계 대역 (12 kHz~15 kHz)에서는 앞 방향이 우세한 대역 및 뒷 방향이 우세한 대역이 혼재되어 있지만 청각 자극 에너지 비율은 뒷방향이 우세한 것으로 확인할 수 있다. 따라서 단순히 가중치만을 적용하게 된다면 혼돈 방향의 특성까지 같이
후)머리 전달함수가">머리전달함수가 인간의 청각에 미치는 영향을 이용함으로서 음상을 정위하려는 방향이 변함에 따라 능동적으로 가중치를 생성할 수 있게 된다. 더불어 혼돈방향 간의 주파수 차를 고려함으로서 효율적인 정위감 구현이 가능할 뿐 아니라 음질의 변화도 최소화 할 수 있다. 그 결과로 청자에게 원하는 방향에 음상이 존재함을 지각시킬 수 있게 된다.
후)두머리전달함수의">두 머리전달함수의 주파수 차를 고려하게 된다. 제안된 방식을 통해 생성된 입체음향은 음상정위 및 청감 테스트에서 개선된 결과를 나타냄을 확인할 수 있었다. 또한 기존의
테스트 결과를 보면 기존의 필터뱅크 방식을 통해 생성된 입체음향은 음질의 열화가 심함을 알 수 있다. 이는 방위각이 정면에서 좌측 또는 우측으로 감에 따라
후)필터뱅크">필터 뱅크 방식을 이용하여 생성된 입체 음향은 음상을 정위시키려는 각도가 커지면 커질수록 좋지 않은 결과를 보여주고 있다. 테스트 결과에서 확인할 수 있듯이 제안된 방법이 기존의 방법에 비해서 성능이 개선되었음을 알 수 있다. 이는 제안된 알고리즘을 이용하여
후속연구
후)머리 전달함수는">머리전달함수는
모노음에 컨벌루션 연산을 통해 적용되어 음상을 원하는 위치에 정위시키게 된다. 그 결과로 인간은 소리의 위치를 정확하게 지각할 수 있으므로 게임이나 시뮬레이터와 같은 가상현실 공간 안에서 보다 더 현실감을 느낄 수 있을 것이다.
따라서 모든 시스템에서 성능을 나타내기에는 한계가 있다. 그러므로 향후 진행될 연구 과제는 스피커를 이용하는 재생 시스템에서 보다 현실감 있는 청각모델링 구현에 대한 연구가 진행될 예정이다.
구교식, 차형태, "스테레오 시스템을 위한 머리전달함수의 개선," 한국음향학회지 27권, 4호, 207-214쪽, 2008
이기승, 이석필, "원형 머리 모델을 이용한 머리 전달 함수의 보간," 한국음향학회지 27권, 7호, 333-341쪽, 2008
박장식, 김현태, "합성 스테레오 방식 3차원의 입체음향의 실시간 구현을 위한 머리전달 함수의 IIR 필터 설계," 한국콘텐츠학회지, 5권, 6호, 74-86쪽, 2005
Durand R. Begault, 3-D Sound for Virtual Reality and Multi-media, NASA, 2000
김경훈, 김시호, 배건성, 최송인, 박만호, "헤드폰 기반의 입체음향 생성에서 앞/뒤 음상정위 특성 개선," 한국통신학회지 29권 8c호, 1142-1148쪽, 2004
Chong-Jin Tan, Woon-Seng Gan, "User-defined spectral manipulation of HRTF for improved localisation in 3D sound systems," Electronics letters, Vol. 34 No. 25, pp. 2387-2389, 1998
Navarun Gupta, Armando Barreto and Carlos Ordonez, “Spectral Modification of head-related transfer functions for improved virtual sound spatialization,” ICASSP '02, Vol. 2, pp. 1953-1956, 2002
Ming Zhang, Kah-Chye Tan and M.H.Er, "A Refined Al-gorithm of 3D Sound Synthesis," ICSP98, pp.1408-1411, Oct. 1998
ITU-T P.800, Methods for subjective determination of trans-mission quality. Aug, 1996
※ AI-Helper는 부적절한 답변을 할 수 있습니다.