본 논문에서는 다채널 스피커를 사용하는 음향 시스템에서의 가상 음원 생성 알고리즘을 제안하고 있다. 영상 신호의 표준은 보다 높은 해상도와 더 넓은 시야각을 제공하는 HD급이나 그 이상의 UHD급 등의 규격이 점차 상용화되고 있다. 그에 따라 음향 신호 또한 더 넓어진 음향 공간에서의 효과적인 음원 생성에 대한 필요성이 증가하고 있다. 기존의 스테레오 스피커 시스템으로는 원하는 사운드 효과를 재생하는데 한계를 가질 수밖에 없기 때문에, 여러 개의 스피커를 사용한 다양한 배치의 다채널 스피커 시스템이 제안되고 있다. 그러나 다수의 스피커를 사용한 시스템에서 기존의 사운드 패닝 알고리즘과 같은 가상 음원 생성 기술을 그대로 적용할 경우, 불연속적인 방향성 문제나 음색 열하 등의 또다른 문제가 발생할 수 있다. 이를 해결하기 위하여 임의의 배치의 다채널 스피커 시스템에서 적용 가능한 벡터 기반의 가상 음원 생성 알고리즘을 제안하였다. 제안된 알고리즘은 벡터 기반의 게인 조절 함수를 이용하여 음원의 방향감을 쉽고 효과적으로 생성할 수 있으며, 대칭 혹은 비대칭의 다채널 스피커 배치에 대해서 모두 적용 가능하다. 기존에 잘 알려진 VBAP와 MDAP의 레벨 패닝 방법과 의 청취 비교 실험을 통하여 보다 정확한 패닝 성능을 유지할 수 있는 것으로 확인되었다.
본 논문에서는 다채널 스피커를 사용하는 음향 시스템에서의 가상 음원 생성 알고리즘을 제안하고 있다. 영상 신호의 표준은 보다 높은 해상도와 더 넓은 시야각을 제공하는 HD급이나 그 이상의 UHD급 등의 규격이 점차 상용화되고 있다. 그에 따라 음향 신호 또한 더 넓어진 음향 공간에서의 효과적인 음원 생성에 대한 필요성이 증가하고 있다. 기존의 스테레오 스피커 시스템으로는 원하는 사운드 효과를 재생하는데 한계를 가질 수밖에 없기 때문에, 여러 개의 스피커를 사용한 다양한 배치의 다채널 스피커 시스템이 제안되고 있다. 그러나 다수의 스피커를 사용한 시스템에서 기존의 사운드 패닝 알고리즘과 같은 가상 음원 생성 기술을 그대로 적용할 경우, 불연속적인 방향성 문제나 음색 열하 등의 또다른 문제가 발생할 수 있다. 이를 해결하기 위하여 임의의 배치의 다채널 스피커 시스템에서 적용 가능한 벡터 기반의 가상 음원 생성 알고리즘을 제안하였다. 제안된 알고리즘은 벡터 기반의 게인 조절 함수를 이용하여 음원의 방향감을 쉽고 효과적으로 생성할 수 있으며, 대칭 혹은 비대칭의 다채널 스피커 배치에 대해서 모두 적용 가능하다. 기존에 잘 알려진 VBAP와 MDAP의 레벨 패닝 방법과 의 청취 비교 실험을 통하여 보다 정확한 패닝 성능을 유지할 수 있는 것으로 확인되었다.
In this paper, we proposes the virtual sound source panning algorithm in the multichannel system. Recently, High-definition (HD) and Ultrahigh-definition (UHD) video formats are accepted for the multimedia applications and they provide the high-quality resolution pixels and the wider view angle. The...
In this paper, we proposes the virtual sound source panning algorithm in the multichannel system. Recently, High-definition (HD) and Ultrahigh-definition (UHD) video formats are accepted for the multimedia applications and they provide the high-quality resolution pixels and the wider view angle. The audio format also needs to generate the wider sound field and more immersive sound effects. However, the conventional stereo system cannot satisfy the desired sound quality in the latest multimedia system. Therefore, the various multichannel systems that can make more improved sound field generation are proposed. In the mutichannel system, the conventional panning algorithms have acoustic problems about directivity and timbre of the virtual sound source. To solve these problems in the arbitrary positioned multichannel loudspeaker system, we proposed the virtual sound source panning algorithm using multiple vectors base nonnegative amplitude panning gains. The proposed algorithm can be easily controlled by the gain control function to generate an accurate localization of the virtual sound source and also it is available for the both symmetric and asymmetric loudspeakers format. Its performance of sound localization is evaluated by subjective tests comparing with conventional amplitude panning algorithms, e.g. VBAP and MDAP, in the symmetric and asymmetric formats.
In this paper, we proposes the virtual sound source panning algorithm in the multichannel system. Recently, High-definition (HD) and Ultrahigh-definition (UHD) video formats are accepted for the multimedia applications and they provide the high-quality resolution pixels and the wider view angle. The audio format also needs to generate the wider sound field and more immersive sound effects. However, the conventional stereo system cannot satisfy the desired sound quality in the latest multimedia system. Therefore, the various multichannel systems that can make more improved sound field generation are proposed. In the mutichannel system, the conventional panning algorithms have acoustic problems about directivity and timbre of the virtual sound source. To solve these problems in the arbitrary positioned multichannel loudspeaker system, we proposed the virtual sound source panning algorithm using multiple vectors base nonnegative amplitude panning gains. The proposed algorithm can be easily controlled by the gain control function to generate an accurate localization of the virtual sound source and also it is available for the both symmetric and asymmetric loudspeakers format. Its performance of sound localization is evaluated by subjective tests comparing with conventional amplitude panning algorithms, e.g. VBAP and MDAP, in the symmetric and asymmetric formats.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 이러한 문제를 해결하기 위해서 현재까지 가장 많이 제안된 해결책은 좌우 스피커 사이에 추가적인 스피커를 배치하는 방법이다. ITU 3/2스피커 배치에서도 좌우 30도 스피커 사이 중앙에 센터 스피커를 배치하여 전방에서의 가상 음원 생성 과정에서 발생할 수 있는 위와 같은 문제점들을 해결하고자 하였다 [4]. 그리고 HD급 오디오 시스템에서는 둘 이상의 추가 스피커를 전방 스테레오 스피커 사이에 배치하는 방법도 연구되었다 [5,8].
따라서 본 논문에서는 현재까지 사용되는 가상 음원 생성 알고리즘의 장점을 유지할 수 있는 새로운 다채널 스피커 쌍을 이용한 패닝 알고리즘을 제안한다. 제안된 알고리즘은 VBAP와 같은 벡터 기반의 간단한 계산만으로 다채널 스피커 쌍을 이용한 패닝 게인을 얻을 수 있으며, 방향 정보에 따른 함수를 사용하여 음의 패닝 게인을 배제할 수 있는 방법을 적용하였다.
다채널 음원 패닝 알고리즘의 목적은 다채널 환경에서 가장 정확한 음원의 방향성을 얻기 위한 최적의 채널 패닝 게인을 계산하기 위한 것이다. 다채널 스피커 환경에서의 패닝 알고리즘에 대한 연구는 Gerzon으로부터 현재까지 많은 연구가 계속해서 이루어지고 있으며, 좌우 스테레오 채널이 센터로부터 같은 크기의 각도로 대칭인 경우뿐만 아니라, 비대칭인 경우, 그리고 전방 채널 환경뿐만 아니라 측후방 채널까지 청취자를 둘러싼 환경에 대한 연구로 확대되고 있다 [3-12].
다채널 스피커 환경에서의 패닝 알고리즘에 대한 연구는 Gerzon으로부터 현재까지 많은 연구가 계속해서 이루어지고 있으며, 좌우 스테레오 채널이 센터로부터 같은 크기의 각도로 대칭인 경우뿐만 아니라, 비대칭인 경우, 그리고 전방 채널 환경뿐만 아니라 측후방 채널까지 청취자를 둘러싼 환경에 대한 연구로 확대되고 있다 [3-12]. 본 연구에서는 음원의 방향성 생성에 중요한 다채널 스피커 배치의 대칭 또는 임의의 각도의 비대칭 환경에 적합한 가상 음원 생성 알고리즘에 대해 제안한다.
본 장에서는 그림 1의 대칭 혹은 비대칭의 임의의 다채널 스피커 배치에서 최적의 패닝 게인값을 구하기 위한 벡터 기반의 계산 방법을 제안한다. 제안된 패닝 게인 알고리즘은 기존의 스피커쌍을 이용한 패닝 방법이 가진 문제를 해결하기 위하여 MDAP와 같은 다채널 스피커쌍을 동시에 이용하는 방법을 사용하고 있다.
그리고[9]에서 제안한 것과 같이 음상의 퍼짐을 조절하기 위한두 패닝 벡터 사이의 각도 (spread angle)를 20°와 30° 두 가지에 대해 모두 비교하였다. 이는 두 가지 MDAP 방법의 성능 비교를 통해서 측면 방향일수록 패닝 성능이 떨어지는 VBAP의 영향을 확인하기 위한 것이다. 제안된 패닝 방법에 대해서는 그림 4에 표시된 것과 같이 변수을 대칭인 경우 0.
특히, 음의 패닝 게인은 매우 제한적인 청취 위치에 대해서만 패닝 성능을 보장한 것이며, 역위상의 문제로 음색의 변화도 일으킬 수 있다. 때문에 본 논문에서는 양의 부호를 갖는 패닝 게인만을 이용하여 다채널 스피커 시스템에서 간단한 계산 방법으로 정확한 패닝 게인을 얻기 위한 가상 음원 생성 알고리즘인 MVBNAP를 제안하였다. 제안된 방법은 VBAP와 같이 벡터 기반의 계산 방법을 토대로 매우 간단한 연산량만으로 임의의 다채널 스피커 배치에서의 패닝 게인을 계산할 수 있다.
제안 방법
하지만 VBAP를 비롯한 레벨 패닝 방법이 측면 방향에서 패닝 오차가 커지기 때문에 MDAP 또한 측면 방향에서 좋은 성능을 보장하기 어렵다 [10]. 이에 대해서는 본 논문에서 청취 테스트에 의한 비교 실험을 통하여 VBAP와 MDAP의 패닝 방향에 대한 성능을 분석하였다.
따라서 본 논문에서는 현재까지 사용되는 가상 음원 생성 알고리즘의 장점을 유지할 수 있는 새로운 다채널 스피커 쌍을 이용한 패닝 알고리즘을 제안한다. 제안된 알고리즘은 VBAP와 같은 벡터 기반의 간단한 계산만으로 다채널 스피커 쌍을 이용한 패닝 게인을 얻을 수 있으며, 방향 정보에 따른 함수를 사용하여 음의 패닝 게인을 배제할 수 있는 방법을 적용하였다. 그리고 대칭인 스피커 배치에서 뿐만 아니라 비대칭인 임의의 각도의 스피커 환경에서도 적용 가능하며, 스피커 배치에 따라 간단한 변수값의 설정만으로 패닝 성능을 높일 수 있는 장점을 가지고 있다.
본 장에서는 그림 1의 대칭 혹은 비대칭의 임의의 다채널 스피커 배치에서 최적의 패닝 게인값을 구하기 위한 벡터 기반의 계산 방법을 제안한다. 제안된 패닝 게인 알고리즘은 기존의 스피커쌍을 이용한 패닝 방법이 가진 문제를 해결하기 위하여 MDAP와 같은 다채널 스피커쌍을 동시에 이용하는 방법을 사용하고 있다. 그럼에도 VBAP와 마찬가지로 다양한 각도의 다채널 스피커 배치에 적용 가능하고 간단한 연산을 통해 패닝 게인을 구할 수 있는 벡터 기반의 알고리즘이므로, 기존의 패닝 알고리즘들에 비해 더 정확한 패닝 음원을 쉽게 생성할 수 있는 장점을 가지고 있다.
VBAP에서는 세 채널 이상의 벡터 기반의 수식을 triplet-wise 패닝으로써 수직 방향이 포함된 3차원 공간의 방향감을 생성할 때 사용하였다 [7,9]. 제안된 알고리즘은 수평면에 위치한 다채널 스피커 환경에서 한 쌍의 스피커만을 사용하는 것이 아닌, 수평면 상의 다수의 스피커를 동시에 사용하여 보다 정확한 가상 음원의 방향감을 생성하기 위한 것으로 스피커 쌍을 이용한 패닝 방법과 차이를 가진다. 수식 (1)과 마찬가지로, 가상 음원의 벡터는 스피커 벡터에 채널에 따른 패닝 게인값이 곱해져 결정된다.
5 kHz 이하 대역에서는 음원의 방향감에 오차를 발생할 가능성이 있다 [11]. 따라서 본 논문에서는 제안된 다채널 스피커쌍을 이용한 패닝 방법에 대해서 음의 패닝 게인으로 인한 문제점을 막을 수 있는 방법을 3.2 장에서 제안한다.
하지만 한 지점의 매우 한정된 청취 위치를 가정하고 있기 때문에 VBAP와 같은 스피커쌍을 이용한 패닝 방법에 비해 스윗스팟이 좁고, 특히 음의 패닝 게인 사용으로 인해 발생 가능한 문제점에 민감하다는 단점을 가지고 있다 [11,13]. 본 논문에서는 3.1장에서 비대칭의 스피커 배치에서도 다채널을 동시에 사용하는 패닝 알고리즘을 제안하였다. 하지만 그림 3에 나타난 것과 같이, 기존의 연구와 마찬가지로 측면 스피커에 가까운 방향에 대해서 음의 패닝 게인을 가지기 때문에 본 장에서는 이를 해결하기 위한 센터 채널 게인 조절 함수를 제안한다.
1장에서 비대칭의 스피커 배치에서도 다채널을 동시에 사용하는 패닝 알고리즘을 제안하였다. 하지만 그림 3에 나타난 것과 같이, 기존의 연구와 마찬가지로 측면 스피커에 가까운 방향에 대해서 음의 패닝 게인을 가지기 때문에 본 장에서는 이를 해결하기 위한 센터 채널 게인 조절 함수를 제안한다.
둘째, 스피커와 가상 음원의 벡터 기반의 다채널 패닝 게인의 계산 방법에 부가적인 후처리 방법을 사용하지 않아야 한다. 이러한 조건을 만족시키기 위하여 스피커 벡터, 즉 채널 벡터를 각도에 따라 조절하는 방법을 제안하였다. 이전 장에서 다채널 벡터에 대한 행렬을 기반으로 최적의 패닝 게인을 찾았으나, 측면 방향의 패닝에 대해서 그 반대쪽 스피커 채널이 음의 패닝 게인을 갖는 것을 확인할 수 있었다.
다채널 스피커는 그림 1과 같이 총 세 개의 스피커를 대칭 (|θ1 -θ0|=|θ2 -θ0|)과 비대칭 (|θ1 -θ0|≠|θ2 -θ0|) 경우의 두 가지 경우에 대해서 테스트하였고, 각각의 스피커 각도는 청취자가 바라보는 0°의 정면을 기준으로 (30°, 0°, -30°)과 (40°, 0°, -20°)으로 배치하였다.
청취자로부터 스피커까지의 거리는 모두 1.5 m로 같게 맞추었으며, 패닝 각도는 좌우 스피커 사이의 방향에 대해 5° 간격으로 테스트 하였다.
다채널 스피커 환경에서 제안된 가상 음원 생성 알고리즘의 패닝 성능 평가를 위하여 주관적인 음질 평가가 이루어졌다. 주관적인 음질 평가에서는 패닝 성능을 보다 정확하게 평가하기 위하여, 실험 참가자가 직접 레퍼런스 음원 방향으로 가상 음원을 생성하는 패닝 게인을 조절하는 MOA (method of adjustment) 방법을 적용하였다[10,15].
그리고[9]에서 제안한 것과 같이 음상의 퍼짐을 조절하기 위한두 패닝 벡터 사이의 각도 (spread angle)를 20°와 30° 두 가지에 대해 모두 비교하였다.
그림 2에 나온 세 채널 스피커에 대한 VBAP 방법 [7]과 이를 개선한 MDAP 방법 [9]을 함께 실험하였으며, MDAP의 경우 모든 실험 각도를 만들기 위해서는 좌우 스피커 바깥으로 추가적인 스피커가 필요하기 때문에 ± 90°에 추가 스피커를 배치하였다.
패닝 성능 평가에는 기존의 레벨 패닝 방법들이 함께 비교 실험되었다. 그림 2에 나온 세 채널 스피커에 대한 VBAP 방법 [7]과 이를 개선한 MDAP 방법 [9]을 함께 실험하였으며, MDAP의 경우 모든 실험 각도를 만들기 위해서는 좌우 스피커 바깥으로 추가적인 스피커가 필요하기 때문에 ± 90°에 추가 스피커를 배치하였다.
때문에 본 논문에서는 양의 부호를 갖는 패닝 게인만을 이용하여 다채널 스피커 시스템에서 간단한 계산 방법으로 정확한 패닝 게인을 얻기 위한 가상 음원 생성 알고리즘인 MVBNAP를 제안하였다. 제안된 방법은 VBAP와 같이 벡터 기반의 계산 방법을 토대로 매우 간단한 연산량만으로 임의의 다채널 스피커 배치에서의 패닝 게인을 계산할 수 있다. 그리고 양의 값만을 사용하기 때문에 음의 패닝 게인에 의한 문제로부터 자유로울 수 있으며, 센터 채널 게인 조절 함수의 변수값의 설정에 따라 쉽고 세밀하게 패닝 각도를 조정할 수도 있다.
대상 데이터
주관적인 음질 평가에서는 패닝 성능을 보다 정확하게 평가하기 위하여, 실험 참가자가 직접 레퍼런스 음원 방향으로 가상 음원을 생성하는 패닝 게인을 조절하는 MOA (method of adjustment) 방법을 적용하였다[10,15]. 테스트 신호는 2 초 길이의 핑크 노이즈 (pink noise)가 사용되었으며, 레퍼런스는 원하는 패닝 각도에 놓인 모노 스피커에서 같은 테스트 신호를 재생하였다. 다채널 스피커는 그림 1과 같이 총 세 개의 스피커를 대칭 (|θ1 -θ0|=|θ2 -θ0|)과 비대칭 (|θ1 -θ0|≠|θ2 -θ0|) 경우의 두 가지 경우에 대해서 테스트하였고, 각각의 스피커 각도는 청취자가 바라보는 0°의 정면을 기준으로 (30°, 0°, -30°)과 (40°, 0°, -20°)으로 배치하였다.
실험에는 패닝 성능 평가와 음질 비교 실험의 경험을 가진 총 다섯 명의 오디오 엔지니어들이 참여하였으며, 이들은 본 실험에 앞서 그림 6과 같은 MOA 방법 및 PC 프로그램에 대해 적응할 수 있도록 충분한 연습이 이루어졌다. 음질 평가에 사용된 스피커는 일반적으로 쉽게 구할 수 있는 앰프가 내장된 중저가의 스피커가 사용되었으나, 레벨 패닝의 정확성을 높이기 위하여 실험에 들어가기 전에 청취자의 위치에서 사운드 레벨 미터를 사용하여 각각의 음압을 일정하게 맞추었다.
이론/모형
스피커를 사용하여 임의의 방향에서 가상 음원을 생성하기 위한 패닝 알고리즘은 사인 법칙과 탄젠트 법칙을 기반으로 발전하였다. 사인 법칙은 대칭의 스테레오 배치에서 스피커 사이의 공간 상의 임의의 각도에 대한 두 스피커에 곱해지는 채널 게인을 계산하는 방법을 제공하고 있으며, 탄젠트 법칙은 청취자의 머리가 음원이 들리는 방향으로 약간씩 치우치는 상황에서 사인 법칙보다 정확한 가상 음원의 방향감을 제공하는 것으로 알려져 있다.
하지만 다채널 스피커쌍을 이용하는 경우, 수식 (2)와 같은 스피커 벡터 행렬의 역행렬값을 구하기 어렵다. 따라서 본 논문에서는 주어진 p와 L012에 대한 패닝 게인 g을 얻기 위하여, LS (Least-squares)의 최적화해법에 의한 수도 역행렬 (pseudoinverse) 혹은 Moore-Penrose의 역행렬 계산 방법을 사용하여 다음과 같이 패닝 게인을 계산한다 [14].
다채널 스피커 환경에서 제안된 가상 음원 생성 알고리즘의 패닝 성능 평가를 위하여 주관적인 음질 평가가 이루어졌다. 주관적인 음질 평가에서는 패닝 성능을 보다 정확하게 평가하기 위하여, 실험 참가자가 직접 레퍼런스 음원 방향으로 가상 음원을 생성하는 패닝 게인을 조절하는 MOA (method of adjustment) 방법을 적용하였다[10,15]. 테스트 신호는 2 초 길이의 핑크 노이즈 (pink noise)가 사용되었으며, 레퍼런스는 원하는 패닝 각도에 놓인 모노 스피커에서 같은 테스트 신호를 재생하였다.
성능/효과
이후 1990년대 후반, Pulkki에 의해서 제안된 VBAP (Vector Base Amplitude Panning) 는 스피커의 배치에 상관없이 다양한 각도의 스피커 쌍을 이용하여서 패닝 레벨값을 구할 수 있는 패닝 방법이 제안되었다 [7]. VBAP를 이용하여 벡터 기반의 간단한 계산만으로 임의의 스피커 환경에서의 패닝 게인을 구할수 있게 되었고, 세 채널을 이용한 3차원 고도 방향으로의 패닝 게인을 구하는 triplet-wise 패닝도 가능해졌다.
이를 해결하기 위하여, Pulkki는 MDAP (Multiple-Direction Amplitude Panning)라는 여러 스피커를 동시에 사용하는 사운드 패닝 방법을 제안하였다 [9]. 동시에 두 개 이상의 가상 음원 벡터를 생성하여 하나의 가상 음원을 생성하는 MDAP 방법은 음상의 퍼짐 현상을 각도에 따라 균일하게 유지할 수 있었다. 하지만 VBAP를 비롯한 레벨 패닝 방법이 측면 방향에서 패닝 오차가 커지기 때문에 MDAP 또한 측면 방향에서 좋은 성능을 보장하기 어렵다 [10].
ITU 3/2 스피커 배치에서 전방에 기존의 스테레오 배치에 센터 채널을 추가한 것이 그러한 예이다 [4]. 스피커를 삽입하는 이유는 수평 시야각이 넓어진 HD급 컨텐츠의 전방에서 음원의 방향성을 향상시키기 위한 것으로 이를 통하여, 좌우 스피커로부터 각도상으로 먼 정면 부근에서의 방향성을 더 정확하게 생성할 수 있었다. 그림 1에서도 이와 같이 스테레오의 중앙에 추가적인 스피커가 더해진 다채널 스테레오 스피커 (multispeaker stereo) 환경을 나타낸 것으로, 이러한 다채널 스피커 환경에서는 기존과 다른 새로운 다채널 음원 패닝 알고리즘이 필요하다 [8].
이러한 조건을 만족시키기 위하여 스피커 벡터, 즉 채널 벡터를 각도에 따라 조절하는 방법을 제안하였다. 이전 장에서 다채널 벡터에 대한 행렬을 기반으로 최적의 패닝 게인을 찾았으나, 측면 방향의 패닝에 대해서 그 반대쪽 스피커 채널이 음의 패닝 게인을 갖는 것을 확인할 수 있었다. 이는 두 채널 스피커쌍 패닝의 경우에는 양의 값만 얻어지는 것과 비교하여, 세 채널 스피커쌍의 경우에 삽입된 센터 채널의 영향이 원인이 된 것을 알 수 있다.
이는 두 채널 스피커쌍 패닝의 경우에는 양의 값만 얻어지는 것과 비교하여, 세 채널 스피커쌍의 경우에 삽입된 센터 채널의 영향이 원인이 된 것을 알 수 있다. 이를 토대로 본 논문에서는 중간에 위치하는 스피커 벡터의 크기를 패닝 각도에 따라 조절해 줌으로써 음의 패닝 게인이 얻어지는 문제를 해결할 수 있었다.
MDAP의 경우에도 VBAP 의 결과와 비슷한 오차 경향을 보였으나, -5°~20° 부근에서는 전체적으로 2° 이내의 균일한 오차를 보이며 비교적 정확한 패닝 결과를 얻을 수 있었다.
또한 평균 오차 각도가 2° 이내로 작았으며, 모든 방향에서 패닝 다른 방법에 비해 균일한 성능을 보여주었다.
이에 비해 제안된 MVBNAP 패닝 방법은 좌우 15°~20° 부근을 제외한 모든 각도에서 MDAP 패닝 방법보다 정확한 패닝 결과를 보였다.
실험 결과에서 0°인 정면에서는 모든 방법이 정확한 패닝 결과를 보였다.
하지만 대칭인 경우에서처럼 측면 방향의 패닝에 대해 성능이 급격히 나빠지는 것을 확인할 수 있었는데, spread angle이 30° 인 경우에는 최대 평균 5°에 가까운 오차를 보이기도 하였다.
VBAP의 경우, 스피커가 위치한 30°, 0°, -30° 방향에서는 정확한 패닝 결과가 얻어졌지만, 스피커 부근의 방향에서는 톱니바퀴 효과에 의해 스피커 쪽으로 치우친 패닝 결과가 얻어진 것을 확인할 수 있다. MDAP의 경우에는 그러한 스피커 부근 방향에서의 치우침이 적었지만 측면 방향으로 갈수록 패닝의 정확성이 떨어지는 것이 확인되었다. 이는 측면쪽의 벡터를 만드는 패닝 성능이 정면쪽 벡터에 비해 상대적으로 떨어지기 때문에 그 영향이 MDAP 최종 패닝 성능에도 반영된 것으로 분석할 수 있다.
제안된 MVBNAP 패닝 방법은 정면 방향에서는 다른 방법에 비해 오차가 가장 컸던 반면, 20°~30° 부근에서는 가장 정확한 패닝 성능을 보였다.
그리고 대칭인 스피커 배치에서의 결과와 마찬가지로 모든 방향에서 평균 2° 이내의 오차를 보여 균일한 패닝 성능을 보인 것을 확인할 수 있었다.
본 논문에서 제안된 MVBNAP 방법은 양의 패닝 게인을 사용하고 벡터 기반의 패닝 게인 계산 방법을 사용한 기존의 레벨 패닝 방법들과 비교하여 패닝 성능 측면에서 보다 정확한 성능을 가진 것을 확인할 수 있었다. 그리고 VBAP나 MDAP와 같이 비대칭의 임의의 스피커 배치에 대해서도 모두 적용 가능한 장점을 가지고 있으나, 패닝 각도에 따라 성능의 차이를 완전히 제거하지는 못하였다.
그리고 양의 값만을 사용하기 때문에 음의 패닝 게인에 의한 문제로부터 자유로울 수 있으며, 센터 채널 게인 조절 함수의 변수값의 설정에 따라 쉽고 세밀하게 패닝 각도를 조정할 수도 있다. MOA를 사용한 청취 실험 결과 기존의 스피커 쌍을 이용한 레벨 패닝 방법과 다채널 스피커 쌍을 이용한 레벨 패닝 방법보다 대등하거나 더 좋은 패닝 성능을 보였으며, 특히 모든 각도에서 고른 성능을 보였다. 앞으로 다채널 스피커 배치뿐만 아니라 써라운드 스피커 환경에서 적용 가능한 가상 음원 생성 알고리즘으로 확장할 것이며, 센터 채널 게인 조절 함수의 가장 최적의 값을 찾기 위한 연구를 이어갈 것이다.
후속연구
그리고 VBAP나 MDAP와 같이 비대칭의 임의의 스피커 배치에 대해서도 모두 적용 가능한 장점을 가지고 있으나, 패닝 각도에 따라 성능의 차이를 완전히 제거하지는 못하였다. 모든 패닝 각도에 대해서 패닝 오차를 줄이고 음원의 방향성을 정확하게 생성하기 위해서는 보다 정밀한 센터 채널 게인 조절 함수의 설계가 필요할 것이다. VBAP를 비롯한 두 채널 스피커 쌍을 이용하는 패닝 방법들의 문제점이 패닝 실험 결과에서 다시 확인되었다.
MOA를 사용한 청취 실험 결과 기존의 스피커 쌍을 이용한 레벨 패닝 방법과 다채널 스피커 쌍을 이용한 레벨 패닝 방법보다 대등하거나 더 좋은 패닝 성능을 보였으며, 특히 모든 각도에서 고른 성능을 보였다. 앞으로 다채널 스피커 배치뿐만 아니라 써라운드 스피커 환경에서 적용 가능한 가상 음원 생성 알고리즘으로 확장할 것이며, 센터 채널 게인 조절 함수의 가장 최적의 값을 찾기 위한 연구를 이어갈 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
다채널 음원 패닝 알고리즘의 목적은?
다채널 음원 패닝 알고리즘의 목적은 다채널 환경에서 가장 정확한 음원의 방향성을 얻기 위한 최적의 채널 패닝 게인을 계산하기 위한 것이다. 다채널 스피커 환경에서의 패닝 알고리즘에 대한 연구는 Gerzon으로부터 현재까지 많은 연구가 계속해서 이루어지고 있으며, 좌우 스테레오 채널이 센터로부터 같은 크기의 각도로 대칭인 경우뿐만 아니라, 비대칭인 경우, 그리고 전방 채널 환경뿐만 아니라 측후방 채널까지 청취자를 둘러싼 환경에 대한 연구로 확대되고 있다 [3-12].
Ambisonics와 같은 가상 음원 생성 알고리즘의 장점은?
스피커 쌍을 이용하는 레벨 패닝 방법과 달리, Ambisonics 와 같이 다수의 스피커를 동시에 사용하는 가상 음원 생성 알고리즘에서는 스피커 패닝 게인에 양의 값과 음의 값을 모두 사용하였다 [8,12]. 이러한 방법은 점으로 정해진 한 지점의 스윗스팟에 대해서는 매우 정확한 패닝 성능을 보여주는 것으로 알려져 있다. 하지만 귀에 먼저도달하는 신호 방향으로 음원이 치우치는 precedence effect라 불리는 현상으로 인하여 청취자의 위치나 시선에 의한 스윗스팟 문제에 민감하고 [13], 또한 음의 패닝게인으로 인한 위상 (phase) 변화의 영향이 음질 열화로나타날 수 있는 단점을 가지고 있다 [11].
스피커 환경에서 레벨 패닝 알고리즘을 사용하는 경우에 생길 수 있는 문제점은?
스피커 환경에서 레벨 패닝 알고리즘을 사용하는 경우, 스피커 사이의 공간에 대해 음상이 퍼짐으로 인해, 음원의 방향성이 부정확해지는 문제점이 생길 수 있다. 이러한 문제를 해결하고 음원의 방향성을 더 정확하게 만들기 위해서 시스템적으로는 추가적인 스피커를 두 스피커 사이에 배치하기도 한다.
참고문헌 (15)
J. Blauert, Spatial Hearing: The Psychophysics of Human Sound Localization. Cambridge, MA: MIT Press, 1997.
F. Rumsey, Spatial Audio, Focal Press, Music Technology Series, 2001.
M. A. Gerzon, "Hierarchical system of surround sound transmissionfor HDTV," AES 92nd Convention, paper no. 3339, Vienna, Mar. 1992.
G. Theile, "The new sound format 3/2-stereo," AES 94th Convention, paper no. 3550a, Berlin, Mar. 1993.
G. Theile, "On the performance of two-channel and multichannelstereophony," AES 88th Convention, paper no. 2887, Montreux, Mar.1990
B. Bernfeld, "Attempts for better understanding of the directionalstereophonic listening mechanism," AES 44th Convention, paper no. C-4, Bucharest,Mar. 1973.
V. Pulkki, "Virtual sound source positioning using vector base amplitude panning," J. Audio Eng. Soc., vol. 45, no. 6, pp. 456-466, 1997.
M. A. Gerzon, "Panpot laws for multispeaker stereo," AES 92nd Convention, paper no. 3309,Vienna, Mar. 1992.
V. Pulkki, "Uniform spreading of amplitude panned virtual sources," in Proc. IEEE Workshop on Application of Signal Processing to Audio and Acoustics (WASPAA), New York, USA, 1999.
V. Pulkki and T. Hirvonen, "Localization of virtual sources in multichannel audio reproduction," IEEE Trans. on Speech and Audio Processing, vol. 13, no. 1, pp. 105-119, 2005.
G. Monro, "In-phase corrections for ambisonics," Int. Computer Music Conf. (ICMC ), pp. 292-295, Berlin, Germany, 2000.
P. G. Craven, "Continuous surround panning for 5-speakerreproduction," AES 24th Int. Conf. on Multichannel Audio: The New Reality, paper no. 9, Jun, 2003.
V. Pulkki, "Spatial sound generation and perception by amplitude panning technique," PhD thesis, Helsinki University of Technology, Espoo, Finland, 2001.
S. Haykin, Adaptive Filter Theory, 4th ed. Upper Saddle River, NJ: Prentice-Hall, 2002.
B. L. Cardozo, "Adjusting the method of adjustment: SD vs DL," J. Acoust. Soc. Am., vol. 37, no. 5, pp. 768-792, 1965.
이 논문을 인용한 문헌
저자의 다른 논문 :
활용도 분석정보
상세보기
다운로드
내보내기
활용도 Top5 논문
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다. 더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.