$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

입체음향효과 향상을 위한 스테레오-10.2채널 블라인드 업믹스 기법
Stereo-10.2Channel Blind Upmix Technique for the Enhanced 3D Sound 원문보기

한국음향학회지= The journal of the acoustical society of Korea, v.31 no.5, 2012년, pp.340 - 351  

최선웅 (연세대학교 전기전자공학과) ,  현동일 (연세대학교 전기전자공학과) ,  이석필 (전자부품연구원(KETI) 디지털미디어 연구센터) ,  박영철 (연세대학교 컴퓨터정보통신공학부) ,  윤대희 (연세대학교 전기전자공학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 입체음향효과의 향상을 위한 스테레오-10.2채널의 블라인드 업믹스 알고리즘을 제안하였다. 최근에, 소비자들은 더 나은 입체음향효과나 3D 사운드를 즐기길 원하고 다양한 멀티채널 포맷의 등장으로 업믹스 알고리즘들이 연구 되어 왔다. 그러나 기존의 업믹스 알고리즘들은 공간정보를 왜곡하는 문제점을 가지고 있었다. 이러한 문제점을 해결하기위해 전 후방 채널에 대한 이득 조절 및 10.2 채널의 각 채널별 믹싱 알고리즘을 제안한다. 기존의 상용화된 멀티채널 업믹스 알고리즘들과의 주관적 평가 실험결과 제안한 알고리즘은 입력신호의 공간정보를 유지하면서 입체음향효과를 향상시킨 것으로 확인되었다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we proposed the stereo-10.2channel blind upmix algorithm for the enhanced 3D sound. Recently, consumers want to enjoy better sound and the use of a various of multichannel configuration has been steadily improved. Thus, upmix algorithms have been researched. However, conventional upmi...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 최근들어 일반 가정에서도 영화관과 같은 입체음향효과를 즐기기 위해 홈 씨어터와 같은 멀티채널 오디오 시스템에 대한 수요가 급증하고 있다. 멀티채널 오디오 시스템은 실감나는 입체음향효과를 극대화 시키는데 그 목적이 있다. 이러한 목적을 달성하기 위해 그동안 활발한 연구가 진행되어 왔고, 다양한 스피커 배치와 개수의 사용으로 오디오 렌더링 기술을 꾸준히 발전시켜 왔다[1-2].
  • 본 논문에서는 스테레오를 이용해 멀티채널 포맷변환을 위한 업믹싱 기법을 제안하고 있다. 음원 재합성 과정에서는 본 논문에서 제안하고 있는 채널별 모듈을 이용해 실험적으로 스테레오와 기존의 업믹싱 기법들을 주관적 음질 평가를 통해 비교하였다.
  • 본 논문에서는 앞선 연구의 기존 알고리즘이 가지고 있는 채널 포맷 변환 과정 중 입력신호가 가지는 공간정보의 왜곡을 최소화 하는 전방채널 재합성방안 [10]을 이용하고 이를 기반으로 효과적인 입체음향과 풍부한 음장 효과를 극대화하기 위한 업믹스 알고리즘을 제안한다. 제안된 알고리즘들은 목표로 하고 있는 USC 10.
  • 이전 장에서는 멀티채널 오디오 신호로의 변환과정 중 음원 분석과정을 통해 좌・우 두 채널이 공통적으로 가지고 있는 주요성분, 패닝게인, 잔향성분을 분리하기 위한 알고리즘들을 소개 하였다. 이 장에서는 변환하고자 하는 채널 포맷에서 스테레오 입력을 가지는 공간정보의 유지와 확장된 스피커 채널 환경에서 입체음향효과를 극대화시키기 위한 음원 재합성 과정에 대해서 제안한다. 변환하고자 하는 채널포맷은 그림 3에 나타나 있는 USC 10.

가설 설정

  • ‘주요성분’을 녹음하기 위한 개개의 악기나 보컬 신호 근처에 위치한 몇 개의 마이크로폰과, ‘잔향(ambient)(잔향, 박수, 바람, 다양한 배경음) 성분’을 녹음하기 위한 몇 몇의 마이크로폰이 적절히 위치한다. 녹음된 음원을 이용하여 믹싱할 때에는 주요성분은 전방채널, 잔향성분들은 후방채널로 전달된다고 가정한다 [12]. 잔향 성분은 입력 스테레오 신호가 가지고 있는 잔향, 배경음에 해당하는 음원이며, 공간적 특성을 나타내는 성분이다.
  • 멀티채널 오디오 시스템에서 각각의 스피커에 어떤 신호가 전달되어야 할 것인가에 대한 정의를 하기 위하여 먼저 멀티채널 레코딩 환경을 정의한다. 멀티채널 레코딩 시에 멀티 마이크로폰이 녹음실 안의 각각의 지정된 위치에 있다고 가정한다. ‘주요성분’을 녹음하기 위한 개개의 악기나 보컬 신호 근처에 위치한 몇 개의 마이크로폰과, ‘잔향(ambient)(잔향, 박수, 바람, 다양한 배경음) 성분’을 녹음하기 위한 몇 몇의 마이크로폰이 적절히 위치한다.
  • 2채널 외에도 다양한 채널 포맷과 채널 추가 과정에서도 이용될 수 있는 호환성을 지니고 있다. 식 (1)과 같은 스테레오 신호모델은 기존의 많은 채널변환 연구에서 공통적으로 가정하고 있으며, 이 신호모델을 기반으로 단 구간 퓨리에 변환(short time Fourier transform)에 의해 얻어진 주파수 신호를 청각특성을 기반으로 하는 서브밴드단위인 임계대역(critical band)[11]으로 나누어서 입력 신호모델을 분석 하였다. 본 논문의 구성은 2장에서 멀티채널 환경과 음원 분석에 대한 소개와 음원 분석 알고리즘을 설명하고 3장에서는 멀티채널 포맷 변환을 위한 음원 재합성 과정을 채널별로 제안하였다.
  • 식 (1)과 같이 스테레오 신호는 레벨차이를 가지는 공통된 음원과 잔향이나 기타 배경음의 합으로 이루어져 있다고 가정 하였다. 여기서 스테레오 좌・우의 신호가 레벨 차이만을 가지는 음원들로만 구성되어 있다면 좌・우의 채널의 정규화된 상호 상관도(normalized cross corrrelation)는 ‘1’이 된다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
멀티채널 오디오 시스템의 목적은? 최근들어 일반 가정에서도 영화관과 같은 입체음향효과를 즐기기 위해 홈 씨어터와 같은 멀티채널 오디오 시스템에 대한 수요가 급증하고 있다. 멀티채널 오디오 시스템은 실감나는 입체음향효과를 극대화 시키는데 그 목적이 있다. 이러한 목적을 달성하기 위해 그동안 활발한 연구가 진행되어 왔고, 다양한 스피커 배치와 개수의 사용으로 오디오 렌더링 기술을 꾸준히 발전시켜 왔다[1-2].
멀티미디어 기술의 발전이 가져온 것은 무엇인가? 오늘 날 멀티미디어 기술의 발전은 영상과 음향에 대한 전반적인 기술의 발전을 가져 왔다. 화려한 색상과 넓은 화면, 고선명 화질, 실감나는 입체 음향 등에 있어 활발한 진행과 발전을 가져왔다. 최근들어 일반 가정에서도 영화관과 같은 입체음향효과를 즐기기 위해 홈 씨어터와 같은 멀티채널 오디오 시스템에 대한 수요가 급증하고 있다.
잔향성분의 역할은? 잔향 성분은 입력 스테레오 신호가 가지고 있는 잔향, 배경음에 해당하는 음원이며, 공간적 특성을 나타내는 성분이다. 잔향성분은 써라운드 또는 후방채널에 전달되어 공간감을 극대화하고 풍부한 사운드를 만드는데 사용된다. 이러한 믹싱 방법은 청취자가 다양한 무대나, 콘서트 홀의 스테이지가 앞에 위치하는 것 같은 공간정보를 줄 수 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (28)

  1. Dolby Laboratories, Dolby Surround Prologic II Decoder, Principles of Operation., http://www.dolby.com/uploaded Files/zz-_Shared_ Assets/English_PDFs/Professional/209_Dolby_Surround_Pro_Logic_II_Decoder_Principles_of_Operation.pdf 

  2. DTS Laboratories, An Overview of DTS NEO: 6 Multi-Channel, http://www.dts.com/media/upload/pdfs/DTS%20Neo6%20Overview.pdf, 2010 

  3. R. Irwan and R. M. Aarts, "Two-to-Five Channel Sound Processing," J.Audio Eng. Soc.,vol.50, no.11, pp. 914-926, 2002. 

  4. M. R. Bai, G.-Y. Shih, and J.-R. Hong, "Upmixing and downmixing two-channel stereo audio for consumer electronics," IEEE Trans. on Consumer Electronics, vol. 53, no. 3, pp. 1011-1019, 2007. 

  5. C. Avendano and J.-M. Jot, "A frequency domain approach to multichannel upmix," J.Audio Eng. Soc., vol. 52, no. 7/8, pp. 740-749, 2004. 

  6. C. Faller, "Multiple-loudspeaker playback of stereo signals," J. Audio Eng. Soc., vol. 54, no. 11, pp. 1051-1064, 2006. 

  7. J. Breebaart and E. Schuijers, "Phantom Materialization: A Novel Method to Enhance Stereo Audio Reproduction on Headphones," IEEE Trans. on Audio, Speech, and Language Processing, vol. 15, no. 8, pp. 1503-1511, 2008. 

  8. http://en.wikipedia.org/wiki/10.2 

  9. V. Pulkki, "Virtual sound source positioning using vector base amplitude panning," J. Audio Eng. Soc., vol. 45, no. 6, pp. 456-466, 1997. 

  10. S. W. Jeon, Y. C. Park, S. P. Lee, and D. H. Youn, "Robust representation of spatial sound in stereoto- multichannel upmix," AES 128th Conv., London, 2010. 

  11. J. Blauert, Spatial Hearing: The Psychophysics of Human Sound Localization., Cambridge, MA : MIT Press, Cambridge, Massachusetts, USA, revised edition, 1997. 

  12. T. Holman. "Mixing the Sound," Surround Magazine, pp. 35-37, 2001. 

  13. S. W. Jeon, D. G. Hyun, J. G. Seo, Y. C. Park, and D. H. Youn, "Enhancement of principal to ambient energy ratio for PCA-based parametric audio coding," in Acoustics Speech and Signal Processing (ICASSP), 2010 IEEE International Conference on, pp. 385-388, 2010. 

  14. S. Haykin, Adaptive Filter Theory, 4th.upper Saddle River, NJ: Prentice-Hall, 2002. 

  15. ITU-Recommendation ITU-R BS.775-1: Multichannel Stereophonic Sound System with and without Accompanying Picture, Geneva, 1992-1994. 

  16. Earl Vickers, "Frequency-Domain Two-to Three Channel Upmix for Center Channel Derivation and Speech Enhancement," AES 127th Convention, no. 7917, 2009. 

  17. S-W. Jeon, Y-C. Park, S-P. Lee, and D-H. Youn "Virtual Source Panning using Multiple-Wise Vector Base in the Multispeaker Stereo Format," in Proc in 19th European Signal Processing Conference, pp. 1337-1341, 2011. 

  18. J. B. Allen and D. A. Berkley, "Image method for efficiently simulating small-room acoustics," J. Acoust. Soc. Amer., vol. 65, pp. 943-950, 1979. 

  19. R.Y. Litovsky and H. S. Colburn, "The precedence effect," J. Acoustic. Soc. Am., vol. 106, no. 4, pp. 277-303, 1999. 

  20. Rice, JJ. May BJ, Spirou GA, and Young, ED. "Pinna-based spectral cues for sound localization in cat," Hearing Res, pp. 132-152, 1992. 

  21. G.S. Kendall," The Decorrelation of Audio Signals and Its Impact on Spatial Imagery," Computer Music Journal., vol. 19, no. 4, pp. 71-87, 1995. 

  22. 전세운, 박영철, 이석필, 윤대희, "다채널 포맷 변환과 공간적인 입체 음향 정보의 효과적인 유지에 대한 연구," 전자공학회 2010년도 하계종합학술발표회 논문집, 2010. 

  23. M.S. Vonton, M. F. Davis, and C. Q. Robinson, "Signal models and Upmixing Techniques For Generating Multichannel Audio," AES 127th International Conference, no. 7917, 2009. 

  24. http://en.wikipedia.org/wiki/Subwoofer 

  25. J. Borenius, "Perceptibility of direction and time delay errors in subwoofer reproduction," presented at the AES 79th Convention, no. 2290, 1985. 

  26. W. Martens, "The Impact of Decorrelated Low Frequency Reproduction on Auditory Spatial Imagery : Are Two Subwoofers Better than One?" AES 16th International Conference, pp. 67-77, 1999. 

  27. ITU-R BS.562.3, "Subjective assessment of sound quality", International Telecommunications Union, Geneva, Switzerland, 1990. 

  28. http://en.wikipedia.org/wiki/Dolby_Pro_Logic#Dolby_Pro_Logic_IIx 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로