$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

천정형 배열 마이크를 이용한 강의용 광역 마이크 시스템
Wide Coverage Microphone System for Lecture Using Ceiling-Mounted Array Structure 원문보기

한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.22 no.4, 2018년, pp.624 - 633  

오우진 (School of Electronics, Kumoh National Institute of Technology)

초록
AI-Helper 아이콘AI-Helper

멀티미디어 강의시스템은 첨단 기술로 스마트해지고 있지만 마이크는 손에 들거나 신체에 부착하는 고전 방식에 여전히 의존하고 있다. 본 논문에서는 천정 부착형 배열 마이크를 제안하여 넓은 범위를 지원하면서 화자가 아무 장비를 착용하지 않고 자유롭게 이동이 가능함을 보였다. 제안된 시스템은 복잡한 빔 포밍 방식 대신에 이동통신의 셀(Cell)과 핸드 오버(Handover)를 적용하여 셀 간에 연속되는 마이크를 저가로 구현하였다. 음성에서 무성음 구간이 의사잡음(Pseudo Noise)과 유사한 특징을 이용하여 3개의 마이크에 지연-합의 다중경로 수신기를 연결하여 소프트 핸드오버를 제공하였다. 제안된 마이크 시스템은 강단 범위인 $6.3{\times}1.5m$ 영역에서 동작을 검증하였다. 실시간 처리를 위하여 상관기(Correlator)의 연산 범위를 82% 이상 줄였으며 출력 지연은 지연 적응 필터로 개선하였다.

Abstract AI-Helper 아이콘AI-Helper

While the multimedia lecture system has been getting smart using immerging technology, the microphone still relies on the classical approach such as holding in hand or attaching on the body. In this paper, we propose a ceiling mounted array microphone system that allows a wide reception coverage and...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 마이크 감도는 기기의 고정값이므로 실제로는 수신단에서 증폭 이득만 조정할 수 있다. 그러므로 본 논문에서는 수신 증폭을 조절하여 셀 내의 모든 사용자는 구분 없이 동시에 수신하고 다른 셀의 사용자는 감쇄되도록 제안할 것이다.
  • 다른 셀의 신호에 대한 알아보자. 마이크는 사용자를 구분할 수 없으므로 인접 셀의 신호가 미약하더라도 현재 셀의 사용자 신호를 수신하고 있으면 동시에 수신될 것이다.
  • 다수의 셀이 존재하는 경우에 다른 셀에 존재하는 사용자의 신호가 분리되는지 방안을 알아보자. 두 명의사용자가 각각 β와 γ에 있다고 가정하면 수신은 셀(A-B-C), (B-C-D), (C-D-E)로 구성된 모듈 1~3이 사용될 것이다.
  • 단일 사용자가 이동하는 경우에 핸드오버에 관해 알아보자. 그림 5의 셀에서 사용자가 α에 있는 경우에 셀(A-B-C)의 모듈 1과 셀 (B-C-D)의 모듈 2에서 모두 수신된다.
  • 마이크 셀에 대하여 알아보자. 그림 5와 같이 각 셀은 1개의 마이크로 이루어지며 셀 반경 r보다 이격거리d를 작게 설정하여 일부 겹치도록 한다.
  • 마이크를 손이나 몸에 착용하지 않고 넓은 범위에서 사용하는 기존의 방법을 알아보자. 기존의 연구들은 화상회용으로 개발되어 고감도의 줌 마이크를 사용하거나 배열 구조의 빔포밍 기법이 많이 사용되고 있다[1].
  • 먼저 무성음을 검출하는 방법을 알아보자. 기존에 피치 추출, 영점 검출 등과 같은 다양한 방법이 제시되어 왔으나 본 논문에서는 무성음의 자기상관 특성만 이용하므로 이를 적용하였다[5].
  • 본 논문에서는 강의 시스템에 적용 가능한 저가의 광역 마이크를 제안하고자 한다. 강의 시스템은 수신 범위가 강단으로 한정되고 단일 또는 소수의 화자만 존재한다는 것과 화상회의와 달리 강연자가 이동할 수 있다는 특징이 있다.
  • 본 논문에서는 강의시스템에 적합한 광역 마이크 기법을 제안하였다. 기존의 광역 마이크는 수십 개의 배열 마이크에 빔포밍 방식을 적용하여 원거리 수신하는 것으로 구현이 복잡하여 고가의 전문 화상회의 시스템에서 한정적으로 상용화되어 있다.
  • 음성의 수신부인 마이크를 셀(cell)로 운영하고 핸드오버(Handover)를 지원하려면 이동통신의 의사 잡음과 같은 직교 부호의 신호가 필수적이다. 사람의 음성에 특수 부호를 넣는 것은 불가능하므로 본 논문에서는 음성 신호에서 무성음이 백색잡음과 유사한 상관 특성을 갖는 것에 착안하여 이를 활용하였다. 자기 상관(AutoCorrelation)이 임펄스(Impulse) 형태로 나타나면 무성음으로 판정하고 이 구간의 신호를 다수의 마이크에서 상호상관(Cross Correlation)으로 지연과 에너지를 검출하는 것이다.
  • 천정에 부착하는 원거리 마이크를 사용하므로 전달 특성은 장애물이 없는 강한 LOS (Line-of-sight)의 자유공간 감쇄를 적용하였다. 이러한 환경에서 마이크 셀과 핸드오버에 대하여 적용 방안을 알아보겠다.

가설 설정

  • 두 명의사용자가 각각 β와 γ에 있다고 가정하면 수신은 셀(A-B-C), (B-C-D), (C-D-E)로 구성된 모듈 1~3이 사용될 것이다.
  • 먼저 β에 동기 되었다고 가정하면 β를 기준으로 상호상관을 구하므로 셀 B는 충분한 상호상관 값이 얻어져 정확한 지연으로 보상될 것이다.
  • 무음 구간에서는 모든 신호가 없으므로 핸드오버나 제안된 방식은 동작하지 않을 것이다. 화자가 다시 발성을 시작하면 음성 데이터의 획득 시간인 20ms의 시간 지연 후에는 정상 동작하게 될 것이다.
  • 본 논문은 첨단 강의실에 사용되는 마이크 시스템에 대한 광역화 방안이므로 동작환경을 다음과 같이 가정하였다. 적용 면적은 교실과 교단의 크기에 따라 설정하고 강단에 2명 이하의 화자만 존재한다고 가정하였다.
  • 본 논문은 첨단 강의실에 사용되는 마이크 시스템에 대한 광역화 방안이므로 동작환경을 다음과 같이 가정하였다. 적용 면적은 교실과 교단의 크기에 따라 설정하고 강단에 2명 이하의 화자만 존재한다고 가정하였다. 천정에 부착하는 원거리 마이크를 사용하므로 전달 특성은 장애물이 없는 강한 LOS (Line-of-sight)의 자유공간 감쇄를 적용하였다.
  • 4%를 무성음으로 판정하였다. 참고로 모의 실험에서는 셀의 범위를 제한하지 않고 모든 음원을 수신 가능한 것으로 가정하고 진행하였다. 그림 9c)는 마이크 C에서 검출된 지연과 그때의 첨두치이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
빔포밍이란? 빔포밍은 직선 또는 평면상에 배치된 다수의 마이크를 이용하여 특정 방향에 높은 수신 이득을 갖도록 조정하는 것이다. 이 방식은 무선통신 분야에서 활발히 연구되어 MIMO(multiple-input and multiple-output) 등과 연계하여 같은 고속 데이터 전송기법에 활용되고 있다.
마이크에서 일반적인 빔포밍 기법과 다른 접근이 요구되는 이유는 무엇인가? 일반적인 빔포밍 기법은 그림 1과 같이 간격 d를 파장 λ의 1/2 또는 1/4로 안테나를 배열하여 지향성으로 수신하는 것이다. 그러나 마이크에서 수신하는 음성 신호는 무선통신과 달리 반송파가 없는 기저대역 신호이므로 주파수 변동 폭이 높아서 다른 접근이 요구된다. 예를 들면 무선통신에서 1GHz의 반송파에 10MHz의 대역폭을 사용하는 경우 주파수 변동 비율은 1%이지만 음성 신호는 20Hz~20kHz의 대역폭을 가지므로 1000배의 주파수 변화를 갖고 있다.
음성 신호는 어떻게 구분되는가? 음성 신호는 유성음(Voiced), 무성음(Unvoiced), 무음(Silence)의 3가지로 구분하며 유성음과 무성음의 특성을 그림 4에 보였다. 유성음은 성대의 진동으로 만들어진 피치(Pitch)의 신호가 성도(Vocal tract)를 통과하며 만들어지며 주파수 특성이 저주파에 집중되고 다수의 첨두치를 갖는 특징을 보인다.
질의응답 정보가 도움이 되었나요?

참고문헌 (14)

  1. J. Benesty, M. M. Sondhi, and Y. Huang, Springer Handbook of Speech Processing. New York, NY: Springer, 2007. 

  2. Wainhouse Research. (2017, June). Evaluation of Nureva's HDL300 audio conference system: Hands-on testing of a wall-mounted USB mic/speaker solution [Internet]. Available: https://cp.wainhouse.com/download/59754/201706-Evaluation-NurevaHDL300-R1.pdf. 

  3. Z. Prime and C. Doolan, "A comparison of popular beamforming arrays," in Proceedings of Acoustics, Victor Harbor, Australia, pp. 151-157, 2013. 

  4. G. Stuber, Principles of Mobile Communication, 4th ed Boston, MA: Springer, 2017. 

  5. A. Upadhyay and R. B. Pachori, "Instantaneous voiced/non-voiced detection in speech signals based on variationalmode decomposition," Journal of the Franklin Institute, vol. 352, no. 7, pp. 2679-2707, July 2015. 

  6. W. H. Press, B. P. Flannery, S. A. Teuklsky, and W. T. Vetterling, "Fourier and spectral applications", in Numerical Recipes: The Art of Scientific Computing. 2nd ed. New York NY: Cambridge Univ., ch. 13, pp. 537-608, 1992. 

  7. S. So, K. J. Lee, K. You, H. Lim, and J. Park, "A study of the pitch estimation algorithms of speech signal by using average magnitude difference function(AMDF)," Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology, vol. 7, no. 4, pp. 235-242, Apr. 2017. 

  8. U.S. Department of Transportation. (2006, July). Federal highway administration university course on bicycle and pedestrian transportation: Lesson 8: pedestrian characteristics [Internet]. Available: http://www.tfhrc.gov/safety/pedbike/pubs/05085/pdf/combinedlo.pdf. 

  9. P. K. Meher, M. Maheshwari, "A high-speed FIR adaptive filter architecture using a modified delayed LMS algorithm," in Proceedings of IEEE International Symposium of Circuits and Systems, Rio de Janeiro, Brazil, pp. 121-124, May 2011. 

  10. European Broadcasting Union. (2008, September). Sound quality assessment material: recordings for subjective tests [Internet]. Available: http://www.ebu.ch/tech_32/tech_t3253.pdf. 

  11. T. J. Cox and P. D'Antonio, Acoustic Absorbers and Diffusers: Theory, Design and Application, New York, NY: Spon Press, 2001. 

  12. M. Kang and W. Oh, "Implementation of real-time sound-location tracking method using TDoA for smart lecture system," Journal of the Korea Institute of Information and Communication Engineering, vol. 21, no. 4, pp. 708-717, Apr. 2017. 

  13. W. Oh and J. J. Hwang, Apparatus Having Complex Howling Removing Process, Korean Patent KR101607902B1, to Kumoh National University of Technology, Kumi, Korea, 2014. 

  14. B. B. Boren, and A. Roginska, "Sound radiation of trained vocalizers," in Proceedings of Meetings on Acoustics, vol. 19, 035025, Montreal, Canada, June 2013. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로