최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국전자통신학회 논문지 = The Journal of the Korea Institute of Electronic Communication Sciences, v.12 no.3, 2017년, pp.485 - 492
GMM has been one of the most popular methods for scream sound detection. In the conventional GMM, the whole training data is divided into scream sound and non-scream sound, and the GMM is trained for each of them in the training process. Motivated by the idea that the process of scream sound detecti...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
16 kHz로 샘플링 된 오디오 신호의 변환과정은 어떻게 되는가? | 16 kHz로 샘플링 된 오디오 신호는 고차원 성분을 강조하는 고주파 통과 필터인 pre-emphasis 와 25ms의 길이를 가지는 Hamming windowing을 거친 후 FFT(: Fast Fourier Transform)을 통하여 Mel-scale의 필터뱅크 출력(filterbank output)으로 변환된다. 필터뱅크 출력은 로그 변환을 거친 후 DCT(: Discrete Cosine Transform)를 거쳐서 13차의(c0포함) MFCC 벡터로 변환된다. | |
전통적으로 비명 소리 검출을 위한 오디오 신호의 특징으로 사용된 값은 무엇인가? | 비명 소리 검출을 위한 오디오 신호의 특징으로는 전통적으로 영교차율(zero crossing rate), 피치(pitch) 그리고 상관계수(correlation)값들이 사용되어 왔다[5], [10]. 그러나 최근에는 음성인식에서 우수한 성능을 보인 MFCC(: Mel-frequency cepstral coefficient)를 이용함으로서 보다 향상된 검출 성능을 보이는 연구 결과들이 발표되고 있다[5]. | |
오디오 분석 기술을 보안 상황에 접목한 연구에는 무엇이 있는가? | 최근에는 이와 같은 오디오 분석 기술을 보완 상황에 접목한 우수한 연구결과들이 다수 발표되고 있다1). 예를 들어, 자동차의 주변에서 발생하는 소음을 탐지하여 외부 충격 여부를 결정한다든지 사람의 비명소리나 크게 다투는 소리 또는 총소리 등을 CCTV에 부착된 마이크로폰을 통하여 탐지하는 기능에 대한 연구들이 있었다[1-6]. 그밖에도 최근에 들어서는 단순한 특정 소리만을 탐지하는 기능을 벗어나서, 여러 가지 종류의 소리를 탐지한 이후 이들이 소리를 발생시키는 현장의 상황을 종합적으로 판단하는 오디오장면 검출 분야가 음성인식의 새로운 분야로 떠오르고 있기도 한다[7]. |
S. Ntalampiras, I. Potamitis and N. Fakotakis, "On acoustic surveillance of hazardous situations", In Proc. IEEE International Conference on Acoustics, Speech and Signal Processing, Tapei, Taiwan, April 2009, pp. 165-168.
J. Park, J. Lim, J. Yang, J. Kyung and M. Hahn, "False Positive Movie Clip Decision in Black-box Using Car Door-Closing Sound Classification", The Institute of Electronics and Information Engineers, vol. 37, no. 1, June. 2014, pp. 761-763.
J. Pohjalainen, P. Alku and T. Kinnunen, "Shout detection in noise", in Proc. IEEE International Conference on Acoustics, Speech and Signal Processing, Prague, Czech Republic, May 2011, pp. 4968-4971.
L. Gerosa, G. Valenzise, M. Tagliasacchi, F. Antonacci and A. Sarti, "Scream and Gunshot Detection in Noisy Environments", in Proc. European Signal Processing Conference, Poznan, Poland, Sept. 2007, pp. 1216-1220.
K. Imoto and N. Ono, "Acoustic scene analysis from acoustic event sequence with intermittent missing event" in Proc. IEEE International Conference on Acoustics Speech and Signal Processing., South Brisbane, Australia, 2015, pp.156-159.
S. Chung and Y. Chung, "A comparision between methods for scream detection based on SVM and GMM", J. of Korean Institute of Information Technology, vol. 15, no. 3, Mar. 2017, pp. 65-72.
D. Reynolds, T. Quatieri and R. Dunn, "Speaker verification uisng adapted Gaussian mixture model", Digital Signal Processing, vol. 10, no.1, 2000, pp.19-41.
W. Huang, T. K. Chiew, H. Li, T. S. Kok and J. Biswas, "Scream detection for home applications", in Proc. of IEEE Conference on Industrial Electronics and Applications, June 2010, pp. 2115-2120.
ETSI draft standard doc., Speech Processing, Transmission and Quality aspects (STQ); Distributed speech recognition; Front-end feature extraction algorithm; Compression algorithm. ETSI Standard ES 202 050, 2002.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.