$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

Conjoined Audio Fingerprint based on Interhash and Intra hash Algorithms 원문보기

International journal of contents, v.11 no.4, 2015년, pp.1 - 6  

Kim, Dae-Jin (Electronic Engineering Daejin University) ,  Choi, Hong-Sub (Electronic Engineering Daejin University)

Abstract AI-Helper 아이콘AI-Helper

In practice, the most important performance parameters for music information retrieval (MIR) service are robustness of fingerprint in real noise environments and recognition accuracy when the obtained query clips are matched with the an entry in the database. To satisfy these conditions, we proposed...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • In our experiment, we performed a simulation using a music database of 50, 000 popular songs in the mp3 format (44100 Hz, 2 channels, 16 bits per sample) that were converted from an audio CD. They included various genres, such as rock, pop, hip-hop, dance, and classical.
  • Thus, this scheme is more appropriate for a small- scale MIR service than for a massive MIR service. In this paper, we propose the new conjoined fingerprint scheme, which is based on an inter- and intrahashing algorithm that improves the robustness of the audio fingerprinting system in real noise environments, and can also be used in a massive MIR service.

대상 데이터

  • We randomly selected 500 songs for an audio query clip. The audio query clip was captured using an iPhone 5, which was placed 2.0 m away from a stereo speaker in real noise environments, such as a coffee shop, shopping mall, office, and street. Because the sound recording format is m4a in the iPhone 5, all audio query clips were recorded in this format.
  • The hash fingerprint block consists of 256 sub-fingerprints. The sub-fingerprint denotes the mth bit of the fingerprint of frame n as F ( n, m), which is formally defined as

이론/모형

  • The proposed audio fingerprinting system is based on the Philips hashing algorithm. To obtain a robust fingerprint in real noise environments, we propose the new conjoined fingerprint scheme, which is based on an inter- and intrahashing algorithm for fingerprint extraction.
본문요약 정보가 도움이 되었나요?

참고문헌 (8)

  1. P. Cano, E. Batlle, T. Kalker, and J. Haitsma, “A Review of Audio Fingerprinting,” J. VLSI Signal Processing Systems for Signal Image Video Technology, vol. 41, no. 3, 2005, pp. 271-284. 

  2. J. Haitsma and T. Kalker, “A Highly Robust Audio Fingerprinting System,” Proc. Of the 3rd Int. Symposium on Music Information Retrieval, 2002, pp. 144-148. 

  3. Mansoo Park, Hoi-Rin Kim, and Seung Hyun Yang, “Frequency Temporal Filtering for a Robust Audio Fingerprinting Scheme in Real-Noise Environments,” ETRI Journal, vol. 28, no. 4, 2006, pp. 509-512. 

  4. Wooram Son, Hyun-Tae Cho, Kyoungro Yoon, and Seok-Pil Lee, “Sub-fingerprint Masking for a Robust Audio Fingerprinting System in Real-noise Environment for Portable Consumer Devices,” IEEE Transactions on Consumer Electronics, vol. 56, no. 1, 2010, pp. 156-160. 

  5. J. Song, S. Bae, and K. Yoon, “Mid-level music melody representation of polyphonic audio for query-by-humming system,” International Symposium on Music Information Retrieval, 2002. 

  6. J. Song, S. Bae, and K. Yoon, “Query by humming: matching humming query to polyphonic audio,” IEEE International Conference on Multimedia and Expo, 2002. 

  7. J. Chen, K. Paliwal, and S. Nakamura, “Cepstrum derived from Differentiated Power Spectrum for Robust Speech Recognition,” Speech Communication, vol. 41, 2003, pp. 469-484. 

  8. H.-Y. Jung, “Filtering of Filter-Bank Energies for Robust Speech Recognition,” ETRI Journal, vol. 26, no. 3, 2004, pp. 273-276. 

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로