본 논문에서는 해금 사운드콘텐츠의 저작권 보호를 위해 해금의 주파수 특성을 고려한 워터마킹알고리듬을 제안한다. 해금 음은 1500Hz~2000Hz 대역과 2800Hz~3500Hz 대역에서 배음 성분의 크기가 공통적으로 크게 나타나는데 이 대역을 워터마크 삽입대역으로 결정하였다. 제안한 방법은 원 신호에 푸리에 변환을 하여 주파수 영역으로 변환하고 삽입대역에 속한 배음 성분에 PN 시퀀스를 통해 생성한 워터마크 비트를 삽입하였다. 또한 저역통과 필터, 대역통과 필터, 잘라내기, 노이즈 추가, MP3 압축과 같은 공격에서 최대 1.41%의 BER을 보였고, 클래식, 팝, 가야금 등의 연주곡과 비교 실험 결과 해금에서 가장 뛰어난 성능을 보였다. 주관 청취 테스트인 MUSHRA 테스트 결과 해금 음에 대해서는 평균 98점 이상을 보였고 국악연주곡에서는 96.67점을 보여 모두 Excellent의 평가 결과를 보였다.
본 논문에서는 해금 사운드 콘텐츠의 저작권 보호를 위해 해금의 주파수 특성을 고려한 워터마킹 알고리듬을 제안한다. 해금 음은 1500Hz~2000Hz 대역과 2800Hz~3500Hz 대역에서 배음 성분의 크기가 공통적으로 크게 나타나는데 이 대역을 워터마크 삽입대역으로 결정하였다. 제안한 방법은 원 신호에 푸리에 변환을 하여 주파수 영역으로 변환하고 삽입대역에 속한 배음 성분에 PN 시퀀스를 통해 생성한 워터마크 비트를 삽입하였다. 또한 저역통과 필터, 대역통과 필터, 잘라내기, 노이즈 추가, MP3 압축과 같은 공격에서 최대 1.41%의 BER을 보였고, 클래식, 팝, 가야금 등의 연주곡과 비교 실험 결과 해금에서 가장 뛰어난 성능을 보였다. 주관 청취 테스트인 MUSHRA 테스트 결과 해금 음에 대해서는 평균 98점 이상을 보였고 국악연주곡에서는 96.67점을 보여 모두 Excellent의 평가 결과를 보였다.
This paper proposes a watermarking algorithm considering the frequency characteristics of Haegeum sounds for copyright protection of digital Haegeum sound contents. The harmonics of Haegeum sounds commonly have large magnitude values in 1500Hz~2000Hz and 2800Hz~3500Hz so that those bands are selecte...
This paper proposes a watermarking algorithm considering the frequency characteristics of Haegeum sounds for copyright protection of digital Haegeum sound contents. The harmonics of Haegeum sounds commonly have large magnitude values in 1500Hz~2000Hz and 2800Hz~3500Hz so that those bands are selected to embed a watermark. The proposed method computes the FFT (fast Fourier transform) of the original sound signal and embeds the watermark bits generated by PN (pseudo noise) sequence into the harmonics in the selected bands. Furthermore, the proposed method is robust to lowpass filter, bandpass filter, cropping, noise addition, MP3 compression attacks and the maximum BER (bit error rate) is 1.41% after lowpass filter attack. To measure the quality of the watermarked sound, subjective listening test, MUSHRA (multiple stimuli with hidden reference and anchor), was conducted. The mean value of MUSHRA listening test is bigger than 98 and 96.67 for every Haegeum sounds and Korean classical music with Haeguem, respectively.
This paper proposes a watermarking algorithm considering the frequency characteristics of Haegeum sounds for copyright protection of digital Haegeum sound contents. The harmonics of Haegeum sounds commonly have large magnitude values in 1500Hz~2000Hz and 2800Hz~3500Hz so that those bands are selected to embed a watermark. The proposed method computes the FFT (fast Fourier transform) of the original sound signal and embeds the watermark bits generated by PN (pseudo noise) sequence into the harmonics in the selected bands. Furthermore, the proposed method is robust to lowpass filter, bandpass filter, cropping, noise addition, MP3 compression attacks and the maximum BER (bit error rate) is 1.41% after lowpass filter attack. To measure the quality of the watermarked sound, subjective listening test, MUSHRA (multiple stimuli with hidden reference and anchor), was conducted. The mean value of MUSHRA listening test is bigger than 98 and 96.67 for every Haegeum sounds and Korean classical music with Haeguem, respectively.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 해금 사운드 콘텐츠 보호를 위해 해금의 배음 특성을 고려하여 에너지 분포가 큰 주파수 대역에 워터마크를 삽입함으로써 해금 소리에 적합한 워터마킹 알고리듬을 최초로 제안하였다. 해금 음은 공통적으로 1500H z~2000Hz 대역과 2800 ~3500Hz 대역에서 배음 성분의 크기가 크게 나타나므로 이 대역을 워터마크 삽입구간으로 활용하였다.
본 논문에서는 해금 콘텐츠 보호를 목적으로 해금 특성을 고려한 워터마킹 알고리듬을 제안하였다. 제안한 워터마킹 시스템의 성능을 평가하기 위해 각기 다른 장르의 음악을 대상으로 제안한 워터마킹 시스템을 적용하여 BER(Bit Error Rate)을 구하였다.
워터마킹을 적용한 연구는 없었다. 본 논문에서는 해금의 배음 특성을 고려하여 에너지가 큰 주파수 대역의 배음 성분에 워터마크 비트를 삽입함으로써 해금 콘텐츠를 효율적으로 보호할 수 있는 넌-블라인드 기반의 워터마킹 알고리듬을 제안한다. II장에서는 해금 소리의 특성을 m장에서는 제안한 워터마킹 알고리듬을 설명한다.
제안 방법
비트를 검출하였다. MP3 인코딩과 디코딩은 "Wave To MP3 Maker vl.2”와 "MP3 to Wave Maker vl.2”를 각각 이용하였으며, 잘라내기 공격은 사운드 포지를 이용하여 워터마크가 삽입된 오디오 신호에 처음 40% 정도의 구간에 워터마크가 전혀 삽입되어 있지 않은 원 신호를 삽입하여 워터마크에 직접적인 손실을 주었다. 저역통과 필터와 대역 통과 필터 공격에는 2차 버터워스 필터를 이용하였는데 저역통과 필터의 차단주파수는 10000Hz로, 대역통과 필터의 차단주파수는 100Hz와 600Hz로 하였으며 노이즈 추가에는 백색 잡음을 사용하였다.
본 논문에서는 해금 소리의 주파수 특성을 고려하여 에너지 분포가 큰 삽입구간의 배음 성분에 워터마크를 삽입한다. 워터마크 삽입과 추출과정은 프레임 기반으로 처리하며 4096 샘플을 한 프레임으로 한다.
해금 음은 공통적으로 1500H z~2000Hz 대역과 2800 ~3500Hz 대역에서 배음 성분의 크기가 크게 나타나므로 이 대역을 워터마크 삽입구간으로 활용하였다. 원 신호에 푸리에 변환을 하여 주파수 영역에서 삽입구간에 속하는 배음성분에 PN 시퀀스에 의해 생성된 워터마크 비트를 삽입하였다. MP3 압축, 잘라내기, 저역통과 필터, 대역통과 필터, 노이즈 추가와 같은 공격을 가했을 때 해금 단위음의 경우 노이즈 추가에서 황음이 0.
67점을 나타내었지만 해금과 함께 다른 국악기의 연주가 섞여 있는 연주곡으로 다른 악기의 영향을 받기 때문에 근소한 차이를 보였다고 할 수 있다. 제안한 방법을 이용하여 원본 오디오 신호에 가까운 워터마크된 신호를 얻을 수 있었으며. MUSHRA 청취 테스트의 결과는 위의 웹 페이지에서 확인할 수 있다.
제안한 워터마킹 시스템의 강인성을 평가하기 위해 MP3 압축, 잘라내기 (crop, cropping), 저역통과 필터 (LPF, lowpass filter), 대역통과 필터 (BPF, bandpass filter), 노이즈 추가(NA, noise addition)과 같은 공격을 가한 후 워터마크 비트를 검출하였다. MP3 인코딩과 디코딩은 "Wave To MP3 Maker vl.
워터마킹 알고리듬을 제안하였다. 제안한 워터마킹 시스템의 성능을 평가하기 위해 각기 다른 장르의 음악을 대상으로 제안한 워터마킹 시스템을 적용하여 BER(Bit Error Rate)을 구하였다. 실험에 사용된 해금 단위음은 [23]에서와 같은 방법으로 해금의 전체 음역에서 중간 음역에 속하는 대표음 5개를 대상으로 하였고, 본교 무향실에서 해금 연주 전문가의 연주를 녹음한 것으로 중려 운지법의 황(Eb4), 태(F4), 중(Ab4), 임 (Bb4), 남(C5)음이다.
또한 1600Hz~ 1800Hz의 주파수 성분이 가장 두드러지게 나타나고 2500Hz, 5500Hz, 6500Hz, 9000Hz 부근에서 배음 성분이 급격히 감쇠하는 특징이 있다[23]. 특히 1500 ~ 2000Hz 대역과 2800 ~ 3500Hz 대역에서 배음 성분의 크기가 공통적으로 크게 나타나는데 이 대역을 워터마크 삽입구간으로 활용하여 해금 콘텐츠 보호를 위한 워터마킹 알고리듬을 구현하였다.
피실험자는 오디오 신호를 듣고 원 신호와의 유사도를 0-100 사이의 점수로 입력하게 되며 입력 값은 0점과 100 점을 5단계로 나뉘며 각각 Bad, Poor, Fair, Good, Excellent의 결과로 나뉘게 된다. 그림 3의 MUSHRA 청취 테스트 결과 모두 평균 96점 이상으로 Excellent의 결과를 얻었다.
필터링 공격에서 저역통과 필터와 대역통과 필터의 차수 또한 워터마크 검출에 영향을 미치게 되는데 논문에서는 2 차 버터워스 필터를 사용하였다. 저역통과 필터의 차단 주파수는 샘플링 주파수의 절반 정도인 10kHz로 워터마크가 전 대역에 걸쳐 삽입이 되었다고 한다면 50%이상의 손실을 줄 수 있는 정도이다.
최초로 제안하였다. 해금 음은 공통적으로 1500H z~2000Hz 대역과 2800 ~3500Hz 대역에서 배음 성분의 크기가 크게 나타나므로 이 대역을 워터마크 삽입구간으로 활용하였다. 원 신호에 푸리에 변환을 하여 주파수 영역에서 삽입구간에 속하는 배음성분에 PN 시퀀스에 의해 생성된 워터마크 비트를 삽입하였다.
대상 데이터
실험에 사용된 해금 단위음은 [23]에서와 같은 방법으로 해금의 전체 음역에서 중간 음역에 속하는 대표음 5개를 대상으로 하였고, 본교 무향실에서 해금 연주 전문가의 연주를 녹음한 것으로 중려 운지법의 황(Eb4), 태(F4), 중(Ab4), 임 (Bb4), 남(C5)음이다. 또한 해금 연주곡 “산령산”((4.49초), 해금 연주가 꽃별의 “The Road To Sidh”(8.96초), 숙명여대 가야금 연주단이 연주한 “Hey Jude”(5.94초), 기타 연주곡(9.57초), R.Kelly의 T believe I can fly”(11.06초), 피아노 연주곡(6.62초), 클래식 “J. Strauss I_ Radetzky March - Op.228.mp3”(9.68초), 드렁큰타이거의 "너희가 힙합을 아느냐”(9.28초)에 대하여, 샘플링 주파수는 44.1kHz, 양자화 비트수는 16bit, Mono로 설정한 후 워터마킹 실험에 사용하였다.
영향을 줄 수 있다. 본 논문에서는 한 프레임을 4096 샘플로 하였는데 이는 44100 샘플링 주파수를 고려하면 약 0.1 초의 구간에 해당한다. 일반적으로 음성 신호의 경우 20ms 정도를 사용하지만 실험 결과 4096 샘플로 하였을 때 워터마크 검출 결과가 뛰어났다.
5kHz인 버터워스 저역통과 필터를 통과한 앵커 신호 1, 그리고 차단 주파수가 7kHz인 버터워스 저역통과 필터를 통과한 앵커 신호 2, 제안한 방법에 의해 워터마크가 삽입된 오디오 신호로 총 4가지를 사용하였다. 실험에 사용된 MUSHRA 소프트웨어는 MUSHRAM(version 1.0)이다[26, 27],
제안한 워터마킹 시스템의 성능을 평가하기 위해 각기 다른 장르의 음악을 대상으로 제안한 워터마킹 시스템을 적용하여 BER(Bit Error Rate)을 구하였다. 실험에 사용된 해금 단위음은 [23]에서와 같은 방법으로 해금의 전체 음역에서 중간 음역에 속하는 대표음 5개를 대상으로 하였고, 본교 무향실에서 해금 연주 전문가의 연주를 녹음한 것으로 중려 운지법의 황(Eb4), 태(F4), 중(Ab4), 임 (Bb4), 남(C5)음이다. 또한 해금 연주곡 “산령산”((4.
청취 실험에 참여한 피실험자는 울산대학교 대학원에 재학 중이며 디지털 신호처리를 전공으로 하고 있는 학생 및 연구 교수, 총 10명을 대상으로 하여 테스트 하였다. 이 실험에 사용된 오디오 신호는 숨겨진 참조 신호, 차단 주파수가 3.5kHz인 버터워스 저역통과 필터를 통과한 앵커 신호 1, 그리고 차단 주파수가 7kHz인 버터워스 저역통과 필터를 통과한 앵커 신호 2, 제안한 방법에 의해 워터마크가 삽입된 오디오 신호로 총 4가지를 사용하였다. 실험에 사용된 MUSHRA 소프트웨어는 MUSHRAM(version 1.
오디오 신호를 테스트 신호로 사용하였다. 청취 실험에 참여한 피실험자는 울산대학교 대학원에 재학 중이며 디지털 신호처리를 전공으로 하고 있는 학생 및 연구 교수, 총 10명을 대상으로 하여 테스트 하였다. 이 실험에 사용된 오디오 신호는 숨겨진 참조 신호, 차단 주파수가 3.
이론/모형
워터마크된 오디오 신호의 음질을 평가하기 위해 주관 청취 평가 방법인 MUSHRA (Multi-Stimulus test with Hidden Reference and Anchor) 청취 테스트를 이용하였다 [, 25] 이는 원 오디오 신호에 대한 테스트 오디오 신호의 음질을 평가할 수 있는 방법으로 본 논문에서는 워터 마크된 오디오 신호를 테스트 신호로 사용하였다. 청취 실험에 참여한 피실험자는 울산대학교 대학원에 재학 중이며 디지털 신호처리를 전공으로 하고 있는 학생 및 연구 교수, 총 10명을 대상으로 하여 테스트 하였다.
성능/효과
원 신호에 푸리에 변환을 하여 주파수 영역에서 삽입구간에 속하는 배음성분에 PN 시퀀스에 의해 생성된 워터마크 비트를 삽입하였다. MP3 압축, 잘라내기, 저역통과 필터, 대역통과 필터, 노이즈 추가와 같은 공격을 가했을 때 해금 단위음의 경우 노이즈 추가에서 황음이 0.81%, 남음이 1.41%의 BER 을 보였고 나머지는 모두 100% 검출하였다. 여러가지 연주곡 중에서는 해금에 가장 강인함을 실험을 통해 확인할 수 있었다.
여러가지 연주곡 중에서는 해금에 가장 강인함을 실험을 통해 확인할 수 있었다. MUSHRA 청취 테스트 결과 워터마크된 오디오 신호에 대해 평균 96 이상으로 모두 Excellent의 평가 결과를 얻었다. 향후 더 많은 삽입구간을 선정하는 방법과 배음을 중심으로 삽입 위치를 늘리는 방법 등에 대한 실험이 이루어진다면 제안한 워터마크 알고리듬을 활용하여 특정 국악기 음에 대한 워터마크 알고리듬으로 웅용할 수 있을 것이다.
원 신호의 경우 100점의 평균값을 보여야 하지만 국악과 남음을 제외한 나머지 실험에서 99점 정도로 나타났다. 제안한 방법으로 워터마크된 신호의 경우 국악을 제외한 나머지 실험에서 모두 평균 98점 이상을 보여 원 신호와 유사한 결과를 보였다. 국악은 96.
피아노의 경우 해금과 마찬가지로 대역통과 필터에서만 BER 값을 나타내지만 해금이나 국악 보다는 더 큰 값을 보인다. 제안한 워터마킹 알고리듬은 해금에서 가장 뛰어난 결과를 보였다. 실험에서 사용한 워터마크 삽입 후의 오디오 파일과 원 오디오 파일은 다음 웹 페이지에서 확인해 볼 수 있다.
후속연구
MUSHRA 청취 테스트 결과 워터마크된 오디오 신호에 대해 평균 96 이상으로 모두 Excellent의 평가 결과를 얻었다. 향후 더 많은 삽입구간을 선정하는 방법과 배음을 중심으로 삽입 위치를 늘리는 방법 등에 대한 실험이 이루어진다면 제안한 워터마크 알고리듬을 활용하여 특정 국악기 음에 대한 워터마크 알고리듬으로 웅용할 수 있을 것이다.
참고문헌 (27)
W. Bender, D. Gruhl, N. Morimoto and A. Lu, "Techniques for data hiding," IBM Systems J. vol 35, no. 3-4, pp. 313-336, 1996.
오현오, 김현욱, 윤대희, 석종원, 홍진우, "강인한 오디오 워터마킹을 위한 새로운 반향 커널 설계," 한국음향학회지, 20권 2호, pp. 66-76, 2001.
J. D. Gordy and L. Bruton, "Performance Evaluation of Digital Audio Watermarking Algorithm," in Proc. Circuits and Systems, vol. 1, pp. 456-459, 2000.
L. Boney, A. H. Tewfik and K. N. Handy, "Digital Watermarks for Audio Signals," IEEE Int. Conf. Multimedia Computing and Systems, pp. 473-480, 1996.
M. D. Swanson, B. Zhu and A. H. Tewfix, "Current state of the art, challenges and future directions for audio watermarking," IEEE Int. Conf. Multimedia Computing and Systems, vol. 1, pp. 19-24, 1999.
김현욱, 오현오, 윤대희, 차일환, "공격에 강인한 고음질 디지털 오디오 워터마킹 시스템에 관한 연구." 제13회 신호처리합동학술대회 논문집, 13권, 1호, pp. 771-774, 2000.
P. bassia, I. Pitas and N. Nikolaidis, "Robust Audio Watermarking in the Time Domain," IEEE Trans. Multimedia, vol. 3, no. 2, pp. 232-241, 2001.
J. Seok, J. Hong and J. Kim, "A Novel Audio Watermarking Algorithm for Copyright Protection of Digital Audio," ETRI J. vol. 24, no. 3, pp. 181-189, 2002.
I. J. Cox, J. Kilian, F. T. Leighton, T. Shamoon, "Secure Spread Spectrum Watermarking for Multimedia," IEEE Trans. Image Processing, vol. 6, no. 12, pp. 1673-1687, 1997.
J. A. Bloom, M. L. Miller, "Informed Detection Revisited," Proc. 2004 International Workshop on Digital Watermarking, 2004.
I. J. Cox, M. L. Miller, "The First 50 Years of Electronic Watermarking," EURASIP J. Applied Signal Processing, vol. 2. pp. 126-132, 2002.
I. J. Cox, M. L. Miller and J. A. Bloom, Digital Watermarking, Morgan Kaufmann, San Francisco, 2002.
M. van der Veen, A. N. Lemma, T. Kaller, "Watermarking and fingeringprinting for electronic music delivery," SPIE Conf. security and watermarking of multimedia contests, 2004.
송혜진, 한국악기, 열화당 2001.
홍연우, 조상진, 변중배, 정의필, "운지법에 따른 해금소리의 배음 구조 분석," 한국신호처리시스템학회 하계학술대회 논문집, 8권 1호, pp. 58-61, 2007.
홍연우, 조상진, 최명환, 정의필, "해금 소리 합성을 위한 스펙트럼 파라미터 추출," 한국디지털아트미디어학회 학술발표대회 논문집, 5권, 1호, pp. 7-10, 2007.
이희숙, 이우선, "심리음향 모델을 이용한 오디오 워터마킹", 한국정보과학회 봄 학술발표논문집, 28권, 1호, pp. 859-861, 2001.
Recommendation BS.1534-1: Method for the subjective assessment of intermediate quality levels of coding systems, ITU(International Telecommunication Union), 2003.
MUSHARA - A Matlab interface for MUSHRA listening tests (version 1.0). http://www.elec.qmul.ac.uk/digitalmusic/downloads/
Carlos Herrero, "Subjective and objective assessment of sound quality: solutions and applications," in Proa CIARM Conf., pp. 1-20, 2005.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.