본 논문에서는 심리음향 모델(Psychoacoustic model) II와 MDCT를 이용한 고음질 오디오 포렌식 마킹 알고리즘을 제안한다. 제안된 알고리즘은 오디오 신호의 에너지가 스펙트럼 마스킹 레벨보다 적은 서브밴드를 선택하여 콘텐츠 사용자의 핑거프린팅 코드를 삽입하는 포렌식 마킹 방법이다. 원 오디오 신호의 FFT 처리를 위한 2,048 샘플의 한 프레임 범위에서, 3개의 서브밴드를 선택하여 포렌식 마킹을 한다. 핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서, 한 프레임의 SNR을 측정하였다. 핑거프린팅 코드의 최저강도 0.1 삽입에서 SNR은 38.44dB 이며, 화이트 가우시안 노이즈의 강도 0.5가 추가된 SNR은 19.09dB로 제안된 오디오 포렌식 마킹 알고리즘은 핑거프린팅 코드의 마킹 강인성과 오디오 고음질이 유지됨을 확인하였다.
본 논문에서는 심리음향 모델(Psychoacoustic model) II와 MDCT를 이용한 고음질 오디오 포렌식 마킹 알고리즘을 제안한다. 제안된 알고리즘은 오디오 신호의 에너지가 스펙트럼 마스킹 레벨보다 적은 서브밴드를 선택하여 콘텐츠 사용자의 핑거프린팅 코드를 삽입하는 포렌식 마킹 방법이다. 원 오디오 신호의 FFT 처리를 위한 2,048 샘플의 한 프레임 범위에서, 3개의 서브밴드를 선택하여 포렌식 마킹을 한다. 핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서, 한 프레임의 SNR을 측정하였다. 핑거프린팅 코드의 최저강도 0.1 삽입에서 SNR은 38.44dB 이며, 화이트 가우시안 노이즈의 강도 0.5가 추가된 SNR은 19.09dB로 제안된 오디오 포렌식 마킹 알고리즘은 핑거프린팅 코드의 마킹 강인성과 오디오 고음질이 유지됨을 확인하였다.
In this paper, the forensic marking algorithm is proposed using psychoacoustic model II and MDCT for high-quality audio. The proposed forensic marking method, that inserts the user fingerprinting code of the audio content into the selected sub-band, in which audio signal energy is lower than the spe...
In this paper, the forensic marking algorithm is proposed using psychoacoustic model II and MDCT for high-quality audio. The proposed forensic marking method, that inserts the user fingerprinting code of the audio content into the selected sub-band, in which audio signal energy is lower than the spectrum masking level. In the range of the one frame which has 2,048 samples for FFT of original audio signal, the audio forensic marking is processed in 3 sub-bands. According to the average attack of the fingerprinting codes, one frame's SNR is measured on 100% trace ratio of the collusion codes. When the lower strength 0.1 of the inserted fingerprinting code, SNR is 38.44dB. And in case, the added strength 0.5 of white gaussian noise, SNR is 19.09dB. As a result, it confirms that the proposed audio forensic marking algorithm is maintained the marking robustness of the fingerprinting code and the audio high-quality.
In this paper, the forensic marking algorithm is proposed using psychoacoustic model II and MDCT for high-quality audio. The proposed forensic marking method, that inserts the user fingerprinting code of the audio content into the selected sub-band, in which audio signal energy is lower than the spectrum masking level. In the range of the one frame which has 2,048 samples for FFT of original audio signal, the audio forensic marking is processed in 3 sub-bands. According to the average attack of the fingerprinting codes, one frame's SNR is measured on 100% trace ratio of the collusion codes. When the lower strength 0.1 of the inserted fingerprinting code, SNR is 38.44dB. And in case, the added strength 0.5 of white gaussian noise, SNR is 19.09dB. As a result, it confirms that the proposed audio forensic marking algorithm is maintained the marking robustness of the fingerprinting code and the audio high-quality.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 기존의 오디오 워터마킹의 음질저하 개선과 워터마크의 강인성 향상, 그리고 오디오 콘텐츠의 불법 배포자를 추적할 수 있는 오디오 포렌식 마킹을 제안한다. 이를 위하여 심리음향 모델 II와 MDCT를 이용하여 음질저하 없이 사용자의 핑거프린팅 코드를 오디오 에너지 신호가 마스킹 스펙트럼 에너지보다 적은 서브밴드를 선택하여 삽입하고, 넌-블라인드 방식에 의해 검출된 핑거프린팅 코드의 공모 유무와 공모자를 추적할 수 있는 새로운 오디오 포렌식 마킹 알고리즘을 구현한다.
제안 방법
본 논문에서 제안된 오디오 포렌식 마킹의 알고리즘 성능평가를 위하여, 표 1의 BIBD 코드를 7명 사용자의 핑거프린팅 코드 7비트(v), 탄력성 2비트(λ)를 삽입하여 실행하였다.
성능 평가를 위하여 삽입되는 핑거프린팅 코드의 강도와 화이트 가우시안 노이즈의 강도는 각각 0.1∼0.9까지 변화하여 삽입하였다.
오디오 사용자의 핑거프린팅 코드가 포렌식 마킹이 되는 제안된 알고리즘은 심리음향 모델 II에 의하여 오디오 신호의 에너지가 마스킹 스펙트럼 에너지 레벨보다 낮은 서브밴드의 필터뱅크 를 선택하는데, 본 실험에서는 음질과 SNR 및 SMR을 고려하여 3개의 서브밴드를 선택하여 핑거프린팅 코드를 삽입하였다.
이를 위하여 본 논문에서는 각 코드 관계에서 탄력성(Resiliency)의 특성이 있는 {v, k, λ} BIBD 코드[3]를 사용자의 핑거프린팅 코드로 사용한다.
본 논문에서는 기존의 오디오 워터마킹의 음질저하 개선과 워터마크의 강인성 향상, 그리고 오디오 콘텐츠의 불법 배포자를 추적할 수 있는 오디오 포렌식 마킹을 제안한다. 이를 위하여 심리음향 모델 II와 MDCT를 이용하여 음질저하 없이 사용자의 핑거프린팅 코드를 오디오 에너지 신호가 마스킹 스펙트럼 에너지보다 적은 서브밴드를 선택하여 삽입하고, 넌-블라인드 방식에 의해 검출된 핑거프린팅 코드의 공모 유무와 공모자를 추적할 수 있는 새로운 오디오 포렌식 마킹 알고리즘을 구현한다.
오디오 DRM free에 따른 심각한 저작권 침해와 불법 복제, 배포의 해결책으로 오디오 포렌식 마킹의 기술개발이 요구된다. 이에 따라 본 논문에서는 심리음향 모델 II를 이용하여, 오디오 신호의 에너지가 마스킹 스펙트럼의 에너지 레벨보다 작은 서브밴드에서 사용자의 핑거프린팅 코드를 삽입하는 오디오 포렌식 마킹 알고리즘을 구현하였다. 기존의 오디오 워터마킹은 심리음향 모델을 이용하고 워터마크를 랜덤 신호를 스펙트럼 확산방식으로 삽입하므로, 음질의 저하와 원 마크 신호의 감쇠 현상이 나타났다.
표 5. 포렌식 마킹과 WGN 삽입강도에 따른 SNR 측정.
데이터처리
본 논문의 Ⅱ장에서는 심리음향 모델 II를 이용한 오디오 포렌식 마킹 알고리즘을 제안한다. Ⅲ장에서 제안된 알고리즘의 성능평가를 위한 실험 및 결과를 검토하고, 오디오 콘텐츠의 불법 공모자 추적율을 계산한다. 그리고 Ⅳ장에서 결론을 맺는다.
이론/모형
1. Flow-chart of the proposed audio forensic marking algorithm.
성능/효과
기존의 오디오 워터마킹은 심리음향 모델을 이용하고 워터마크를 랜덤 신호를 스펙트럼 확산방식으로 삽입하므로, 음질의 저하와 원 마크 신호의 감쇠 현상이 나타났다. 본 연구의 오디오 포렌식 알고리즘은 기존 방식에 비하여 콘텐츠 사용자의 핑거프린팅 코드가 마스킹 스펙트럼 에너지 레벨 이하에 삽입되므로 음질의 저하가 없으며, 공모공격에도 강인성을 갖게 된다. 핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서 핑거프린팅 코드의 삽입강도 0.
오디오 포렌식 마킹의 강인성과 고음질 유지를 위하여 WGN 강도 0.5 이내에서 마킹 강도는 0.7이 실험을 통하여 확인되었다.
핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서 핑거프린팅 코드의 삽입강도 0.1∼0.9에서 SNR은 38.44∼19.36이며, 여기에 화이트 가우시안 노이즈 강도 0.1∼0.9가 추가된 SNR은 34.87∼15.79로 오디오 포렌식 마킹과 고음질의 강인성이 유지됨을 확인하였다.
후속연구
79로 오디오 포렌식 마킹과 고음질의 강인성이 유지됨을 확인하였다. 따라서 본 논문에서 구현된 오디오 포렌식 마킹 알고리즘은 반공모성이 우수하여 포렌식 시스템에 응용할 수 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
콘텐츠가 불법으로 배포되었을 때 포렌식 마킹은 무엇을 워터마크로 삽입하는가?
포렌식 마킹은 저작권자를 확인할 수 있는 워터마킹 (Watermarking)의 확장기술로, 콘텐츠가 불법으로 배포되었을 때, 배포자를 추적할 수 있도록 콘텐츠에 구매자 또는 사용자 각각의 유일한 핑거프린팅 코드 (Fingerprinting code)를 워터마크로 삽입하는 기술이다. 이러한 포렌식 마크로 사용하는 코드가 콘텐츠의 공격으로 변형이 되어도, 누구의 사용자 코드가 변형되었는지 추적이 용이하여야 한다.
사용자의 핑거프린팅 코드 및 포렌식 마킹에 활용하는 포렌식 마크로 사용하는 코드는 무엇인가?
이러한 포렌식 마크로 사용하는 코드가 콘텐츠의 공격으로 변형이 되어도, 누구의 사용자 코드가 변형되었는지 추적이 용이하여야 한다. BIBD(Balanced Incomplete Block Design) 코드는 확장성 및 탄력성(Resiliency)의 특성이 있으므로, 사용자의 핑거프린팅 코드[3] 및 포렌식 마킹[4]에 활용되고 있다. 그리고 삽입된 코드의 검출에서, 넌-블라인드 검출(Non-blind Detection)은 불법 배포자의 추적 및 저작권 증명에, 블라인드 검출은 저작권 통보 및 복제방지에 활용이 된다[5].
포렌식 마킹은 무엇의 확장기술인가?
포렌식 마킹은 저작권자를 확인할 수 있는 워터마킹 (Watermarking)의 확장기술로, 콘텐츠가 불법으로 배포되었을 때, 배포자를 추적할 수 있도록 콘텐츠에 구매자 또는 사용자 각각의 유일한 핑거프린팅 코드 (Fingerprinting code)를 워터마크로 삽입하는 기술이다. 이러한 포렌식 마크로 사용하는 코드가 콘텐츠의 공격으로 변형이 되어도, 누구의 사용자 코드가 변형되었는지 추적이 용이하여야 한다.
참고문헌 (13)
Maher R., "Audio forensic examination," Signal Processing Magazine, IEEE Vol. 26, Issue 2, pp.84-94, 2009
Li De, Jong Weon Kim, "Audio forensic marking using quantization in DWT-SVD domain," Advanced Communication Technology, 13th Int'l Conf.(ICACT 2011), pp.988-991, 2011
이강현, "BIBD 기반의 멀티미디어 핑거프린팅 코드의 공모코드들에 대한 공모자 추적," 대한전자공학회, 전자공학회논문지-CI, 제46권 제6호, pp.79-86 2009.11
이강현, "포렌식 마킹을 위한 특징점 기반의 동적 멀티미디어 핑거프린팅 코드 설계," 대한전자공학회, 전자공학회논문지-CI, 제48권 CI편 제4호, 27-34쪽, 2011.7
I. J. Cox, M. L. Miller and J. A. Bloom, Digital Watermarking, Morgan Kaufmann, San Francisco, 2002.
A multiple audio watermarking algorithm based on shear resisting DWT and LSB Liu Tianchi; Yang Guangming; Wang Qi; Networked Computing (INC), 2011 The 7th International Conference on Publication Year: 2011 , Page(s): 78 - 83
Kuo Shyh-shiaw, Johnston James D., Turin William, Quackenbush Schuyler R., "Covert audio watermarking using perceptually tuned signal independent multiband phase modulation," Acoustics, Speech, and Signal Processing (ICASSP), 2002 IEEE Int'l Conf. on, Vol. 2, pp. II-1753-1756, 2002
D. Gruhl, A. Lu, and W. Bender, "Echo Hiding," in Proc. Information Hiding Workshop(University of Cambridge, U.K), pp. 295-315, 1996
W. Bender, D. Gruhl, N. Morimoto and A. Lu, "Techniques for data hiding," IBM Systems J. vol. 35, no. 3-4, pp. 313-336, 1996.
I. J. Cox, J. Kilian, F. T. Leighton, T. Shamoon, "Secure Spread Spectrum Watermarking for Multimedia," IEEE Trans. Image Processing, vol. 6, no. 12, pp. 1673-1687, 1997.
노진수, 이강현, "대역확산과 심리음향 모델을 이용한 고음질 오디오 워터마킹," 대한전자공학회, 전자공학회논문지-CI, 제43권 제5호, 48-56쪽, 2006년.
M. Swanson, B Zhu, A. Tewfik, and L. Boney, "Robust audio watermarking using perceptual masking," Signal Processing, Vol. 66, No. 3, pp. 337-355, May 1998.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.