과거에 비해 현재는 네트워크를 통해서 수없이 많은 이미지와 영상을 많은 사용자들이 공유하고 있다. 이러한 연유로 이미지 또는 영상의 압축에 대해서 많은 연구들이 진행되어지고 있다. 그 중에서도 특정한 목적을 위해 이미지의 특정영역에 관해서만 관심을 갖는 경우가 존재한다. 예를 들어 ATM과 같이 배경보다는 사람의 얼굴을 중요시 여기는 기기에서는 관심영역을 설정하여 압축하는 방법이 중요시 되고 있다. 따라서, 본 연구에서는 한 이미지 내에서 관심영역과 비관심영역을 구분하고, 관심영역에 대해서는 높은 퀄리티를 유지하되 비 관심영역에 대해서는 낮은 퀄리티로 압축하여 사용자가 의도하는 관심도를 고려할 수 있도록 새로운 압축방법을 제시한다. 인간 시각체계는 어두운 영역에서보다는 밝은 영역에서 밝기 변화의 민감도가 낮다는 특성과 이미지 압축 시 사용되는 블록의 특성인 표준편차를 이용하여 새로운 관심영역을 정의하여 사용한다. 마지막으로 제시된 방법을 JPEG을 변형하여 실험해봄으로써 검증하였다.
과거에 비해 현재는 네트워크를 통해서 수없이 많은 이미지와 영상을 많은 사용자들이 공유하고 있다. 이러한 연유로 이미지 또는 영상의 압축에 대해서 많은 연구들이 진행되어지고 있다. 그 중에서도 특정한 목적을 위해 이미지의 특정영역에 관해서만 관심을 갖는 경우가 존재한다. 예를 들어 ATM과 같이 배경보다는 사람의 얼굴을 중요시 여기는 기기에서는 관심영역을 설정하여 압축하는 방법이 중요시 되고 있다. 따라서, 본 연구에서는 한 이미지 내에서 관심영역과 비관심영역을 구분하고, 관심영역에 대해서는 높은 퀄리티를 유지하되 비 관심영역에 대해서는 낮은 퀄리티로 압축하여 사용자가 의도하는 관심도를 고려할 수 있도록 새로운 압축방법을 제시한다. 인간 시각체계는 어두운 영역에서보다는 밝은 영역에서 밝기 변화의 민감도가 낮다는 특성과 이미지 압축 시 사용되는 블록의 특성인 표준편차를 이용하여 새로운 관심영역을 정의하여 사용한다. 마지막으로 제시된 방법을 JPEG을 변형하여 실험해봄으로써 검증하였다.
Recently, users can get countless images and videos by network. So, the compression technology of image and video is researched more and more. However, the situation which is the interested range of the image is occurred. For instance, since the region of face is more important than background, the ...
Recently, users can get countless images and videos by network. So, the compression technology of image and video is researched more and more. However, the situation which is the interested range of the image is occurred. For instance, since the region of face is more important than background, the image compression technology bases on the region of interest (ROI) is necessary, in the ATM environment. In this research, given the human visual system, which are not sensitive to illumination variations at very dark and light regions of image, we calculate the standard deviation of block and use this value to define the ROI. In encoding process, the relatively high quality can be obtained at the ROI and the relatively low quality can be obtained at the non ROI. In proposed scheme, the feature which is the encoding process according to subjectively image quality can be demonstrated. Finally, this proposed scheme is applied to JPEG standard. The experimental results demonstrate that proposed scheme can achieve better image quality at the high compression ratio.
Recently, users can get countless images and videos by network. So, the compression technology of image and video is researched more and more. However, the situation which is the interested range of the image is occurred. For instance, since the region of face is more important than background, the image compression technology bases on the region of interest (ROI) is necessary, in the ATM environment. In this research, given the human visual system, which are not sensitive to illumination variations at very dark and light regions of image, we calculate the standard deviation of block and use this value to define the ROI. In encoding process, the relatively high quality can be obtained at the ROI and the relatively low quality can be obtained at the non ROI. In proposed scheme, the feature which is the encoding process according to subjectively image quality can be demonstrated. Finally, this proposed scheme is applied to JPEG standard. The experimental results demonstrate that proposed scheme can achieve better image quality at the high compression ratio.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
DCT 결과 값에 양자화 테이블을 적용하여 압축을 할 때 새롭게 정의한 관심영역과 비 관심영역 영역에 대해서 서로 다른 양자화 테이블을 적용함으로써 저용량이면서 고 퀄리티를 유지할 수 있는 이미지 압축 및 복원을 제안하고자 한다. 8X8블록에 JPEG 양자화 테이블을 적용할 때 어느 정도의 압축률을 적용할 것인가에 따라서 양자화 테이블에 양자화 크기를 곱하고, 테이블 값을 변경하여 사용한다.
또한 인간의 시각체계 특성을 이용하지 못하고 있다. 그래서 본 연구에서는 너무 어둡거나 밝은 영역에서의 밝기 변화는 쉽게 인지 할 수 없다는 웨버의 법칙과 이미지 블록의 특성을 이용하여 ROI를 설정하고 차등적으로 이미지를 압축하여 비슷한 수준의 압축률에서 관심영역에 대해서 높은 퀄리티를 유지하는 방법을 제시한다.
제안 방법
하지만 DCT와 양자화 등에 사용되는 기본 단위인 8X8 블록에 대해서는 전혀 고려되고 있지 않았다. 그래서 본 연구에서는 웨버의 법칙을 이용하여 설정한 영역에 8X8블록의 명암에 대한 표준편차를 구하고 전체 블록의 표준편차의 평균보다 작은 영역을 비 관심영역으로 설정하였다.
또한 기존의 ROI를 설정하는데 있어서는 이미지에 패턴을 이용하거나, 형태정보를 이용하여 설정하였다. 하지만 DCT와 양자화 등에 사용되는 기본 단위인 8X8 블록에 대해서는 전혀 고려되고 있지 않았다.
본 절에서는 새롭게 정의한 관심영역을 활용하여 이미지를 압축하고 복원하였으며, 기존의 JPEG 압축방식과 비교 분석하였다. 세부적으로는 기존의 방식을 이용한 JPEG 이미지와 제안한 방법을 이용한 이미지 전체 영역의 PSNR과 관심영역의 PSNR을 비교하여 분석하였다.
본 절에서는 새롭게 정의한 관심영역을 활용하여 이미지를 압축하고 복원하였으며, 기존의 JPEG 압축방식과 비교 분석하였다. 세부적으로는 기존의 방식을 이용한 JPEG 이미지와 제안한 방법을 이용한 이미지 전체 영역의 PSNR과 관심영역의 PSNR을 비교하여 분석하였다.
제안한 방법은 이미지를 압축하기 전에 인간 시각체계의 특징인 너무 밝거나 너무 어두운 경우 사물을 인식하기 힘들다는 웨버의 법칙을 적용하였으며 이미지 8X8블록의 표준편차를 이용하여 단순한 블록과 복잡한 블록으로 분리하고 이를 바탕으로 관심영역을 설정하여 이 영역에 대해서는 낮은 압축률을 적용하고 비 관심영역에 대해서는 높은 압축률을 적용함으로써 비슷한 수준의 압축률일 경우 전체적인 퀄리티는 떨어지더라도 관심영역에 대해서는 높은 퀄리티를 유지할 수 있는 방법이다. 추가적으로, 일반적으로 다양한 패턴을 이미지의 블록에 적용함으로서 관심영역을 추출하는 방법에 비하여 계산이 단순하다는 장점을 가지고 있다.
또한 공간 주파수의 모든 성분에 동일한 반응을 보이는 것이 아니라 특정 주파수영역에 대해서는 더 민감하게 반응 한다는 특징인 웨버의 법칙[9]으로 덜 민감한 영역에 대해서는 NON-ROI영역으로 설정하고 민감한 영역에 대해서는 ROI영역으로 설정하여 효율적인 부호화를 할 수 있다. 즉 빛의 세기가 너무 어둡거나 너무 밝은 곳에 대해서는 밝기의 변화를 쉽게 인지 할 수 없다는 것을 이용한 휘도 마스크를 적용 하고자 한다.
대상 데이터
또한 관심영역이 중요하지만 비 관심영역과 너무 큰 차이로 압축을 하면 다양한 왜곡이 발생할 수 있기 때문에 일반 압축의 PSNR값과 2db이하의 차이가 나도록 양자화 크기를 관심영역에 대해서는 α값으로 -5, 비 관심영역에 대해서는 α값으로 +5를 설정하였다. 실험에 사용된 영상은 현재 JPEG 표준으로 사용되고 있는 23개의 영상이며, 이영상의 공간 복잡도를 구하고 분류하고 실험하였다. 표 1은 영상의 공간 복잡도를 구한 표이다.
이론/모형
이미지에서 객체와 객체 또는 배경과 객체간의 경계를 의미하는 에지를 찾아내고 이 영역을 ROI로 설정하는 기법으로 Sobel, Robert, Prewitt 그리고 Canny 등의 기법들을 이용한다.
성능/효과
JPEG표준으로 사용되고 있는 23개의 영상에 대해서 실험한 결과, 전체영역에 대한 PSNR은 약 2db이하의 차이가 있으며, 관심영역은 약 2∼5db의 차이가 나는 것을 확인하였다.
그림 13 세밀한 비교분석을 위해 확대한 이미지이며, (a)는 JPEG방식으로 압축하여 복원한 영상의 얼굴 영역이고, (b)는 제안된 방식으로 압축하여 복원한 영상의 얼굴 영역이다. 두 이미지를 비교하였을 때 눈과 코, 입, 앞머리 등의 영역에서 화질이 좋게 나오는 것을 확인할 수 있다. JPEG표준으로 사용되고 있는 23개의 영상에 대해서 실험한 결과, 전체영역에 대한 PSNR은 약 2db이하의 차이가 있으며, 관심영역은 약 2∼5db의 차이가 나는 것을 확인하였다.
질의응답
핵심어
질문
논문에서 추출한 답변
JPEG방식의 단점은 무엇인가?
또한 이미지에 ROI(Region Of Interest)를 설정하여 관심영역과 비 관심영역으로 구분하고 이에 대해서 차등적으로 압축하는 방법에 대한 연구가 활발히 진행 중이다. 하지만 이 방법은 이미지의 패턴[1,2]을 이용하거나, 형태정보[3]를 이용하여 ROI를 설정함으로서 계산량이 많다는 단점이 존재한다. 또한 인간의 시각체계 특성을 이용하지 못하고 있다.
DCT과정은 무엇인가?
JPEG 압축은 우선 전체 이미지를 8X8블록으로 구분하고 각각의 블록에 대해서 DCT과정을 거치게 된다. DCT과정은 2차원 공간데이터를 2차원 공간 주파수 정보로 변환하는 과정으로 2차원 행렬의 화소값을 저주파성분에서 고주파성분으로 나누는 과정이다[4]. 영상을 분리하는 이유는 사람의 눈은 고주파 정보보다는 저주파 정보에 더욱 민감하다는 특성을 이용하기 위해서이다.
DCT과정에서 영상을 분리하는 이유는 무엇인가?
DCT과정은 2차원 공간데이터를 2차원 공간 주파수 정보로 변환하는 과정으로 2차원 행렬의 화소값을 저주파성분에서 고주파성분으로 나누는 과정이다[4]. 영상을 분리하는 이유는 사람의 눈은 고주파 정보보다는 저주파 정보에 더욱 민감하다는 특성을 이용하기 위해서이다.
참고문헌 (9)
S. D. Jeon, "A Study on the Adaptive Image Enhancement in the DCT-based Compression Domain using Retinex Theory," Master's dissertation, Kumoh National Institute of Technology, 2008.
J. H. Kang, Y. G. Seo, "Fast Dynamic ROI Coding using the Mask Patterns in JPEG2000," Journal of Information Processing Systems, vol. 18B, no. 6, pp.349-354, 2011.
G. M. Kim, "A Study on the JPEG Compression using ROI Classification," Master's dissertation, Dongguk University, 2010.
D. S. Seo, "Comparative Study of the Still Image Compress -ion Algorithm Using DCT and FFT," Master's dissertation, Gwangju University, 2005.
H. Park, J. S. Yim, B. H. Kim, J. Y. Choi, and S. H. Hon, "A Study on the Huffman Coding Architecture for Image Compression and Decompression," National IT Industry Promotion Agency, Technical Report, 1993.
Vincent, O. R., and O. Folorunso, "A descriptive algorithm for sobel image edge detection," Proceedings of Informing Science & IT Education Conference (InSITE), 2009.
Huang, Songtao, Majid Ahmadi, and M. A. Sid-Ahmed. "An Edge Based Thresholding Method," Systems, Man and Cybernetics, 2006.
J. S. Hwang, "An Imaage Contrast Enhancement by using Modified Histogram Equalization Method," Master's dissertation, Hanyang University, 2009.
J. H. Kang, Y. G. Seo, "A Study on the DCT Image Coding Considering Weber's law," The Journal of Korea Information and Communications Society, vol. 18, no. 5, pp.663-674, 1993.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.