[국내논문]휘도, 색차의 분포도 분석을 이용한 인지적 무기준법 영상 화질 평가방법 A Novel Perceptual No-Reference Video-Quality Measurement With the Histogram Analysis of Luminance and Chrominance원문보기
영상통신기술의 발달로, 영상화질평가는 많은 연구자들에 의해 새로운 알고리즘이 연구되었고, 성능은 점차 개선되었다. 하지만, 사람의 주관적인 시각시스템은 너무나 다양하고, 복잡하기 때문에 이를 수식화하고, 객관화하는데 많은 어려움이 있다. 영상의 화질을 평가하는 방법은 전체 기준법 (Full-Reference), 감소기준법 (Reduced-Reference) 그리고 무기준법 (No-Reference)으로 나눌 수 있다. 이중 무기준법은 수신 영상외의 다른 정보가 필요 없기 때문에, 다양한 영상 스트리밍서비스에 사용될 수 있다. 본 연구에서는, 영상의 양자화로 인한 범위 왜곡을 고려한 새로운 무기준법 영상 화질 평가 방법을 제안한다. 그리고, 성능을 비교하기 위해서, ITU-T P910 문서에 따른 주관적 화질 평가를 수행하고, 이를 363개의 영상을 통해 새로운 방법과 기존의 방법을 비교하였다. 실험 결과 제안된 방법의 실제 주관적 화질과의 상관도는 다른 기존방법보다 높은 것으로 나타났다.
영상통신기술의 발달로, 영상화질평가는 많은 연구자들에 의해 새로운 알고리즘이 연구되었고, 성능은 점차 개선되었다. 하지만, 사람의 주관적인 시각시스템은 너무나 다양하고, 복잡하기 때문에 이를 수식화하고, 객관화하는데 많은 어려움이 있다. 영상의 화질을 평가하는 방법은 전체 기준법 (Full-Reference), 감소기준법 (Reduced-Reference) 그리고 무기준법 (No-Reference)으로 나눌 수 있다. 이중 무기준법은 수신 영상외의 다른 정보가 필요 없기 때문에, 다양한 영상 스트리밍서비스에 사용될 수 있다. 본 연구에서는, 영상의 양자화로 인한 범위 왜곡을 고려한 새로운 무기준법 영상 화질 평가 방법을 제안한다. 그리고, 성능을 비교하기 위해서, ITU-T P910 문서에 따른 주관적 화질 평가를 수행하고, 이를 363개의 영상을 통해 새로운 방법과 기존의 방법을 비교하였다. 실험 결과 제안된 방법의 실제 주관적 화질과의 상관도는 다른 기존방법보다 높은 것으로 나타났다.
With advances in video technology, many researchers are interested in video quality assessment to prove better performance of proposed algorithms. Since human visual system is too complex to be formulated exactly, many researches about video quality assessment are in progressing. No-reference video-...
With advances in video technology, many researchers are interested in video quality assessment to prove better performance of proposed algorithms. Since human visual system is too complex to be formulated exactly, many researches about video quality assessment are in progressing. No-reference video-quality assessment is suitable for various video streaming services, because of no requested additional data and network capacity to perform quality assessment. In this paper, we propose a novel no-reference video-quality assessment method with the estimation of dynamic range distortion. To measure the performance, we obtain mean opinion score (MOS) data by subject video quality test with the ITU-T P.910 Absolute Category Rating (ACR) method. And, we compare it with proposed algorithm using 363 video sequences. Experimental results show that the proposed algorithm has a higher correlation with obtained MOS.
With advances in video technology, many researchers are interested in video quality assessment to prove better performance of proposed algorithms. Since human visual system is too complex to be formulated exactly, many researches about video quality assessment are in progressing. No-reference video-quality assessment is suitable for various video streaming services, because of no requested additional data and network capacity to perform quality assessment. In this paper, we propose a novel no-reference video-quality assessment method with the estimation of dynamic range distortion. To measure the performance, we obtain mean opinion score (MOS) data by subject video quality test with the ITU-T P.910 Absolute Category Rating (ACR) method. And, we compare it with proposed algorithm using 363 video sequences. Experimental results show that the proposed algorithm has a higher correlation with obtained MOS.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
일반적인 방법으로 휘도(Luminance), 대비(Contrast), 색차(Chrominance), 선예도(Sharpness)등을 계산하고, 이들을 조합하여 화질을 평가하였고, 영상을 분석하여 몇 가지 종류로 분류하고 각각의 종류마다 다른 가중치를 적용하여 정확도를 높이려는 노력도 있었다. 본 논문에서는 휘도, 색차의 분포도를 분석하여 원본의 화질을 예측하는 방법을 통해서, 기존 무기준법의 정확도를 높이고자 한다.
본 논문에서는 인지적 무기준법 화질 평가에 사용되는 새로운 변수를 제안하고 새로운 변수를 이용한 최종 평가 방법을 제시하고, 실험을 통해 성능을 평가하였다. 제안한 방법은 영상 취득시, 또는 부호화시 생길 수 있는 양자화 왜곡을 반영하여 좀 더 높은 상관도를 가진 화질평가가 가능하였다.
가설 설정
손실을 예측하기 위하여 최소값 혹은 최대값 이후의 분포는 하나의 값이 이동할 때마다, 절반으로 줄어든다고 가정하였다.Vmin은 화면내의 양자화 된 정보가 최소값인 화소의 개수, Vmax은 화면내의 양자화 된 정보가 최대값인 화소의 개수라고 할 때 위의 내용을 수식으로 나타내면 아래와 같다.
제안 방법
Psytechnics사의 모델은 최종영상에서 화질에 영향을 주는 변수들을 계산하고 각 변수들에 계수들을 곱한 후 합하여 최종 화질평가를 수행하는 형태로 이루어져있다. 인지적 계산을 위해 사람의 눈에 영향을 미치는 여러 변수들을 계산하여 화질평가를 수행한다. 각 변수들은 시간적 왜곡 분석(Temporal distortion analysis), 시간적 복잡도 분석(Temporal complexity analysis), 블록현상분석(Blockiness analysis), 흐림현상 분석(Blurriness analysis), 경계분석(Edge activity analysis), 그리고 밝기, 대비 등으로 이루어진다.
본 논문에서 제안하고자 하는 방법은 기존의 제안된 방법 들과 마찬가지로 인지적 변수들을 계산하고, 그 변수들에 계수를 곱한 후 합하여 화질평가를 수행하는 방법을 거치게 된다. 하지만, 휘도 및 색차의 분포도 분석을 통해 사람의 눈에 대응하는 새로운 변수를 계산하고 그 변수가 화질에 미치는 영향을 실험을 통해 측정한다.
본 논문에서 제안하고자 하는 방법은 기존의 제안된 방법 들과 마찬가지로 인지적 변수들을 계산하고, 그 변수들에 계수를 곱한 후 합하여 화질평가를 수행하는 방법을 거치게 된다. 하지만, 휘도 및 색차의 분포도 분석을 통해 사람의 눈에 대응하는 새로운 변수를 계산하고 그 변수가 화질에 미치는 영향을 실험을 통해 측정한다. 측정한 값을 통해 변수에 곱해질 계수를 찾아내고 다른 변수들과 함께 귀납적 방법으로 계산하여 보다 정확한 화질평가를 수행하도록 하였다.
하지만, 휘도 및 색차의 분포도 분석을 통해 사람의 눈에 대응하는 새로운 변수를 계산하고 그 변수가 화질에 미치는 영향을 실험을 통해 측정한다. 측정한 값을 통해 변수에 곱해질 계수를 찾아내고 다른 변수들과 함께 귀납적 방법으로 계산하여 보다 정확한 화질평가를 수행하도록 하였다.
화질의 Dmin,Dmax은 각각 휘도와 두 가지 색차신호 (Cb, Cr)에 대해 모두 계산하며 이에 대한 평균을 구하고, 계수값을 통한 보정을 거쳐 다른 변수들과 함께 최종 화질의 열화를 계산하게 된다.
264로 부호화를 하였다. 이때, 부호화시 사용되는 변수는 QP의 값을 상,중,하로 각각 28, 32, 36로 프레임률을 15, 30 Frmae/Sec으로 GOP(Group of pictures)를 15, 30으로 나누었다. 12가지 부호화된 영상에 GOP당 첫번째, 중간, 마지막 패킷에 오류를 인위적으로 만들어 주고 각각의 오류패킷의 길이를 1,2,3개로 나누어 총 10가지의 오류패턴을 만들었다.
이때, 부호화시 사용되는 변수는 QP의 값을 상,중,하로 각각 28, 32, 36로 프레임률을 15, 30 Frmae/Sec으로 GOP(Group of pictures)를 15, 30으로 나누었다. 12가지 부호화된 영상에 GOP당 첫번째, 중간, 마지막 패킷에 오류를 인위적으로 만들어 주고 각각의 오류패킷의 길이를 1,2,3개로 나누어 총 10가지의 오류패턴을 만들었다. 12가지 영상에 10가지 오류패턴을 조합하여 하나의 원본영상에 120가지의 다른 영상을 만들었으며 여기에 원본영상 3가지를 더하여 총 363개의 영상을 만들었다.
객관성을 높이기 위해 본 논문과 관련이 없는 일반인 20명에게 ACR방법으로 주관적 화질평가를 수행하였다. 실험의 수행은 ITU-T P.
대상 데이터
화질평가의 실험을 위해 CIF해상도의 Foreman, Foot ball, Mobile 3개의 영상을 선정하였다. 각각의 영상은 각기 움직임정도나 색의 표현에 차이를 두고 있다.
12가지 부호화된 영상에 GOP당 첫번째, 중간, 마지막 패킷에 오류를 인위적으로 만들어 주고 각각의 오류패킷의 길이를 1,2,3개로 나누어 총 10가지의 오류패턴을 만들었다. 12가지 영상에 10가지 오류패턴을 조합하여 하나의 원본영상에 120가지의 다른 영상을 만들었으며 여기에 원본영상 3가지를 더하여 총 363개의 영상을 만들었다.
데이터처리
363개의 영상에서 얻어진 결과를 바탕으로 귀납적 방법을 이용해 식(4)에 적용하기 위한 각각의 계수들을 계산하였다. 계수를 구하기 위해 통계적 분석방법을 이용하였으며 Minitab 15 프로그램을 사용하여 가장 연관성이 높은 계수를 산출하였다.
마지막으로 실제 주관적 화질평가의 값과 계산된 eMOS값이 얼마나 연관성을 가지고 있는가를 알기 위해 Dmin,Dmax를 사용하지 않은 기존의 방법과 제안된 방법으로 계산된 값을 각각 피어슨 상관도(Pearson Correlation)를 통해 연관성을 계산하였다.
이론/모형
객관성을 높이기 위해 본 논문과 관련이 없는 일반인 20명에게 ACR방법으로 주관적 화질평가를 수행하였다. 실험의 수행은 ITU-T P.910문서를 따라 영상을 10초간 보여주고 5단계 화질평가를 수행하여 MOS를 취득하였다[1][7].
성능/효과
본 논문에서는 인지적 무기준법 화질 평가에 사용되는 새로운 변수를 제안하고 새로운 변수를 이용한 최종 평가 방법을 제시하고, 실험을 통해 성능을 평가하였다. 제안한 방법은 영상 취득시, 또는 부호화시 생길 수 있는 양자화 왜곡을 반영하여 좀 더 높은 상관도를 가진 화질평가가 가능하였다. 하지만, 표준화단체에 기고된 SwissQual 모델이나, Psytechnics 모델에는 못 미치는 결과를 나타내었고, 실험과 검증에 사용된 자료가 부족하여 객관성이 떨어질 수 있다고 생각한다.
후속연구
하지만, 표준화단체에 기고된 SwissQual 모델이나, Psytechnics 모델에는 못 미치는 결과를 나타내었고, 실험과 검증에 사용된 자료가 부족하여 객관성이 떨어질 수 있다고 생각한다. 이를 보완하기 위하여 좀 더 많은 데이터를 모아서 정확한 평가가 가능하도록 차후 연구를 준비하도록 하겠다.
본 논문을 통해서 전체기준법, 부분기준법에 비해 아직 낮은 정확도를 가진 무기준법이 기술이 발전되기 바라며, 차후 연구에서는 영상정보 뿐 아니라 영상의 전송에 사용된 정보들을 포함하는 복합적(Hybrid) 영상평가를 통해 보다 정확한 화질평가 알고리즘을 제안하겠다.
질의응답
핵심어
질문
논문에서 추출한 답변
MOS란 무엇입니까?
인지적 화질평가를 위해 실제 주관적인 화질을 측정하고 측정된 값들을 수치화시켜 표현하게 된다. 이를 MOS라고 하며 ITU-T에서 지정한 ACR (Absolute Category Rate) 방법이 주로 사용된다[1].
기존의 인지적 무기준법 영상 화질 평가 방법은 무엇을 통해서 발전하였습니까?
기존의 인지적 무기준법 영상 화질 평가 방법은 ITU-T SG9와 Video Quality Expert Group(VQEG)의 표준화를 통해 발전 해 왔다. 2000년도에는 참고문헌 [2]에 있는 방법을 통해 10가지의 HVS를 고려한 화질평가방법을 시험하였지만 만족할 만한 결과를 보인 평가방법은 없었고, 2003년도에는 참고문헌 [3]을 통해 6가지의 방법을 평가하였다.
영상의 화질을 평가하는 방법은 어떤 정보를 기준으로 평가하느냐에 따라 전체기준법, 감소기준법, 무기준법으로 나뉘는데 각각의 세부사항은 무엇입니까?
영상의 화질을 평가하는 방법은 어떤 정보를 기준으로 평가하느냐에 따라서 전체 기준법 (Full Reference), 감소기준법 (Reduced Reference) 그리고 무기준법 (No Reference)으로 나눌 수 있다. 전체 기준법은 일반적으로 사용하는 PSNR (Peak Signal to Noise Ratio)이나 MSE (Mean Square Error)가 대표적으로, 원본의 전체 정보와 비교대상의 전체정보를 모두 가지고 화질을 평가하게 된다. 감소기준법은 원본영상의 일부분이나 가공된 정보와 수신 영상과의 비교를 통해서 영상품질을 측정한다. 이에 반해, 무기준법은 수신 영상만을 가지고 영상품질을 측정한다. 이로 인해, 정확도가 다른 방법들에 비해 떨어지지만, 영상전송망의 부하가 없고, 송신측의 변경 없이 수신측에서 품질을 측정할 수 있기 때문에, 다른 두 방법보다 활용범위가 훨씬 넓다
참고문헌 (11)
ITU-T P.910 "Subjective Video Quality Assessment Methods For Multimedia Applications"
ITU-T SG9-C80, “Final report from the video quality expert group on the validation of objective models of video quality assessment,” Jun, 2000
VQEG “Final report from the video quality expert group on the validation of objective models of video quality assessment Phase II”, Aug, 2003
VQEG “RRNR-TV Group Test Plan Version 2.0,” May, 2007
ITU-T "REPORT OF THE MEETING OF STUDY GROUP 9", ITU-T SG9 Meeting, COM9-R7-E, May, 2008
Psytechnics Ltd "Psytechnics no-reference video quality assessment model" ITU-T SG9 Meeting, COM9-C190-E, May, 2008
VQEG "Hybrid / Bitstream Group test plan" JVT-Q.069
ITU-T Recommendation J.144 "Objective perceptual video quality measurement techniques for digital cable television in the presence of a full reference
Tao Liu, Yao Wang "Subjective quality evaluation of decoded video in the presence of packet losses", IEEE, ICASSP, 2007
김기영, 김현철, 이진언, 김회율 “화질 측정 실험에 기반한 영상의 주관적 화질 측정” 신호처리합동학술대회 20권 1호, 2007년
김현오, 이선오, 심동규, 남궁재찬 “디지털 비디오에 대한 객관적 화질 측정 방법에 대한 연구” 한국방송공학회 학술대회, 2006
이 논문을 인용한 문헌
저자의 다른 논문 :
연구과제 타임라인
LOADING...
LOADING...
LOADING...
LOADING...
LOADING...
활용도 분석정보
상세보기
다운로드
내보내기
활용도 Top5 논문
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다. 더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.