방송통신융합 서비스는 제한된 네트워크 대역폭에서 디지털 방송 TV, VOD 등의 다양한 서비스를 사용자에게 제공한다. 서비스 사업자들은 방송사나 영화사로부터 방송용 콘텐츠 원본을 제공받아 사용자에게 통신망을 통해 전송하기 위해 이를 비디오 트랜스코더로 부호화를 한다. 트랜스코더 내에서 입력으로 들어오는 MPEG-2 원본을 ...
방송통신융합 서비스는 제한된 네트워크 대역폭에서 디지털 방송 TV, VOD 등의 다양한 서비스를 사용자에게 제공한다. 서비스 사업자들은 방송사나 영화사로부터 방송용 콘텐츠 원본을 제공받아 사용자에게 통신망을 통해 전송하기 위해 이를 비디오 트랜스코더로 부호화를 한다. 트랜스코더 내에서 입력으로 들어오는 MPEG-2 원본을 해상도에 따라 고정된 비트율로 할당하여 H.264/AVC 부호화를 거치고, 이를 주관적 화질 검사를 통해 스트리밍 서버에 저장한다. 비디오 콘텐츠의 해상도에 따라 일률적으로 고정된 비트율을 이용한 H.264/AVC 압축방식은 낮은 복잡도의 콘텐츠에서부터 높은 복잡도의 콘텐츠까지 다양하게 존재하는 비디오 콘텐츠의 특성을 고려하지 않고 저장 및 전송하는 것이다. 이러한 결과는 사용자와 콘텐츠가 많아짐에 따라 네트워크와 저장 장치에 대한 투자비용이 증가 될 수 있다. 이러한 문제를 고려하여 본 연구에서는 비디오 콘텐츠를 부호화하는 과정에서 고정된 비트율을 이용한 화질과 비교하여 주관적 화질을 유지하면서 적절한 비트율을 찾는 방법을 제시한다. 제안하는 단일 비트율 예측 구조는 먼저 프레임에서 비트와 연관성이 있는 파라미터를 추출하여 프레임의 복잡도를 계산한 후, 비트가 많이 할당될 것으로 예상되는 프레임을 찾아 후보 프레임으로 추출한다. 이는 비트율을 결정할 때 GOP 단위로 비트 할당이 많은 프레임을 기준으로 전체 비트율을 결정하기 위해서이다. 추출된 후보 프레임들에 대해 실제 부호화하는 과정으로써 목표 화질을 기준으로 수학적 모델링을 통해 최종적으로 전송될 비트율을 예측하는 구조를 설계하였다. 또한 하나의 비디오 콘텐츠 내에서, 내용별 분할에 따른 비트율을 예측하는 다중 비트율 예측 구조를 설계하였다. 프레임의 특징 파라미터를 기반으로 계층적 클러스터링 기법을 이용하여 유사한 프레임들을 그룹화하고 그룹별 후보 프레임을 추출하여 비트율을 예측함으로써 최종적으로 하나 이상의 다중 비트율을 예측하였다. 실험 결과, 단일 비트율 예측 구조는 고정 비트율에 비해 저복잡도 영상에서 평균 43%의 비트 감소율을 보였다. 다중 비트율 예측 구조에서는 저복잡도 영상에서 평균 52%, 고복잡도 영상에서 평균 6%의 비트 감소율을 보였다. 이러한 영상의 비트 감소율이 있음에도 불구하고 주관적 화질을 유지함을 알 수 있었다. 비디오 콘텐츠별 적절한 비트율을 찾기 위해 기존 구조에서는 다수의 부호화를 통해 결과물들의 주관적 화질 검증을 반복적으로 거치는 반면, 제안하는 구조는 사람이 관여하여 주관적 화질 검증을 반복적으로 수행하지 않아도 되며 일부 프레임만을 부호화하여 비트율 예측이 가능하다. 따라서 단일 비트율 예측 구조에서는 전체 프레임 중 평균 4% 프레임을, 다중 비트율 예측 구조에서는 45% 후보 프레임들을 부호화하여 자동적으로 비트율을 찾을 수 있다. 이렇게 예측된 단일 비트율로 부호화한 결과, 저복잡도 영상에서 평균 44%의 저장공간이 절약되었으며 다중 비트율로 부호화한 결과에서는 저복잡도 영상은 평균 52%, 고복잡도 영상에서는 5% 저장공간의 절약율을 보였다.
방송통신융합 서비스는 제한된 네트워크 대역폭에서 디지털 방송 TV, VOD 등의 다양한 서비스를 사용자에게 제공한다. 서비스 사업자들은 방송사나 영화사로부터 방송용 콘텐츠 원본을 제공받아 사용자에게 통신망을 통해 전송하기 위해 이를 비디오 트랜스코더로 부호화를 한다. 트랜스코더 내에서 입력으로 들어오는 MPEG-2 원본을 해상도에 따라 고정된 비트율로 할당하여 H.264/AVC 부호화를 거치고, 이를 주관적 화질 검사를 통해 스트리밍 서버에 저장한다. 비디오 콘텐츠의 해상도에 따라 일률적으로 고정된 비트율을 이용한 H.264/AVC 압축방식은 낮은 복잡도의 콘텐츠에서부터 높은 복잡도의 콘텐츠까지 다양하게 존재하는 비디오 콘텐츠의 특성을 고려하지 않고 저장 및 전송하는 것이다. 이러한 결과는 사용자와 콘텐츠가 많아짐에 따라 네트워크와 저장 장치에 대한 투자비용이 증가 될 수 있다. 이러한 문제를 고려하여 본 연구에서는 비디오 콘텐츠를 부호화하는 과정에서 고정된 비트율을 이용한 화질과 비교하여 주관적 화질을 유지하면서 적절한 비트율을 찾는 방법을 제시한다. 제안하는 단일 비트율 예측 구조는 먼저 프레임에서 비트와 연관성이 있는 파라미터를 추출하여 프레임의 복잡도를 계산한 후, 비트가 많이 할당될 것으로 예상되는 프레임을 찾아 후보 프레임으로 추출한다. 이는 비트율을 결정할 때 GOP 단위로 비트 할당이 많은 프레임을 기준으로 전체 비트율을 결정하기 위해서이다. 추출된 후보 프레임들에 대해 실제 부호화하는 과정으로써 목표 화질을 기준으로 수학적 모델링을 통해 최종적으로 전송될 비트율을 예측하는 구조를 설계하였다. 또한 하나의 비디오 콘텐츠 내에서, 내용별 분할에 따른 비트율을 예측하는 다중 비트율 예측 구조를 설계하였다. 프레임의 특징 파라미터를 기반으로 계층적 클러스터링 기법을 이용하여 유사한 프레임들을 그룹화하고 그룹별 후보 프레임을 추출하여 비트율을 예측함으로써 최종적으로 하나 이상의 다중 비트율을 예측하였다. 실험 결과, 단일 비트율 예측 구조는 고정 비트율에 비해 저복잡도 영상에서 평균 43%의 비트 감소율을 보였다. 다중 비트율 예측 구조에서는 저복잡도 영상에서 평균 52%, 고복잡도 영상에서 평균 6%의 비트 감소율을 보였다. 이러한 영상의 비트 감소율이 있음에도 불구하고 주관적 화질을 유지함을 알 수 있었다. 비디오 콘텐츠별 적절한 비트율을 찾기 위해 기존 구조에서는 다수의 부호화를 통해 결과물들의 주관적 화질 검증을 반복적으로 거치는 반면, 제안하는 구조는 사람이 관여하여 주관적 화질 검증을 반복적으로 수행하지 않아도 되며 일부 프레임만을 부호화하여 비트율 예측이 가능하다. 따라서 단일 비트율 예측 구조에서는 전체 프레임 중 평균 4% 프레임을, 다중 비트율 예측 구조에서는 45% 후보 프레임들을 부호화하여 자동적으로 비트율을 찾을 수 있다. 이렇게 예측된 단일 비트율로 부호화한 결과, 저복잡도 영상에서 평균 44%의 저장공간이 절약되었으며 다중 비트율로 부호화한 결과에서는 저복잡도 영상은 평균 52%, 고복잡도 영상에서는 5% 저장공간의 절약율을 보였다.
Broadcasting and communications convergence services use limited networks to deliver broadcast TV, VOD, and other Internet services to consumers. Service providers store video contents on a streaming server after being transcoded from MPEG-2 to H.264. The compressed video content is usually delivere...
Broadcasting and communications convergence services use limited networks to deliver broadcast TV, VOD, and other Internet services to consumers. Service providers store video contents on a streaming server after being transcoded from MPEG-2 to H.264. The compressed video content is usually delivered through CBR channels after performing subjective quality test. Even though the serviced video content varies from low-complexity to high-complexity video, the content’s characteristics are not taken into account in the transcoder. As a result, the conventional scheme based on a fixed bit rate cause bandwidth loss and requires a huge amount of storage space on a streaming server if the number of users and contents are increasing. Solving this problem requires a scheme capable of finding an appropriate bit rate for video content while maintaining subjective quality equivalent to that of a scheme that uses a fixed bit rate. In this study, we propose new schemes for estimating a single bit rate or multiple bit rates in a sequence. Because the proposed schemes do not encode full frames of video content, it is very important to determine the parameter that serves as an indirect measurement of frame’s bits. The single bit rate estimation scheme extract candidate frames using parameters, and estimate a bit rate using a model based on a given target quality. We also propose a multiple scheme for estimating a bit rate for each segment in a sequence. Using parameters, several segments in a video content are divided. To estimate the bit rate of each segment, candidate frames are extracted, which includes intra-frames that require a high number of bits. Finally, the bit rate of each segment is estimated by statistical analysis and a mathematical model based on a given target quality. In experimental results, the single bit rate estimation reduced the fixed bit rate on average by 43% in low-complexity video. The multiple bit rates estimation reduced the fixed bit rate on average by 52% in low-complexity video and 6% in high-complexity video while maintaining the subjective quality, respectively. To find the appropriate bit rate based on video contents, the proposed schemes can estimate the bit rate without the repeated full encoding and subjective quality test, while the conventional scheme estimate the bit rate encoding several full frames with the repeated subjective quality test. On average, the bit rate can be automatically estimated by encoding the candidate frames of 4% in the single bit rate estimation scheme and 45% in the multiple bit rates estimation scheme, respectively. Reducing the bit rate also reduces the need for storage space. The file size of low-complexity video encoded by the single bit rate can be saved by 44% on average from the file size encoded by the fixed bit rate. In the multiple bit rates, the storage saving is on average 52% and 5% in low-complexity video and high-complexity video, respectively.
Broadcasting and communications convergence services use limited networks to deliver broadcast TV, VOD, and other Internet services to consumers. Service providers store video contents on a streaming server after being transcoded from MPEG-2 to H.264. The compressed video content is usually delivered through CBR channels after performing subjective quality test. Even though the serviced video content varies from low-complexity to high-complexity video, the content’s characteristics are not taken into account in the transcoder. As a result, the conventional scheme based on a fixed bit rate cause bandwidth loss and requires a huge amount of storage space on a streaming server if the number of users and contents are increasing. Solving this problem requires a scheme capable of finding an appropriate bit rate for video content while maintaining subjective quality equivalent to that of a scheme that uses a fixed bit rate. In this study, we propose new schemes for estimating a single bit rate or multiple bit rates in a sequence. Because the proposed schemes do not encode full frames of video content, it is very important to determine the parameter that serves as an indirect measurement of frame’s bits. The single bit rate estimation scheme extract candidate frames using parameters, and estimate a bit rate using a model based on a given target quality. We also propose a multiple scheme for estimating a bit rate for each segment in a sequence. Using parameters, several segments in a video content are divided. To estimate the bit rate of each segment, candidate frames are extracted, which includes intra-frames that require a high number of bits. Finally, the bit rate of each segment is estimated by statistical analysis and a mathematical model based on a given target quality. In experimental results, the single bit rate estimation reduced the fixed bit rate on average by 43% in low-complexity video. The multiple bit rates estimation reduced the fixed bit rate on average by 52% in low-complexity video and 6% in high-complexity video while maintaining the subjective quality, respectively. To find the appropriate bit rate based on video contents, the proposed schemes can estimate the bit rate without the repeated full encoding and subjective quality test, while the conventional scheme estimate the bit rate encoding several full frames with the repeated subjective quality test. On average, the bit rate can be automatically estimated by encoding the candidate frames of 4% in the single bit rate estimation scheme and 45% in the multiple bit rates estimation scheme, respectively. Reducing the bit rate also reduces the need for storage space. The file size of low-complexity video encoded by the single bit rate can be saved by 44% on average from the file size encoded by the fixed bit rate. In the multiple bit rates, the storage saving is on average 52% and 5% in low-complexity video and high-complexity video, respectively.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.