본 논문에서는 메모리 공정이 필요 없고 내장 프로세서를 사용하지 않는 H.264/AVC 엔트로피 복호기를 제안한다. 기존에 발표된 H.264/AVC 엔트로피 복호기의 경우 상당수의 연구가 내부의 ROM 또는 RAM이 필요하기 때문에 일반적인 디지털 로직 공정에서 구현이 어렵다. 또한 상당수의 연구가 비트열 처리를 위하여 내장 프로세서를 사용하기 때문에 면적이 크고 전력소모가 많은 단점을 가지고 있다. 본 논문에서는 내장 프로세서를 사용하지 않는 H.264/AVC Hardwired 엔트로피 복호기를 제안함으로써 데이터 처리 속도를 증가시키고 전력 소모를 줄인다. 또한 CAVLC 복호기에서 복호 시에 이용되는 룩업 테이블 및 저장 공간을 최적화하고 내장 메모리를 사용하지 않는 구조를 제안함으로써, 기존 연구에 비해 하드웨어 크기를 줄이고 ROM 또는 RAM이 지원되지 않는 디지털 로직 제조 공정에서도 쉽게 구현이 가능하다. 설계된 엔트로피 복호기는 H.264/AVC 비디오 복호기의 일부로 내장되어 전체 시스템에서 동작하는 것을 검증하였다. TSMC 90nm 공정으로 합성한 결과 최대동작주파수는 125MHz이며, QCIF, CIF, QVGA 영상을 지원할 뿐만 아니라 nC 레지스터 등 약간의 수정을 통해서 VGA 영상도 지원이 가능하다.
본 논문에서는 메모리 공정이 필요 없고 내장 프로세서를 사용하지 않는 H.264/AVC 엔트로피 복호기를 제안한다. 기존에 발표된 H.264/AVC 엔트로피 복호기의 경우 상당수의 연구가 내부의 ROM 또는 RAM이 필요하기 때문에 일반적인 디지털 로직 공정에서 구현이 어렵다. 또한 상당수의 연구가 비트열 처리를 위하여 내장 프로세서를 사용하기 때문에 면적이 크고 전력소모가 많은 단점을 가지고 있다. 본 논문에서는 내장 프로세서를 사용하지 않는 H.264/AVC Hardwired 엔트로피 복호기를 제안함으로써 데이터 처리 속도를 증가시키고 전력 소모를 줄인다. 또한 CAVLC 복호기에서 복호 시에 이용되는 룩업 테이블 및 저장 공간을 최적화하고 내장 메모리를 사용하지 않는 구조를 제안함으로써, 기존 연구에 비해 하드웨어 크기를 줄이고 ROM 또는 RAM이 지원되지 않는 디지털 로직 제조 공정에서도 쉽게 구현이 가능하다. 설계된 엔트로피 복호기는 H.264/AVC 비디오 복호기의 일부로 내장되어 전체 시스템에서 동작하는 것을 검증하였다. TSMC 90nm 공정으로 합성한 결과 최대동작주파수는 125MHz이며, QCIF, CIF, QVGA 영상을 지원할 뿐만 아니라 nC 레지스터 등 약간의 수정을 통해서 VGA 영상도 지원이 가능하다.
This paper proposes a H.264/AVC entropy decoder without embedded processor nor memory fabrication process. Many researches on H.264/AVC entropy decoders require ROM or RAM fabrication process, which is difficult to be implemented in general digital logic fabrication process. Furthermore, many resear...
This paper proposes a H.264/AVC entropy decoder without embedded processor nor memory fabrication process. Many researches on H.264/AVC entropy decoders require ROM or RAM fabrication process, which is difficult to be implemented in general digital logic fabrication process. Furthermore, many researches require embedded processors for bitstream manipulation, which increases area and power consumption. This papers proposes hardwired H.264/AVC entropy decoder without embedded processor, which improves data processing speed and reduces power consumption. Furthermore, its CAVLC decoder optimizes lookup table and internal buffer without embedded memory, which reduces hardware size and can be implemented in general digital logic fabrication process without ROM or RAM fabrication process. Designed entropy decoder was embedded in H.264/AVC video decoder, and it was verified to operate correctly in the system. Synthesized in TSMC 90nm fabrication process, its maximum operation frequency is 125MHz. It supports QCIF, CIF, and QVGA image format. Under slight modification of nC register and other blocks, it also support VGA image format.
This paper proposes a H.264/AVC entropy decoder without embedded processor nor memory fabrication process. Many researches on H.264/AVC entropy decoders require ROM or RAM fabrication process, which is difficult to be implemented in general digital logic fabrication process. Furthermore, many researches require embedded processors for bitstream manipulation, which increases area and power consumption. This papers proposes hardwired H.264/AVC entropy decoder without embedded processor, which improves data processing speed and reduces power consumption. Furthermore, its CAVLC decoder optimizes lookup table and internal buffer without embedded memory, which reduces hardware size and can be implemented in general digital logic fabrication process without ROM or RAM fabrication process. Designed entropy decoder was embedded in H.264/AVC video decoder, and it was verified to operate correctly in the system. Synthesized in TSMC 90nm fabrication process, its maximum operation frequency is 125MHz. It supports QCIF, CIF, and QVGA image format. Under slight modification of nC register and other blocks, it also support VGA image format.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
크기를 매우 증가시킨다. 본 논문에서는 룩업 테이블 및 저장 공간의 최적화 기법을 사용하여 하드웨어 크기를 최적화 하는 방법도 제시한다.
본 논문에서는 이러한 문제점을 해결하기 위해 프로세서를 사용하지 않는 엔트로피 복호기를 제안한다. H.
본 논문에서는 이러한 특징을 이용하여 모든 블록에 대해 저장 공간을 할당하지 않고, 같은 열의 블록끼리 저장 공간을 재사용할 수 있는 구조를 제시함으로써 저장 공간을 줄였다. 그림 5에서 보듯이 기본적으로 같은 열의 블록들은 하나의 공통 저장 공간을 사용하고, 그중에서 특정한 위치의 블록들 (1, 5, 7, 9, 13, 19, 23)만 따로 저장 공간을 사용하는 기법을 사용하였다.
본 절에서는 프로세서를 사용하지 않고 비트열을 처리하는 Hardwired 엔트로피 복호기를 제안한다. 복호기는 크게 NAL 복호기, Exp-Golomb 복호기, CAVLC 복호기로 구성되며 NAL 복호기와 Exp-Golomb 복호기를 프로세서에서 처리하지 않고 CAVLC 복호기와 같이 Hardwired로 설계함으로써 프로세서의 부하를 줄여주고 데이터 처리 속도를 증가시키며, 전력 소모를 줄인다.
제안 방법
기존의 엔트로피 복호기는 CAVLC 복호기만 하드웨어로 구현하고, Exp-Golomb 복호화와 남은 비트열 데이터의 복호화는 프로세서에서 처리한다. 그러나 본 논문에서는 위의 모든 것을 프로세서 없이 처리하는 Hardwired 엔트로피 복호기를 제안한다. Hardwired 엔트로피 복호기는 휴대용 멀티미디어 기기 등에서 프로세서의 부하를 줄여주어 데이터 처리 속도를 증가시키며 전력 소모를 줄일 수 있다.
264/AVC 엔트로피 복호기는 CAVIC 복호기만 하드웨어로 구현하고, 나머지 비트열 데이터의 처리 부분과 Exp-Golomb 복호화는 프로세서에서 처리를 하기 때문에 내장 프로세서의 과부하 및 배터리 소모가 많은 것이 문제였다. 그러나 본 논문에서는 프로세서를 사용하지 않고 전체 복호화를 처리하는 Hardwired 엔트로피 복호기를 제안하였다. 제안한 엔트로피 복호기는 프로세서의 부하를 줄여주어 데이터 처리 속도를 증가 시키며, 전력 소모를 줄일 수 있다.
제안한 엔트로피 복호기는 프로세서의 부하를 줄여주어 데이터 처리 속도를 증가 시키며, 전력 소모를 줄일 수 있다. 또한 CAVLC 복호에 이용되는 룩업 테이블 및 저장 공간을 최적화하여 하드웨어 크기를 최적화하였다.
복호기는 크게 NAL 복호기, Exp-Golomb 복호기, CAVLC 복호기로 구성되며 NAL 복호기와 Exp-Golomb 복호기를 프로세서에서 처리하지 않고 CAVLC 복호기와 같이 Hardwired로 설계함으로써 프로세서의 부하를 줄여주고 데이터 처리 속도를 증가시키며, 전력 소모를 줄인다. 또한 CAVLC 복호기는 룩업 테이블 및 저장 공간의 최적화 기법을 통해 하드웨어 크기를 줄인다.
표 6은 IDEC (IC Design Education Center) 의 설계 도구 지원을 받아 엔트로피 복호기를 TSMC 90nm 공정으로 108MHz로 합성한 결과이며, 최적화한 룩업 테이블과 nC 레지스터를 ROM과 RAM이 아닌 오직 로직으로만 구현하였다. 복호기의 최대동작주파수는 125MHz 이며, CIF, QCIF, QVGA의 다양한 영상 크기에 대해서 검증하였다. 또한 nC 레지스터 등 약간의 수정을 통해서 VGA(640x480) 영상도 지원 가능하다.
복호화 시, 이전에 복호화 된 위쪽과 왼쪽 블록 TotalCoeff의 nC (평균값)에 따라 룩업 테이블을 선택하고, 입력된 코드워드에 맞게 TotalCoeff, Tls 값을 복호한다. 또한 값(0이면 +, 1이면 -)에 맞게 Tl(±l) 값을 복호 한다.
설계된 H.26VAVC 엔트로피 복호기는 영상을 부호화한 비트열을 직접 입력으로 받아 복호한 데이터를 다른 IP 블록들과 주고받는 것을 통해 검증하였다. 표 6은 IDEC (IC Design Education Center) 의 설계 도구 지원을 받아 엔트로피 복호기를 TSMC 90nm 공정으로 108MHz로 합성한 결과이며, 최적화한 룩업 테이블과 nC 레지스터를 ROM과 RAM이 아닌 오직 로직으로만 구현하였다.
위의 두 방법을 사용하여 표 4에서 보는 것과 같이 coeff_token과 total_zeros 룩업 테이블을 최적화하였다. 'Suffix Info.
그러나 제안하는 엔트로피 복호기는 입력단을 하나만 설계하여 같이 사용함으로써 불필요한 면적을 줄였다. 제안하는 Exp-Golomb 복호기는 그림 2와 같으며, 입력된 비트열을 code_num 으로 복호화해주는 First 1 Detector와 Combination 로직, 그리고 code_num을 구문요소로 복호화 해주는 Postprocessing Module 등으로 구성되어 있다.
것이다. 제안하는 복호기는 룩업 테이블과 nC 레지스터를 메모리의 사용 없이 오직 로직으로만 구현하였다. 따라서 ROM 또는 RAM이 지원되지 않는 디지털 로직 제조 공정에서도 쉽게 구현이 가능하다.
제안하는 엔트로피 복호기는 그림 1과 같이 NAL 복호기, Exp-Golomb 복호기, CAVLC 복호기, Input Buffer, ReOrder 등으로 구성된다. NAL 복호기는 비트열을 처리하며 프로세서 대신 엔트로피 복호기를 제어한다.
CAVLC 복호기는 coeff_token, Tls, Level, total_zeros, run_before 5개의 구문 요소를 처리하는 복호기와 내부 버퍼 (nC Register, Level FIFO, Run_Before Stack), 제어기 블록으로 이루어져 있다. 특히 coeff_token과 total_zeros 복호 시 참조해야할 룩업 테이블의 크기가 매우 크고 비슷한 유형의 인덱스가 많기 때문에 두 복호기를 통합하여 설계하였다.
26VAVC 엔트로피 복호기는 영상을 부호화한 비트열을 직접 입력으로 받아 복호한 데이터를 다른 IP 블록들과 주고받는 것을 통해 검증하였다. 표 6은 IDEC (IC Design Education Center) 의 설계 도구 지원을 받아 엔트로피 복호기를 TSMC 90nm 공정으로 108MHz로 합성한 결과이며, 최적화한 룩업 테이블과 nC 레지스터를 ROM과 RAM이 아닌 오직 로직으로만 구현하였다. 복호기의 최대동작주파수는 125MHz 이며, CIF, QCIF, QVGA의 다양한 영상 크기에 대해서 검증하였다.
대상 데이터
제안한다. H.264/AVC 엔트로피 복호기는 NAL (Network Abstraction Layer) 헤더와 RBSP (Raw Byte Sequence Payload)로 구성된 비트열 데이터를 받아서 영상 복원에 필요한 데이터를 얻는다. 그 중에서 높은 압축 효율을 요구하는 DCT계수의 복호화는 CAVLC (Context-Adaptive Variable Length Coding) 방식을 사용하며, 그 외 구문요소의 복호화는 Exp-Golomb (Exponential Golomb) 방식을 사용한다.
이 방식은 블록 간의 유사성을 이용함으로써 높은 압출 효율을 가지나, 참조할 정보를 저장할 공간이 필요하다. 블록의 계수의 개수를 복호화 할 때, 이전에 복호화 된 위쪽과 왼쪽 블록 TotaJCoeff의 nC (평균값)가 룩업 테이블의 인덱스로써 사용된다. 참조되는 블록의 정보를 저장하기 위한 공간이 필요하며, CIF (352x288) 영상에서는 9504 byte의 저장 공간이 필요하다凹 그러나 지상파 DMB 표준에서는 ASO (Arbitrary Slice Order)를 지원하지 않아 매크로 블록 부호화 순서가 주사선 방식 (Raster Order) 이므로 저장된 블록의 정보는 두 번 참조된 이후 더 이상 참조되지 않는다.
이론/모형
264/AVC 엔트로피 복호기는 NAL (Network Abstraction Layer) 헤더와 RBSP (Raw Byte Sequence Payload)로 구성된 비트열 데이터를 받아서 영상 복원에 필요한 데이터를 얻는다. 그 중에서 높은 압축 효율을 요구하는 DCT계수의 복호화는 CAVLC (Context-Adaptive Variable Length Coding) 방식을 사용하며, 그 외 구문요소의 복호화는 Exp-Golomb (Exponential Golomb) 방식을 사용한다. 기존의 엔트로피 복호기는 CAVLC 복호기만 하드웨어로 구현하고, Exp-Golomb 복호화와 남은 비트열 데이터의 복호화는 프로세서에서 처리한다.
성능/효과
설계한 CAVLC 복호기의 로직 크기는 이전 논문의 구현 사례와 비교할 때 더 작았으며, Hai-dwired 엔트로피 복호기 역시 프로세서를 사용하지 않았기 때문에 하드웨어 크기 면에서 매우 효율적이다. 또한 단일 H.
그러나 본 논문에서는 프로세서를 사용하지 않고 전체 복호화를 처리하는 Hardwired 엔트로피 복호기를 제안하였다. 제안한 엔트로피 복호기는 프로세서의 부하를 줄여주어 데이터 처리 속도를 증가 시키며, 전력 소모를 줄일 수 있다. 또한 CAVLC 복호에 이용되는 룩업 테이블 및 저장 공간을 최적화하여 하드웨어 크기를 최적화하였다.
참고문헌 (5)
Joint Video Team, 'Draft ITU-T Recommendation and Final Draft International Standard of Joint Video Specification', ITU-T Rec. H.264 and ISO/IEC 14496-10 AVC, May 2003
W. Di, G. Wen, H. Mingzeng and J. Zhenzhou, 'An Exp-Golomb Encoder and Decoder Architecture for JVT/AVS', Proceedings of International Conference on ASIC, vol. 2, pp. 910-913, Oct. 2003
Dae-Joon Lee and Yong-Jin Jeong, 'VLSI architecture design of CAVLC entropy encoder/decoder for H.264/AVC', Journal of Korea Information and Communications Society, vol. 30, no. 5C, pp. 371-381, 2005년5월
M. Horowitz, A. Joch, F. Kossentini, and A. Hallapuro, 'H.264/AVC baseline profile decoder complexity analysis', IEEE Transactions on Circuits and Systems for Video Technology, vol. 13, no 7, pp. 704-716, Jul. 2003
M. Alle, J Biswas and S. Nandy, 'High Performance VLSI Architecture Design for H.264 CAVLC Decoder', Proceedings of International Conference on Application-Specific Systems, Architectures, and Processors, pp. 317-322, Sep. 2006
※ AI-Helper는 부적절한 답변을 할 수 있습니다.