최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기방송공학회논문지 = Journal of broadcast engineering, v.23 no.5, 2018년, pp.718 - 721
이정경 (이화여자대학교 엘텍공과대학 전자전기공학과) , 김나영 (이화여자대학교 엘텍공과대학 전자전기공학과) , 강제원 (이화여자대학교 엘텍공과대학 전자전기공학과)
This paper presents an inter-prediction technique using deep learning, where a virtual reference frame of the current frame is synthesized by using the reconstructed frames to improve coding efficiency. Experimental results demonstrate that the proposed algorithm provides 1.9% BD-rate reduction on a...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
비디오 프레임 생성 기법이란 무엇인가? | 비디오 프레임 생성 기법은 과거 비디오 프레임을 이용하여 아직 관측되지 않은 새로운 비디오 프레임을 예측하는 알고리즘이다. 최근에는 비디오 프레임 간 시간상의 연관성을 이용하는 순환신경망 구조 (RNN)에 기반을 두고 장기간의 비디오를 예측 생성하는 연구가 활발하게 진행이 되고 있으나, RNN의 학습에 오차 역전파 과정에서의 기울기 소실 문제를 완전히 극복하기 어려울 뿐 아니라 입력 영상을 은닉벡터로 변환하고 다시 복원하는 과정에서 많은 블러링이 발생하는 등의 문제가 있어 여전히 많은 연구가 필요하다[6]. | |
딥러닝 기반의 압축 기술 연구에는 무엇이 있는가? | 최근의 딥러닝 기반의 압축 기술 연구는 크게 두 가지 방향으로 요약이 가능하다. 첫째, 오토엔코더 기반의 코덱을 이용하여 입력 영상을 인코더 신경망의 종단에서 은닉벡터로 변환하고 엔트로피 부호화를 수행하는 종단 간 압축 방식이다. 현 시점에서 오토엔코더 기반 코덱은 정지영상 압축에서 HEVC 화면 내 압축 성능에 근접하는 연구결과가 보고되고 있다[2]. 둘째, 딥러닝 기반 영상처리 기법을 기존 비디오 부호화 요소 기술에 적용하는 방식이다. 대표적인 응용 예로 콘볼루셔널 뉴럴 네트워크 (CNN) 기반 초해상도 기법 및 디노이징 기법을 인루프필터에 이용하여 복원 프레임의 화질을 개선하고 압축 효율을 증대시키는 알고리즘이 제안되었다[3,4]. | |
RNN의 학습에서 나타나는 문제점은 무엇인가? | 비디오 프레임 생성 기법은 과거 비디오 프레임을 이용하여 아직 관측되지 않은 새로운 비디오 프레임을 예측하는 알고리즘이다. 최근에는 비디오 프레임 간 시간상의 연관성을 이용하는 순환신경망 구조 (RNN)에 기반을 두고 장기간의 비디오를 예측 생성하는 연구가 활발하게 진행이 되고 있으나, RNN의 학습에 오차 역전파 과정에서의 기울기 소실 문제를 완전히 극복하기 어려울 뿐 아니라 입력 영상을 은닉벡터로 변환하고 다시 복원하는 과정에서 많은 블러링이 발생하는 등의 문제가 있어 여전히 많은 연구가 필요하다[6]. 반대로 비교적 짧은 시간 거리에 있는 비디오 생성을 위해 RNN을 생략하고 CNN 구조를 이용하여 입력 비디오를 합성하고 출력하는 연구가 비디오 보간에 적용되어 우수한 보간 성능을 제공하고 있다[7]. |
S. Liu, L. Wang, P. Wu, and H. Yang, "JVET AHG report 9: Neural Networks in Video Coding (AHG9)" in ISO/IEC/JTC1/SC29/ WG11 and ITU-T SG16 Q.6, Apr. 2018.
S.H Cho, Y. H. Kim, W. Lim, H.W. Kim, and C.S. Choi, "A Technical Analysis on Deep Learning based Image and Video Compression", Journal of Broadcast Engineering, Vol. 23, No. 3, 383-394, May 2018
W. Park and M. Kim, "CNN-based in-loop filtering for coding efficiency improvement," IEEE Image, Video, and Multidimensional Signal Processing Workshop, 2016.
J. Kang, S. Kim, and K. M. Lee, "Multi-modal Multi-scale Convolutional Neural Network based In-loop Filter Design for Next Generation Video Codec," IEEE International Conference on Image Processing, 2017.
J.K. Lee and J.-W. Kang, "Video coding technique based on deep learning", 2018 KIBME Summer Conference.
B. D. Brabandere, X. Jia, T. Tuytelaars, and L. V. Gool, "Dynamic filter networks," Neural Information Processing Systems (NIPS). 2016.
S. Niklaus, L. Mai, and F. Liu. "Video frame interpolation via adaptive separable convolution," International Conference on Computer Vision, 2017.
HM16.9 software, available at: https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/tags/HM-16.9
F. Bossen, "JCTVC-L1100: Common test conditions and software reference configurations" in ISO/IEC/JTC1/SC29/WG11 and ITU-T SG16 Q.6, Jan.2013.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.