동영상은 영상, 소리, 문자 등 다양한 미디어를 동시에 담고 있는 대표적인 멀티미디어이다. 특히 동영상에 인위적으로 삽입된 문자는 장면의 의미적인 정보를 담고 있는 경우가 대부분이기 때문에, 이러한 문자를 추출하려는 연구가 꾸준히 되어왔다. 본 논문은 동영상에 삽입된 자막 내 문자인식을 위해 문자추출방법을 제안한다. 최초 영상으로부터 자막영역을 획득하기 위해 DCT를 이용한 문자영역탐지를 수행하고 수정된 문자영역지역화 방법을 이용하여 정확한 자막영역을 획득한다. 이 후 문자화소명암값 결정과 문자추출을 하여 획득된 자막영상이 문자인식에 적합하도록 변환한다. 마지막으로 이진화된 영상이 자막영역인지 아닌지 ...
동영상은 영상, 소리, 문자 등 다양한 미디어를 동시에 담고 있는 대표적인 멀티미디어이다. 특히 동영상에 인위적으로 삽입된 문자는 장면의 의미적인 정보를 담고 있는 경우가 대부분이기 때문에, 이러한 문자를 추출하려는 연구가 꾸준히 되어왔다. 본 논문은 동영상에 삽입된 자막 내 문자인식을 위해 문자추출방법을 제안한다. 최초 영상으로부터 자막영역을 획득하기 위해 DCT를 이용한 문자영역탐지를 수행하고 수정된 문자영역지역화 방법을 이용하여 정확한 자막영역을 획득한다. 이 후 문자화소명암값 결정과 문자추출을 하여 획득된 자막영상이 문자인식에 적합하도록 변환한다. 마지막으로 이진화된 영상이 자막영역인지 아닌지 인공신경망을 이용한 검증을 수행하여 자막영역이 아닌 영역을 제거한다. 본 논문에서 제안된 문자화소명암값 결정 방법은 기존방법보다 정확도가 높았다. 또한 본 논문에서 제안된 문자추출방법은 문자인식을 수행하였을 때 기존문자추출방법보다 문자인식률이 높았다.
동영상은 영상, 소리, 문자 등 다양한 미디어를 동시에 담고 있는 대표적인 멀티미디어이다. 특히 동영상에 인위적으로 삽입된 문자는 장면의 의미적인 정보를 담고 있는 경우가 대부분이기 때문에, 이러한 문자를 추출하려는 연구가 꾸준히 되어왔다. 본 논문은 동영상에 삽입된 자막 내 문자인식을 위해 문자추출방법을 제안한다. 최초 영상으로부터 자막영역을 획득하기 위해 DCT를 이용한 문자영역탐지를 수행하고 수정된 문자영역지역화 방법을 이용하여 정확한 자막영역을 획득한다. 이 후 문자화소명암값 결정과 문자추출을 하여 획득된 자막영상이 문자인식에 적합하도록 변환한다. 마지막으로 이진화된 영상이 자막영역인지 아닌지 인공신경망을 이용한 검증을 수행하여 자막영역이 아닌 영역을 제거한다. 본 논문에서 제안된 문자화소명암값 결정 방법은 기존방법보다 정확도가 높았다. 또한 본 논문에서 제안된 문자추출방법은 문자인식을 수행하였을 때 기존문자추출방법보다 문자인식률이 높았다.
Video that include audio, image, text, etc as various media is typical multimedia. In particular, many researcher have been studying about extracting text on video, because artificially inserted text on video contain scene information of meaning in the majority of cases. In this paper, I proposed th...
Video that include audio, image, text, etc as various media is typical multimedia. In particular, many researcher have been studying about extracting text on video, because artificially inserted text on video contain scene information of meaning in the majority of cases. In this paper, I proposed the text extraction method for character recognition about the inserted caption in video. Firstly, for obtaining the caption region, the coarse text region is detected through analyzing DCT coefficient and the accurate text region was localized each region by modified method of text localization. The next step, the caption images localized were converted into suitable images for character recognition through determination of text pixel's intensity value and extraction text. The last step, converted images were verified wether text region or non-text region by using artificial neural network. In this paper, the proposed method, the determination of text pixel's intensity value method showed higher accuracy than the traditional method. And the proposed method about text extraction in this paper showed higher text recognition rate than the traditional method.
Video that include audio, image, text, etc as various media is typical multimedia. In particular, many researcher have been studying about extracting text on video, because artificially inserted text on video contain scene information of meaning in the majority of cases. In this paper, I proposed the text extraction method for character recognition about the inserted caption in video. Firstly, for obtaining the caption region, the coarse text region is detected through analyzing DCT coefficient and the accurate text region was localized each region by modified method of text localization. The next step, the caption images localized were converted into suitable images for character recognition through determination of text pixel's intensity value and extraction text. The last step, converted images were verified wether text region or non-text region by using artificial neural network. In this paper, the proposed method, the determination of text pixel's intensity value method showed higher accuracy than the traditional method. And the proposed method about text extraction in this paper showed higher text recognition rate than the traditional method.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.