영상 이진화 기술은 객체와 배경을 분할하는 과정으로 영상 분석 및 인식 분야에 널리 적용되고 있다. 기존의 이진화 방법은 임계치를 설정하는 과정에서 객체와 배경의 명암 차이가 크지 않을 경우에 불확실성이 존재한다. 이러한 문제점을 개선한 퍼지 이진화는 객체의 특징을 효과적으로 이진화 하지만 ${\alpha}$-cut값을 정적으로 설정하기 때문에 객체의 특징들이 손실된 상태로 이진화 되는 문제점이 있다. 따라서 본 논문에서는 평균, 반복, Otsu 이진화 방법들의 임계치를 이용한 퍼지 소속 함수를 구하여 ${\alpha}$-cut값을 동적으로 설정하는 방법을 제안한다. 다양한 영상을 대상으로 실험한 결과, 제안된 방법은 기존의 이진화 방법 및 퍼지 이진화 방법보다 배경과 객체들의 손실이 적은 상태로 이진화된 것을 확인하였다.
영상 이진화 기술은 객체와 배경을 분할하는 과정으로 영상 분석 및 인식 분야에 널리 적용되고 있다. 기존의 이진화 방법은 임계치를 설정하는 과정에서 객체와 배경의 명암 차이가 크지 않을 경우에 불확실성이 존재한다. 이러한 문제점을 개선한 퍼지 이진화는 객체의 특징을 효과적으로 이진화 하지만 ${\alpha}$-cut값을 정적으로 설정하기 때문에 객체의 특징들이 손실된 상태로 이진화 되는 문제점이 있다. 따라서 본 논문에서는 평균, 반복, Otsu 이진화 방법들의 임계치를 이용한 퍼지 소속 함수를 구하여 ${\alpha}$-cut값을 동적으로 설정하는 방법을 제안한다. 다양한 영상을 대상으로 실험한 결과, 제안된 방법은 기존의 이진화 방법 및 퍼지 이진화 방법보다 배경과 객체들의 손실이 적은 상태로 이진화된 것을 확인하였다.
Image binarization is a process to divide the image into objects and backgrounds, widely applied to the fields of image analysis and its recognition. In the existing method of binarization, there is some uncertainty when there is insufficient brightness gap between objects and backgrounds in setting...
Image binarization is a process to divide the image into objects and backgrounds, widely applied to the fields of image analysis and its recognition. In the existing method of binarization, there is some uncertainty when there is insufficient brightness gap between objects and backgrounds in setting threshold. The method of fuzzy binarization has improved the features of objects efficiently. However, since this method sets ${\alpha}$-cut value statically, there remain some problems that important features of objects can be lost during binarization. Therefore, in this paper, we propose a binarization method which does not set ${\alpha}$-cut value statically. The proposed method uses fuzzy membership functions calculated by thresholds of mean, iterative, and Otsu binarization. Experiment results show the proposed method binaries various images with less loss than the existing methods.
Image binarization is a process to divide the image into objects and backgrounds, widely applied to the fields of image analysis and its recognition. In the existing method of binarization, there is some uncertainty when there is insufficient brightness gap between objects and backgrounds in setting threshold. The method of fuzzy binarization has improved the features of objects efficiently. However, since this method sets ${\alpha}$-cut value statically, there remain some problems that important features of objects can be lost during binarization. Therefore, in this paper, we propose a binarization method which does not set ${\alpha}$-cut value statically. The proposed method uses fuzzy membership functions calculated by thresholds of mean, iterative, and Otsu binarization. Experiment results show the proposed method binaries various images with less loss than the existing methods.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
그러나 기존의 퍼지 이진화 방법에서는 ⍺-cut값을 정적으로 설정하기 때문에 배경과 객체간의 명암도가 차이가 적을 경우에는 이진화 하는 과정에서 객체들의 정보들이 손실된 상태에서 이진화 된다. 따라서 이러한 문제점을 개선하기 위해 본 논문에서는 ⍺-cut값을 정적으로 설정하지 않고 가장 많이 사용되는 평균, 반복, Otsu 이진화 방법들의 세 임계치를 이용하여 퍼지 이진화 방법에서 ⍺-cut을 자동으로 설정하는 개선된 퍼지 이진화 방법을 제안한다.
따라서 기존의 이진화 방법들을 적용하여 객체와 배경을 분리하여 이진화 하는 과정에서 정보 손실이 되는 경우가 발생한다. 본 논문에서는 기존의 이진화 방법들의 문제점을 개선하기 위해 기존의 이진화 방법들의 임계치를 이용하여 삼각형 형태의 소속 함수를 설계하고 ⍺-cut값을 동적으로 설정하는 개선된 퍼지 이진화 기법을 제안한다.
가설 설정
만약 삼각형의 집합 X, Y, Z이 있고 각각의 원소 x∈X, y∈Y, z∈Z 소속되어 있다고 가정한다.
제안 방법
제안된 퍼지 이진화 방법은 객체와 배경을 구분하기 위해서 흑과 백이 꼭 히스토그램 상에서 반이 아니라 것에 착안을 하여 평균, 반복, 오쯔 이진화의 임계치를 구한 후, 이 임계치를 기반으로 하는 세 개의 소속 함수의 중심 값으로 설정하였다. 그리고 세 개의 소속 함수들의 전체 길이와 각각 소속 함수의 길이의 비율을 계산하여 조정률을 구한 후, 이 조정률을 이용하여 ⍺-cut 값을 동적으로 설정하여 배경과 객체들을 이진화 하였다. 다양한 영상을 대상으로 실험한 결과, 제안된 퍼지 이진화 방법에는 ⍺-cut값의 분포도가 0.
그 이유는 사람 영상에서 사람 영역은 어둡게 나타나고 그 이외의 영역들은 밝게 나타난다. 본 실험의 결과는 0.16의 ⍺-cut값이 나왔고 이를 [11-129]구간에서 이진화를 적용하였다.
실험은 평균 이진화, 모드 이진화, 반복 이진화, 오쯔 이진화, 기존 퍼지 이진화 방법과 제안된 ⍺-cut 자동 설정 기반의 퍼지 이진화 방법을 비교 분석하였다. 실험에 사용된 영상은 그림 4와 같다.
원 영상에서 평균 이진화(Tmean), 반복 이진화(Titer), 오쯔 이진화(TOtsu)의 임계치를 구한 후, 각 임계치를 각 삼각형 타입의 소속 함수의 중심값으로 설정한다. 식(10)은 각 소속 함수의 중심을 의미한다.
이러한 문제점을 개선하기 위해 퍼지 이진화 방법이 제안되었으나 소속 함수를 적용하여 이진화 하는 과정에서 정적으로 ⍺-cut을 설정하기 때문에 객체의 특징들이 명확히 이진화 되지 않는 경우가 발생하였다, 따라서 본 논문에서 퍼지 이진화 방법에서 ⍺-cut을 동적으로 설정하여 구간 임계치를 구하고 객체의 특징들이 손실되지 않게 하는 개선된 퍼지 이진화 방법을 제안하였다.
그러나 제안된 퍼지 이진화는 맥주잔의 형태가 비교적 선명하게 나타난 상태로 이진화된 것을 확인할 수 있다. 제안된 퍼지 이진화 방법에서 0.66의 ⍺-cut값이 나왔고 이를 [72-146]구간에 이진화를 적용하였다.
제안된 퍼지 이진화 방법은 객체와 배경을 구분하기 위해서 흑과 백이 꼭 히스토그램 상에서 반이 아니라 것에 착안을 하여 평균, 반복, 오쯔 이진화의 임계치를 구한 후, 이 임계치를 기반으로 하는 세 개의 소속 함수의 중심 값으로 설정하였다. 그리고 세 개의 소속 함수들의 전체 길이와 각각 소속 함수의 길이의 비율을 계산하여 조정률을 구한 후, 이 조정률을 이용하여 ⍺-cut 값을 동적으로 설정하여 배경과 객체들을 이진화 하였다.
또한 퍼지 이진화와 제안된 퍼지 이진화의 결과 영상은 자동차 번호를 이진화 하는데 효과적이었다. 제안된 퍼지 이진화는 실험의 결과는 0.68의 ⍺-cut값이 나왔고 이를 [78-152]구간에 이진화를 적용하였다.
좀 더 세밀한 형체를 구분할 수 있었다. 제안된 퍼지 이진화의 실험 결과는 0.42의 ⍺-cut값이 나왔고 이를 [96-214]구간에서 이진화를 적용하였다.
대상 데이터
실험에 사용된 영상은 24bit (16,777,216) 수준의 컬러 영상을 사용하였으며 영상의 크기는 1024 × 1820의 맥주잔 영상, 1024 × 1365의 바위 영상, 1024 × 768의 자동차번호판 , 1024 × 576의 사람 영상을 대상으로 하였다.
성능/효과
그러나 퍼지 이진화 방법으로 실험한 결과, 맥주잔 형체가 나타났으나 일부 영역에서 정보가 손실된 것을 알 수 있다. 그러나 제안된 퍼지 이진화는 맥주잔의 형태가 비교적 선명하게 나타난 상태로 이진화된 것을 확인할 수 있다. 제안된 퍼지 이진화 방법에서 0.
또한 기존 퍼지 이진화는 배경과 대상 객체의 밝기값 비율에서 높은 차이를 보일 경우에는 영상을 이진화 하는데 비효율적인 것을 실험을 통해서 확인할 수 있었다. 그러나 제안된 퍼지 이진화에서는 기존 퍼지 이진화보다 객체의 정보 손실이 적어 영상 분할 및 영상 인식에 효율적인 것을 알 수 있었다.
기존 전역 이진화 방법으로는 전혀 바위의 형체를 구분할 수 없었으나 기존 퍼지 이진화 방법에서는 바위의 형체를 구분할 수 있도록 이진화 되었으나 바위의 형체에서 일부가 잡음으로 인식된 것을 확인할 수 있다. 그리나 제안된 퍼지 이진화 방법에서는 바위의 형체가 명확히 이진화 되어 기존의 퍼지 이진화보다 객체 송실이 없는 것을 알 수 있다. 좀 더 세밀한 형체를 구분할 수 있었다.
그림 5에서 확인할 수 있듯이 기존의 이진화 방법들 중에서 퍼지 이진화 방법과 제안된 퍼지 이진화 방법이 효과적으로 이진화 되었다. 그 이유는 사람 영상에서 사람 영역은 어둡게 나타나고 그 이외의 영역들은 밝게 나타난다.
그리고 세 개의 소속 함수들의 전체 길이와 각각 소속 함수의 길이의 비율을 계산하여 조정률을 구한 후, 이 조정률을 이용하여 ⍺-cut 값을 동적으로 설정하여 배경과 객체들을 이진화 하였다. 다양한 영상을 대상으로 실험한 결과, 제안된 퍼지 이진화 방법에는 ⍺-cut값의 분포도가 0.1에서 0.9사이에서 균일하게 분포하였으며 영상의 이진화 품질은 기존 퍼지 이진화 방법을 적용하였을 경우보다 효과적이었다. 특히 객체와 배경의 특징을 구분하는 단계에서 기존의 이진화들보다 객체의 정보 손실이 매우 적은 것을 확인할 수 있었다.
실험한 많은 영상에서 기존 전역 이진화 방법들 보다 객체의 특징을 효과적으로 표현하는 것을 확인할 수 있었다. 또한 기존 퍼지 이진화는 배경과 대상 객체의 밝기값 비율에서 높은 차이를 보일 경우에는 영상을 이진화 하는데 비효율적인 것을 실험을 통해서 확인할 수 있었다. 그러나 제안된 퍼지 이진화에서는 기존 퍼지 이진화보다 객체의 정보 손실이 적어 영상 분할 및 영상 인식에 효율적인 것을 알 수 있었다.
그러나 모드 이진화와 오쯔 이진화에서는 결과 영상이 좋지 않아 자동차번호판 인식에서는 적용할 수 없다. 또한 퍼지 이진화와 제안된 퍼지 이진화의 결과 영상은 자동차 번호를 이진화 하는데 효과적이었다. 제안된 퍼지 이진화는 실험의 결과는 0.
실험한 많은 영상에서 기존 전역 이진화 방법들 보다 객체의 특징을 효과적으로 표현하는 것을 확인할 수 있었다. 또한 기존 퍼지 이진화는 배경과 대상 객체의 밝기값 비율에서 높은 차이를 보일 경우에는 영상을 이진화 하는데 비효율적인 것을 실험을 통해서 확인할 수 있었다.
9사이에서 균일하게 분포하였으며 영상의 이진화 품질은 기존 퍼지 이진화 방법을 적용하였을 경우보다 효과적이었다. 특히 객체와 배경의 특징을 구분하는 단계에서 기존의 이진화들보다 객체의 정보 손실이 매우 적은 것을 확인할 수 있었다. 그러나 조명의 영향이 많이 받는 영상에서는 객체의 명암도 정보가 균일하지 않아 객체의 정보 손실이 발생하였다.
후속연구
따라서 향후 연구 방향은 기존의 이진화 방법들의 장점과 결합하는 방법에 대해서 연구하여 다양한 명암도 분포를 갖는 영상에 대해서도 효과적으로 이진화 할 수 있도록 제안된 퍼지 이진화 방법을 개선할 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
이진화 처리 방법은 어떻게 분류할 수 있는가?
따라서 처리 대상이 되는 객체를 규명하기 위한 아주 중요한 전처리 과정이다. 이진화 처리 방법은 크게 전역 임계치 설정 방법과 지역 임계치 설정 방법으로 분류할 수 있다.
영상에서 이진화란 무엇인가?
영상에서 이진화는 단순히 임계치(threshold)를 기준으로 흑과 백으로 나누어 영상을 객체와 배경으로 구분하는 처리 과정의 영상처리기법이다. 따라서 처리 대상이 되는 객체를 규명하기 위한 아주 중요한 전처리 과정이다.
전역 임계치 설정 방법에는 어떤 것들이 있는가?
전역 임계치 설정 방법은 영상 전체를 하나의 설정된 임계치를 기준으로 모든 픽셀에 적용하는 이진화 방법이다. 전역적 이진화 방법으로는 객체와 배경의 분포 비율에 대한 정보를 기반으로 임계치를 결정하는 P-타일이진화, 히스토그램 상에서 가장 낮은 골짜기를 찾아 임계치로 설정하는 모드 이진화 [1], 영상 전체 명도 값의 평균을 임계치로 설정하는 평균 이진화, 임의의 임계치를 설정하여 두 개의 클래스로 분할해서 계속 반복적으로 두 개의 클래스가 같은 값을 가질 때까지 반복하여 임계치를 구하는 반복(Iterative) 이진화 [2], 영상의 히스토그램에서 통계적인 분석을 통해 배경과 객체를 구분하는 방법으로 객체 클래스와 배경 클래스간의 분산을 최대로 하여 임계치를 설정하는 오쯔(Otsu) 이진화 [3], 엔트로피 이진화 방법 [4] 등이 있다.
참고문헌 (10)
A. Rosenfeld and A.C. Kak, Digital Picture Processing, 2nd ed. Academic Press, 1982.
M. Sonka, V. Hlavac, and R. Boyle, Image Processing Analysis, and Machine Vision, 2nd ed. PWS Publishing, 2014.
N. Otsu, "A threshold selection method from grey-level histogram," IEEE Trans. SMC, vol. 9, no. 1, pp. 62-66, 1979.
J. N. Kapur, P. K. Sahoo, and A. Wong, "A New Method for Gray Lavel Picture using Entropy of the Histogram," Computer Vision, Graphics, and Image Processing, vol. 29, no. 3, pp. 273-285, 1985.
K. B. Kim, "ART2 Based Fuzzy Binarization Method with Low Information Loss," Journal of the Korea Institute of Information and Communication Engineering, vol. 18, no. 6, pp. 1269-1274, Jun. 2014.
B. J Chae, K. B. Kim, "Max-Min Neural Networks using Fuzzy Control Method," Journal of the Korea Institute of Electronic Communication Sciences, vol. 7, no. 1, pp. 95-98 Jun. 2013.
K. B. Kim, "Fuzzy Stretching Method of Color Image," Journal of the Korea Society of Computer and Information, vol. 18, no. 5, May. 2013.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.