필기체 숫자는 개인에 따라 필체가 매우 다양하므로 단일 특징과 단일 분류기를 사용하여 오프라인 필기체 숫자인식을 수행할 경우 높은 인식률을 얻기가 어렵다. 이에 본 논문에서는 복합 특징과 결합 인식기를 사용하여 필기체 숫자 인식의 인식률을 향상시키는 방안을 제시한다. 인식률의 향상을 위해, 먼저 상호 보완적인 특징들-방향특징, 교차점특징, 망특징-을 선정하고 이를 사용하여 숫자영상의 전역적 및 국부적 특징을 갖는 세 종류의 새로운 복합 특징을 구성한다. 그리고 패턴 인식기로는 세 개의 신경회로망 분류기를 퍼지 적분으로 결합한 결합 인식기를 사용한다. 본 인식기의 성능 평가를 위해 Concordia 대차의 무제약 필기체 숫자 데이터베이스를 사용하여 실험한 결과 97.85%의 인식률을 달성하였다.
필기체 숫자는 개인에 따라 필체가 매우 다양하므로 단일 특징과 단일 분류기를 사용하여 오프라인 필기체 숫자인식을 수행할 경우 높은 인식률을 얻기가 어렵다. 이에 본 논문에서는 복합 특징과 결합 인식기를 사용하여 필기체 숫자 인식의 인식률을 향상시키는 방안을 제시한다. 인식률의 향상을 위해, 먼저 상호 보완적인 특징들-방향특징, 교차점특징, 망특징-을 선정하고 이를 사용하여 숫자영상의 전역적 및 국부적 특징을 갖는 세 종류의 새로운 복합 특징을 구성한다. 그리고 패턴 인식기로는 세 개의 신경회로망 분류기를 퍼지 적분으로 결합한 결합 인식기를 사용한다. 본 인식기의 성능 평가를 위해 Concordia 대차의 무제약 필기체 숫자 데이터베이스를 사용하여 실험한 결과 97.85%의 인식률을 달성하였다.
Off-line handwritten numeral recognition is a very difficult task and hard to achieve high recognition results using a single feature and a single classifier, since handwritten numerals contain many pattern variations which mostly depend upon individual writing styles. In this paper, we propose han...
Off-line handwritten numeral recognition is a very difficult task and hard to achieve high recognition results using a single feature and a single classifier, since handwritten numerals contain many pattern variations which mostly depend upon individual writing styles. In this paper, we propose handwritten numeral recognition system using hybrid features and combined classifier. To improve recognition rate, we select mutually helpful features -directional features, crossing point feature and mesh features- and make throe new hybrid feature sets by using these features. These hybrid feature sets hold the local and global characteristics of input numeral images. And we implement combined classifier by combining three neural network classifiers to achieve high recognition rate, where fuzzy integral is used for multiple network fusion. In order to verify the performance of the proposed recognition system, experiments with the unconstrained handwritten numeral database of Concordia University, Canada were performed. As a result, our method has produced 97.85% of the recognition rate.
Off-line handwritten numeral recognition is a very difficult task and hard to achieve high recognition results using a single feature and a single classifier, since handwritten numerals contain many pattern variations which mostly depend upon individual writing styles. In this paper, we propose handwritten numeral recognition system using hybrid features and combined classifier. To improve recognition rate, we select mutually helpful features -directional features, crossing point feature and mesh features- and make throe new hybrid feature sets by using these features. These hybrid feature sets hold the local and global characteristics of input numeral images. And we implement combined classifier by combining three neural network classifiers to achieve high recognition rate, where fuzzy integral is used for multiple network fusion. In order to verify the performance of the proposed recognition system, experiments with the unconstrained handwritten numeral database of Concordia University, Canada were performed. As a result, our method has produced 97.85% of the recognition rate.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 복합 특징과 결합 인식기를 이용하여 오프라인 필기체 숫자의 인식률을 향상시키는 방안을 제시한다. 본 연구에서는 숫자의 특징으로서 기존에 좋은 인식률을 보인 숫자 선분의 방향 특징(directional feature)과 그 외에 교차점 특징(crossing point feature) 및 망특징(mesh feature)를 선정하고 이들이 상호 보완적으로 작용하도록 3개의 복합특징으로 재구성하여 사용하였다.
본 논문에서는 오프라인 필기체 숫자인식을 위해 복합특징과 결합인식기를 이용하는 기법을 제안하였다. 숫자의 특징으로는 숫자의 국부적 특징정보를 효과적으로 제공하는 방향특징과 전역특징을 제공하는 망특징 그리고 구조적 특징을 제공하는 교차점 특징을 선정하고, 상호 보완적인 특성을 나타내는 이들 각 특징들을 결합함으로써 3개의 복합특징을 새로이 구성하여 사용하였다.
제안 방법
본 연구에서는 숫자의 특징으로서 기존에 좋은 인식률을 보인 숫자 선분의 방향 특징(directional feature)과 그 외에 교차점 특징(crossing point feature) 및 망특징(mesh feature)를 선정하고 이들이 상호 보완적으로 작용하도록 3개의 복합특징으로 재구성하여 사용하였다. 그리고 인식기로는 3개의 다층퍼셉트론 신경회로망 부인식기로 구성된 결합인식기를 설계하여 사용하였다. 이때 각 부인식기의 입력은 이종의 복합특징이며, 각 부인식기 출력들의 융합 방법으로서 퍼지 적분(fuzzy integral)을 도입하여 최종 인식 결과를 얻었다.
이때, 정규화 방법은 2차 보간을 이용한 축소 및 확대방법을 사용하며, kirsch연산 수행시 임계값으로는 10을 사용하였다. 그후 구해진 [16×16] 크기인 4개 방향의 에지영상을 [4×4] 크기로 다시 정규화하여 방향특징으로 사용하는데, 이 정규화시 화소값을 결정하는 방법으로는 각각의 [4×4]부영역 내의 화소값을 합산한 값을 사용하였다. 한편 전역특징은 숫자영상의 크기를 축소하여 숫자의 전체 형상 정보를 특징으로 사용하는 것으로서, 이 특징은 숫자영상을 [16×16]크기로 정규화한 후 이치영상으로 만들고 이를 다시 [4×4] 크기로 정규화하여 만든다.
본 연구에서는 이 방향특징을 다음의 과정에 의해 생성하였다. 먼저 숫자영상을 [16×16] 크기로 정규화한 후 이치영상으로 만들고, 이에 kirsch연산을 적용하여 4개 방향의 에지영상을 각각 생성한다. 이때, 정규화 방법은 2차 보간을 이용한 축소 및 확대방법을 사용하며, kirsch연산 수행시 임계값으로는 10을 사용하였다.
본 연구에서는 교차점 특징을 다음의 방법으로 구하였다. 먼저 숫자영상을 [20×20] 크기로 정규화한 후 이치영상으로 만들고, 이 영상에서 수평 및 수직축 각각에 대해 10개씩, 총 20개의 교차점 특징들을 구한다. 따라서, 하나의 숫자영상에 대해, 한 개의 20-차원인 교차점 특징벡터가 얻어진다.
본 연구에서는 각 숫자의 특징을 추출하기에 앞서 입력 영상에 다음의 전처리를 하였다. 먼저 이치화된 입력 영상에서 수평 및 수직방향의 투영(projection)을 사용하여 숫자부분만을 분할함으로써 숫자 영상을 생성한다. 그후 메디안 필터링을 수행하여 숫자를 이루는 선의 내부에 존재하는 작은 구멍을 메운다.
먼저, 제안된 결합인식기의 부인식기 각각에 대한 인식률 실험을 하였다. 이 실험은 단일인식기를 사용할 경우에 본 논문에서 제시한 각 복합특징이 나타내는 인식률을 알려주며, 또한 이 실험결과로 얻어지는 각 부인식기의 평균 인식률은 차후에 각 부인식기의 출력을 융합하는데 사용되는 퍼지적분의 연산에서 퍼지측도의 계산시 필요한 평가측도gi의 결정에 사용될 수 있다.
는 신경회로망의 두 번째로 큰 출력값을 나타낸다. 본 실험에서는 RC < 0.2 조건이 만족되면 인식을 거부하였다. 그리고 인식결과의 신뢰도(reliability)는 식 (8)로 계산하였다.
본 실험에서는 다음 3종류의 복합 특징들 각각을 걸합인식기내의 부인식기의 입력으로 사용하였다.
본 연구에서 채택한 특징은 3종으로서 숫자 선분의 방향 특징(directional feature)과 교차점 특징(crossing point feature) 및 망특징(mesh feature)를 선정하여 사용하였다.
본 논문에서는 복합 특징과 결합 인식기를 이용하여 오프라인 필기체 숫자의 인식률을 향상시키는 방안을 제시한다. 본 연구에서는 숫자의 특징으로서 기존에 좋은 인식률을 보인 숫자 선분의 방향 특징(directional feature)과 그 외에 교차점 특징(crossing point feature) 및 망특징(mesh feature)를 선정하고 이들이 상호 보완적으로 작용하도록 3개의 복합특징으로 재구성하여 사용하였다. 그리고 인식기로는 3개의 다층퍼셉트론 신경회로망 부인식기로 구성된 결합인식기를 설계하여 사용하였다.
본 연구에서는 숫자인식을 위한 인식기로서 3개의 부인식기를 결합한 결합인식기를 사용한다. 이때, 3개의 부인식기는 동일한 종류로서 다층퍼셉트론 신경회로망을 사용하며, 이들 부인식기들의 출력의 합성 방법으로는 퍼지적분(Fuzzy Integral) 사용한다.
퍼지적분의 성능은 이 평가측도에 크게 의존하기 때문에 이의 결정은 매우 중요하다. 본 연구에서는 이를 각부인식기의 자체 인식율을 사용하여 정하였다.
즉, 이들 각각의 특징들을 상호 보완적인 특성을 가지므로 이들을 결합하여 사용하면 인식률의 향상에 기여할 수 있을 것이다. 본 연구에서는 인식률의 향상을 위해, 상기의 3가지 특징들을 결합하여 다음과 같은 3종류의 복합 특징을 구성하여 사용하였다. 이 복합 특징들 각각은 차후에 결합인식기내의 부인식기의 입력으로 사용된다.
본 논문에서는 오프라인 필기체 숫자인식을 위해 복합특징과 결합인식기를 이용하는 기법을 제안하였다. 숫자의 특징으로는 숫자의 국부적 특징정보를 효과적으로 제공하는 방향특징과 전역특징을 제공하는 망특징 그리고 구조적 특징을 제공하는 교차점 특징을 선정하고, 상호 보완적인 특성을 나타내는 이들 각 특징들을 결합함으로써 3개의 복합특징을 새로이 구성하여 사용하였다. 인식기로는 제한적 인식성능을 나타내는 단일인식기 대신에 3개의 신경회로망 부인식기로 구싱되는 결합인식기를 사용하여 인식률 향상을 도모하였으며, 이때 결합인식기에서 각 부인식기 출력들의 융합방법으로서 퍼지적분을 이용하는 방안을 제시하였다.
퍼지적분에서 사용되는 λ-퍼지측도 g는 기본 평가측도 gi에 의해 결정된다. 이 gi는 최종 평가를 위한 기초 평가항목 xi의 상대적인 기여도로 해석될 수 있으므로, 본 실험에서는 각 부인식기의 평균 인식률을 근거로 하여 각각의 gi를 g1=0.31, g2=0.32, g3=0.33으로 결정하여 사용하였다. 이 표에서 보듯이 제안된 결합 인식기를 사용함으로써 97.
그후 숫자영상을 크기-정규화하여 숫자패턴 영상을 일정한 크기로 만든다. 이 크기-정규화를 위해서는 2차 보간을 이용한 영상의 축소 및 확대 방법을 사용하였다. 그후 동일한 크기로 얻어진 숫자영상을 임계화하여 이치영상으로 만듬으로써 전처리를 완료한다.
세 번째 특징은 망특징(mesh feature)이다. 이는 숫자영상의 크기를 단순히 죽소하여 숫자의 전체 형상을 특징으로 사용하는 것으로서, 본 연구에서는 [20×20] 크기의 이치화된 숫자영상을 [10×10] 크기로 정규화하여 특징영상을 만들고 이를 망특징으로 사용한다. 이때 정규화시 화소값을 결정하는 방법으로는 각각의 [2×2]부영역내의 화소값을 합산한 값을 사용하였다.
그리고 인식기로는 3개의 다층퍼셉트론 신경회로망 부인식기로 구성된 결합인식기를 설계하여 사용하였다. 이때 각 부인식기의 입력은 이종의 복합특징이며, 각 부인식기 출력들의 융합 방법으로서 퍼지 적분(fuzzy integral)을 도입하여 최종 인식 결과를 얻었다. 제안된 기법의 성능 테스트를 위해 캐나다 Concordia 대학의 필기체 숫자 데이터베이스를 사용하여 실험하였으며, 실험 결과97.
표 1은 복합특징 1을 사용하여 실험한 신경회로망 부인식기의 인식률 결과를 보인다. 이때, 신경회로망 부인식기의 입력값을 위해 특징값을 구간 [0,1]사이의 값으로 정규화하기 위해 4개의 directional feature에 대해서는 특징값을 10으로 나누어 사용하였고, 1개의 global feature에 대해서는 특징값을 12로 나누어 사용하였다. 학습시에 나타난 학습 에러율은 0.
숫자의 특징으로는 숫자의 국부적 특징정보를 효과적으로 제공하는 방향특징과 전역특징을 제공하는 망특징 그리고 구조적 특징을 제공하는 교차점 특징을 선정하고, 상호 보완적인 특성을 나타내는 이들 각 특징들을 결합함으로써 3개의 복합특징을 새로이 구성하여 사용하였다. 인식기로는 제한적 인식성능을 나타내는 단일인식기 대신에 3개의 신경회로망 부인식기로 구싱되는 결합인식기를 사용하여 인식률 향상을 도모하였으며, 이때 결합인식기에서 각 부인식기 출력들의 융합방법으로서 퍼지적분을 이용하는 방안을 제시하였다. 캐나다 Concordia 대학의 필기체 숫자 데이터베이스를 사용하여 실험한 결과 제안된 기법에 의해 97.
대상 데이터
즉, 모든 입력값은 [0, 1]로 정규화하여 사용하였으며, 입력노드수는 해당 복합특징의 요소 개수로 하였다. 1개의 은닉층을 사용하였고, 은닉층의 노드수는 입력 노드수의 80%를 취하였다. 출력노드수는 숫자 '0'~'9' 에 대응하여 10개이다.
제안된 기법의 성능 테스트를 위해 PentiumⅡ 400 PC에서 C언어를 사용하여 실험하였다. 실험에 사용한 숫자 데이터는 캐나다 Concordia 대학의 필기체 숫자 데이터베이스로서, 그림 4는 이 데이터베이스내의 숫자들 일부를 보인다.
7의 관성율을 사용하였다. 실험용 데이터로는 캐나다 Concordia 대학의 필기체 숫자 데이터베이스를 사용하였으며, 총 2,000개의 숫자 데이터를 신경회로망의 학습에 사용하였고, 학습에 사용되지 않은 2,000개의 숫자 데이터를 사용하여 테스트를 수행함으로써 본 인식기의 인식률을 검사하였다. 또한, 인식시스템의 부인식기인 각 신경회로망에서 사용한 인식거부 기준(RC, rejection criteria)으로는 식 (7)을 사용하였다.
제안된 기법의 성능 테스트를 위해 PentiumⅡ 400 PC에서 C언어를 사용하여 실험하였다. 실험에 사용한 숫자 데이터는 캐나다 Concordia 대학의 필기체 숫자 데이터베이스로서, 그림 4는 이 데이터베이스내의 숫자들 일부를 보인다.
성능/효과
여기서, 숫자영상의 경우 한 스캔라인당 발생할 수 있는 교차점의 최대 개수는 수평 스캔라인의 경우 한 라인당 2개이고, 수직 스캔라인의 경우 한 라인당 4개이다. 본 방법과 같이 한 개의 교차점 특징을 구하기 위해 두개의 인접한 스캔라인을 사용하면, 특징벡터의 차수를 감소시킬 수 있으며, 또한 숫자의 미소한 형태변화에 의해 발생할 수 있는 오차의 범위를 줄일 수 있는 장점이 있다. 그림 2는 교차점 특징을 계산하는 예를 보인다.
85%의 필기체 숫자 인식률을 달성하였다. 본 실험의 결과 결합인식기를 사용함으로써 단일 인식기의 경우보다 우수한 인식률을 얻을 수 있었으며, 각 부인식기 출력의 융합 방법으로서 퍼지적분이 효과적으로 사용될 수 있음을 확인하였다.
85%의 인식률을 달성하였다. 본 연구의 결과 결합인식기를 사용함으로써 단일 인식기의 경우보다 우수한 인식률을 얻을 수 있었으며, 각 부인식기 출력의 합성 방법으로서 퍼지적분이 효과적 임을 알 수 있었다.
33으로 결정하여 사용하였다. 이 표에서 보듯이 제안된 결합 인식기를 사용함으로써 97.85%의 필기체 숫자 인식률을 달성하였다. 본 실험의 결과 결합인식기를 사용함으로써 단일 인식기의 경우보다 우수한 인식률을 얻을 수 있었으며, 각 부인식기 출력의 융합 방법으로서 퍼지적분이 효과적으로 사용될 수 있음을 확인하였다.
이때 각 부인식기의 입력은 이종의 복합특징이며, 각 부인식기 출력들의 융합 방법으로서 퍼지 적분(fuzzy integral)을 도입하여 최종 인식 결과를 얻었다. 제안된 기법의 성능 테스트를 위해 캐나다 Concordia 대학의 필기체 숫자 데이터베이스를 사용하여 실험하였으며, 실험 결과97.85%의 인식률을 얻을 수 있었다.
인식기로는 제한적 인식성능을 나타내는 단일인식기 대신에 3개의 신경회로망 부인식기로 구싱되는 결합인식기를 사용하여 인식률 향상을 도모하였으며, 이때 결합인식기에서 각 부인식기 출력들의 융합방법으로서 퍼지적분을 이용하는 방안을 제시하였다. 캐나다 Concordia 대학의 필기체 숫자 데이터베이스를 사용하여 실험한 결과 제안된 기법에 의해 97.85%의 인식률을 달성하였다. 본 연구의 결과 결합인식기를 사용함으로써 단일 인식기의 경우보다 우수한 인식률을 얻을 수 있었으며, 각 부인식기 출력의 합성 방법으로서 퍼지적분이 효과적 임을 알 수 있었다.
후속연구
먼저, 제안된 결합인식기의 부인식기 각각에 대한 인식률 실험을 하였다. 이 실험은 단일인식기를 사용할 경우에 본 논문에서 제시한 각 복합특징이 나타내는 인식률을 알려주며, 또한 이 실험결과로 얻어지는 각 부인식기의 평균 인식률은 차후에 각 부인식기의 출력을 융합하는데 사용되는 퍼지적분의 연산에서 퍼지측도의 계산시 필요한 평가측도gi의 결정에 사용될 수 있다.
마지막 특징인 망특징(mesh feature)은 숫자의 전역적인 형태 정보를 제공하나, 국부적인 특성의 표현이 취약하다. 즉, 이들 각각의 특징들을 상호 보완적인 특성을 가지므로 이들을 결합하여 사용하면 인식률의 향상에 기여할 수 있을 것이다. 본 연구에서는 인식률의 향상을 위해, 상기의 3가지 특징들을 결합하여 다음과 같은 3종류의 복합 특징을 구성하여 사용하였다.
따라서 숫자의 특성을 잘 나타내는 효과적인 특징추출 기법의 선정 및 새로운 기법에 대한 연구는 매우 중요하다고 생각된다. 현재 제안된 인식 시스템의 성능향상을 위해서 숫자의 국부적인 방향특징을 보다 효율적으로 추출하는 새로운 특징추출 기법의 인구를 수행중이며, 결합인식기내의 부인식기 출력들을 융합하는 퍼지적분에서 있어서 기본 평가측도를 효과적으로 결정하는 방법의 추가 연구도 필요하다고 생각된다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.