$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

수화 패턴 인식을 위한 2단계 신경망 모델
Two-Stage Neural Networks for Sign Language Pattern Recognition 원문보기

한국지능시스템학회 논문지 = Journal of Korean institute of intelligent systems, v.22 no.3, 2012년, pp.319 - 327  

김호준 (한동대학교 전산전자공학부)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 착용식 추적장치나 표식 등의 보조 도구를 사용하지 않는 환경의 동영상 데이터로부터 수화 패턴을 인식하는 방법론에 관하여 고찰한다. 시스템 설계 및 구현에 관한 주제로서 특징점의 추출기법, 특징데이터의 표현기법 및 패턴 분류기법에 관한 방법론을 제시하고 그 유용성을 고찰한다. 일련의 동영상으로 표현되는 수화패턴에 대하여 특징점의 공간적 위치에 대한 변이 뿐만 아니라 시간차원의 변화를 고려한 특징데이터의 표현방법을 제시하며, 방대한 데이터에 의한 분류기의 크기 문제와 계산량의 문제를 개선하기 위하여 효과적으로 특징수를 줄일 수 있는 특징추출 방법을 소개한다. 패턴 분류과정에서 점진적 학습(incremental learning)이 가능한 신경망 모델을 제시하고 그 동작특성 및 학습효과를 분석한다. 또한 학습된 분류모델로부터 특징과 패턴 클래스 간의 상대적 연관성 척도를 정의하고, 이로부터 효과적인 특징을 선별하여 성능저하 없이 분류기의 규모를 최적화 할 수 있음을 보인다. 제안된 내용에 대하여 여섯 가지 수화패턴을 대상으로 적용한 실험을 통하여 유용성을 평가한다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we present a sign language recognition model which does not use any wearable devices for object tracking. The system design issues and implementation issues such as data representation, feature extraction and pattern classification methods are discussed. The proposed data representati...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 두 번째로 특징데이터의 양을 감소시키며, 특징점의 공간적 변이 및 시간적 변이를 보완하는 특징지도 생성기법에 관한 연구이다. 기존의 CNN(Convolutional Neural Network) 모델에서 적용되었던 2차원 구조의 수용영역(receptive filed)을 3차원으로 확장함으로써 특징점의 공간적 변화뿐만 아니라 시간적 변이를 수용할 수 있도록 한다.
  • 이에 본 연구에서는 영상에서 특징점에 대한 시간차원 변이를 효과적으로 해결하기 위하여 특징 표현기법 및 추출 기법을 제시한다. 또한 이를 기반으로 특징분석 및 추가학습(incremental learning)을 가능하게 하는 패턴 분류 모델을 고찰한다. 본 연구에서는 그림 1에 보인 바와 같이 3개의 모듈로 이루어진 인식시스템을 고려한다.
  • 또한 시간에 따라 변하는 영역에 대한 위치정보를 효과적으로 표현하는 방법이 요구된다. 본 연구에서는 3차원 볼륨구조로서 시간차원을 고려한 움직임정보를 표현한다.
  • 본 연구에서는 영상에서 수화 패턴 인식을 위한 2단계 구조의 복합형 신경망을 이용하는 방법을 고찰하였다. 3차원 볼륨 형식으로 표현되는 데이터표현으로부터 CNN 모델을 사용한 특징추출 방법은 데이터의 양을 줄일 수 있게 할 뿐만 아니라 특징점의 위치 및 시간 변이에 강인한 인식 기능을 제공한다.
  • 상위 계층으로 갈수록 점진적으로 대상영역이 확장되는 형태의 특징지도를 생성하며 이 과정에서 수용영역(receptive field)의 연결구조를 통하여 특징점의 위치이동에 강인한 추출기능을 제공한다. 본 연구에서는 입력데이터의 형태를 3차원정보로 구성하며 이를 입력 신호로 적용할 수 있도록 변형된 구조의 CNN모델을 제시한다. 아래 그림은 변형된 CNN모델의 구조 및 동작 특성을 보인다.
  • 본 절에서는 제안된 신경망으로부터 특정 패턴 클래스에 대한 각 특징의 상호 연관성 요소를 판별하는 방법을 소개한다. 패턴 분류 응용의 측면에서 볼 때, 이는 두 가지 점에서 유용한 기법이라 할 수 있다.
  • 세 번째로 점진적 학습(incremental learning)이 가능한 패턴분류 신경망과 특징의 연관도 요소를 분석하는 특징 선별 기법에 관한 연구이다. 하이퍼박스 기반의 분류 모델로부터 수정된 활성화 특성을 정의하고 이를 적용하는 학습방법론을 고찰한다.
  • 패턴 분류 응용의 측면에서 볼 때, 이는 두 가지 점에서 유용한 기법이라 할 수 있다. 우선 주어진 문제에서 어떤 특징 종류가 전체적인 분류 과정에 효과적으로 활용될 수 있는가 하는 정보를 제공한다. 두 번째로 어떤 특징값이 특정 클래스에 가장 중요한 값으로 연관되어 있는가를 판별할 수 있다는 점이다.
  • 그러나 이러한 시스템은 환경과 여건에 제약적이라는 점이 지적되어 왔으며, 최근 유비쿼터스 시스템 등에서 요구하는 진보된 기능을 위하여 순수 동영상에서 인간의 행동패턴을 그대로 이해하는 기술에 대한 연구가 부각되고 있다[2-6]. 이에 본 연구에서는 보조장치나 도구를 사용하지 않은 순수 동영상 데이터로부터 수화 패턴을 인식하는 문제를 고찰한다. 세부적인 연구 주제로서 특징표현의 방법론, 목표물 추출 기법, 학습 및 인식 기법에 대한 모델을 제시하고 유용성을 분석하였다.
  • 이와 같이 수화패턴이나 동적 수신호 인식 문제에서 신경망 기법을 적용하려는 연구가 활발하게 이루어지는 이유는 주어진 문제에서 제한된 양의 규칙을 기반으로 하는 추론기법이나, 통계적 방법론만으로 해결하기에는 영상에서 나타나는 변이의 형태가 매우 광범위하기 때문이다. 이에 본 연구에서는 영상에서 특징점에 대한 시간차원 변이를 효과적으로 해결하기 위하여 특징 표현기법 및 추출 기법을 제시한다. 또한 이를 기반으로 특징분석 및 추가학습(incremental learning)을 가능하게 하는 패턴 분류 모델을 고찰한다.
  • 첫 번째로 수화패턴의 동적 특성을 반영하는 특징데이터 표현기법에 관한 연구이다. 일련의 동영상으로부터 획득된 수화패턴의 표현은 손과 팔의 영역을 추출하고 움직임을 분석하기 위하여 색상 및 모션 정보를 효과적으로 반영하는 형태여야 한다.
  • 하이퍼박스 기반의 분류 모델로부터 수정된 활성화 특성을 정의하고 이를 적용하는 학습방법론을 고찰한다. 특히 학습된 신경망으로부터 특징데이터의 연관도를 분석하여 보다 효과적인 특징을 선별할 수 있게 함으로써 성능저하 없이 분류기를 최적화 할 수 있는 방법론을 고찰한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
수화 인식 시스템의 핵심기술은 어떤 방법론인가? 수화 인식 시스템의 핵심기술은 수신호 인식이나 제스쳐 인식 등과 같이 영상에서 신호패턴의 동적 특성을 고려하는 패턴인식 방법론이라 할 수 있다. 세부적으로는 영상으로부터 목표물에 대한 분할 기법, 특징의 표현 기법 및 추출 기법, 패턴의 정의 및 분류 기법 등의 기술을 포함한다[7-11].
CNN 모델은 어떤 신경망 모델인가? CNN 모델은 C-계층(Convolutional Layer) 과 S-계층(Subsampling Layer)이 다층구조로 연결된 신경망이다[12]. 상위 계층으로 갈수록 점진적으로 대상영역이 확장되는 형태의 특징지도를 생성하며 이 과정에서 수용영역(receptive field)의 연결구조를 통하여 특징점의 위치이동에 강인한 추출기능을 제공한다.
착용식 추적장치나 표식 기반의 보조 장치를 사용하는 이유는 무엇인가? 컴퓨터를 사용한 수화패턴 자동인식 시스템에서 많은 경우 효과적인 특징추출을 위하여 착용식 추적장치나 표식 기반의 보조 장치를 사용하여 왔다. 이는 영상신호로 표현되는 수화패턴 데이터가 매우 복잡한 형태의 변이를 포함하여 특징의 형태표현이나 추출과정이 매우 어렵기 때문이다[1]. 그러나 이러한 시스템은 환경과 여건에 제약적이라는 점이 지적되어 왔으며, 최근 유비쿼터스 시스템 등에서 요구하는 진보된 기능을 위하여 순수 동영상에서 인간의 행동패턴을 그대로 이해하는 기술에 대한 연구가 부각되고 있다[2-6].
질의응답 정보가 도움이 되었나요?

참고문헌 (13)

  1. Sylvie C.W. Ong and Surendra Ranganath, "Automatic Sign Language Analysis: A Survey and Future beyond Lexical Meaning," IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol. 27, No.6, pp.873-891, 2005 

  2. Mahmoud M. Zaki and Samir I. Shaheen, "Sign Language Recognition using a Combination of New Vision Based Features," Pattern Recognition Letters, Vol.32, No.4, pp.572-577, 2011 

  3. Ruiduo Yang, Sudeep Sarkar, "Coupled Grouping and Matching for Sign and Gesture Recognition," Computer Vision and Image Understanding Vol.113, pp.663-581, 2009. 

  4. Chia-Feng Juang, Shih-Hsuan Chiu, and Shen-Jie Shiu, "Fuzzy System Learned Through Fuzzy Clustering and Support Vector Machine for Human Skin Color Segmentation," IEEE Transaction on System, Man, and Cybernetics-Part A: Systems and Humans. Vol.37, No.6, pp.1077-1087, 2007. 

  5. Chia-Feng Juang and Ksuan-Chun Ku, "A Recurrent Fuzzy Network for Fuzzy Temporal Sequence Processing and Gesture Recognition," IEEE Transaction on Systems, Man, and Cybernetics, Part B: Cybernetics, Vol.35, No.4, pp.646-658, 2005. 

  6. Ming-Hsuan Yang, Narendra Ahuja, and Mark Tabb, "Extraction of 2D Motion Trajectories and Its Application to Hand Gesture Recognition," IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol.24, No.8, pp.1061-1074, 2002. 

  7. Cen Rao, Alper Yilmaz and Mubarak Shah, " View-Invariant Representation and Recognition of Actions." International Journal of Computer Vision, Vol.50, No.2, pp.203-226, 2002. 

  8. Hung-Ming Sun, "Skin Detection for Single Images using Dynamic Skin Color Modeling," Pattern Recognition, Vol.43, pp.1413-1420, 2010. 

  9. Anas Wuteishat, Chee Peng Lim, and Kay Sin Tan, "A Modified Fuzzy Min-Max Neural Network With A Genetic-Algorithm-Based Rule Extractor for Pattern Classification," IEEE Transaction on System, Man, and Cybernetics-Part A: Systems and Humans. Vol.40, No.3, pp.641-650, 2010. 

  10. Patrick K. Simpson, "Fuzzy Min-Max Neural Network- Part1 : Classification." IEEE Transaction on Neural Network, Vol.3, No.5, pp.776-786, 1992. 

  11. B. Gabrys, A. Bargiela,"General Fuzzy Min-Max Neural Network for Clustering and Classification," IEEE Transaction on Neural Networks, Vo.11, No.3, pp.769-783, 2000. 

  12. Cristophe Garcia, Manolis Delakis: Convolutional Face Finder: A Neural Architecture for Fast and Robust Face Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.26, No.11, 1408-1423, 2004 

  13. Ho-Joon Kim, Juho Lee, Hyun-Seung Yang, "A Weighted FMM Network and Its Application to Face Detection," Lecture Notes in Computer Science, Vol. 4233. pp. 177-186, 2006. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로