[논문]순환 신경망의 구조와 필기체 인식

윤현구; 정동석; 정교민

순환 신경망의 구조와 필기체 인식 원문보기

정보과학회지 = Communications of the Korean Institute of Information Scientists and Engineers, v.33 no.9, 2015년, pp.42 - 48

윤현구 (서울대학교) , 정동석 (서울대학교) , 정교민 (서울대학교)

초록이 없습니다.

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

필기체 인식이 있다. LSTM-RNN구조를 사용하여 필기체 인식의 성능을 획기적으로 향상시킨 Alex Graves의 연구사례를 바탕으로 RN₄이 순차적 입력을 가지는 데이터를 어떻게 처리하는지 알아본다.[16]
지금까지 RNN과 LSTM의 구조와 학습 알고리즘을 살펴보고, 필기체 인식의 연구사례를 통해 시간성을 가지는 데이터를 어떻게 학습시키는지 알아보았다. 요약하자면, RNNe 기존의 neural network 모델에서 시간성을 분명하게 추가한 모델이며, 이에 따라 생기는 recurrent weight들 때문에 Back-Propagation 알고리즘을 바로 적용할 수 없지만, 모델을 time-step에 따라 풀어내는 트릭을 사용한 Back-Propagation Through Time 알고리즘을 적용하여 학습시킨다.
Time-step에 따라 풀어낸 모델은 필연적으로 심층 학습 구조를 가지게 되며 다른 많은 심층 학습 구조와 같이 vanishing gradient problem이 발생하기 때문에 이를 막기 위해 LSTM을 노드의 활성화 함수로 사용한다. 필기체 인식을 통해 알아본 활용 예에서는 Sayre의 딜레마라고 알려진 연속적인 시간성을 가지는 데이터를 합성할 때 나타나는 어려움과 그 해결방법에 대해서 살펴보았다.

가설 설정

흰 노드는 정보 0을 갖고 있으며 검정 노드는 정보 1을 갖고 있는 것을 나타내고 있다. time step 1에서 1의 정보가 입력으로 들어오고 이 정보가 모두 hidden node로 전달되었으며 나머지 time step의 입력으로는 0 이 들어왔다고 가정하자. 必”와 %는 [0, 1] 사이의 값을 가지기 때문에 time step 이 지날수록 hidden layer 의 state 값은 점점 작아지다가 결국 time step 6에서는 state 값이 0에 수렴한다.
<그림 7>은 hidden node에 gate믈이 추가된 형태의 RNW이다. 이 gate들은 gate로 들어오는 정보와 나가는 정보의 양을 결정하는데, gate가 열려있는 'O' 상태는 모든 정보가 들어오거나 나가고, gate가 닫혀있는 '㊀' 상태는 어떤 정보도 들어오거나 나갈 수 없다고 가정한다. 따라서<그림 7>의 time step 1에서 input에 정보 1이 들어오면, hidden 노드 역시 열려있는 gate를 통해서 1의 정보를 가지게 된다.

이론/모형

FFNNe back-propagation 알고리즘을 통한 gradient descent 방법으로 모델 변수들을 학습한다[5]. 하지만 back-propagation 알고리즘은 모델에서 cycle이 존재하지 않다는 것을 가정하기 때문에 RNN에는 적용시킬수 없다.
앞서 언급한 필기체 인식문제에서 나타나는 Sayre 의 딜레마를 해결하기 위해서 Connectionist Temporal Classification(CTC)라고 불리는 기법이 사용되었다[18]. 전통적인 RNW의 목적 함수는 미리 잘 분리된 입력에 대하여 목표로 하는 출력을 내도록 하였다.
알아보았다. 요약하자면, RNNe 기존의 neural network 모델에서 시간성을 분명하게 추가한 모델이며, 이에 따라 생기는 recurrent weight들 때문에 Back-Propagation 알고리즘을 바로 적용할 수 없지만, 모델을 time-step에 따라 풀어내는 트릭을 사용한 Back-Propagation Through Time 알고리즘을 적용하여 학습시킨다. Time-step에 따라 풀어낸 모델은 필연적으로 심층 학습 구조를 가지게 되며 다른 많은 심층 학습 구조와 같이 vanishing gradient problem이 발생하기 때문에 이를 막기 위해 LSTM을 노드의 활성화 함수로 사용한다.

성능/효과

사용할 수 있는 데이터 양의 증가와 GPGPU의 등장과 같은 하드웨어의 성능 발전에 따라 RNNe 음성 인식 및 생성, 필기체 인식 및 생성, 자연어 처리 등 기존의 기계학습 알고리즘이 난항을 겪었던 문제들에서 뛰어난 성능을 보이며 주목받고 있다.
이러한 기법을 사용한 결과과 같이 기존의 HMM 기법보다 월등히 뛰어난 성능을 보이는 것으로 나타났다.

후속연구

꿈과도 맞닿아 있다. 앞으로도 RN应을 이용한 심층학습 기법들은 활발한 연구가 이루어질 것으로 기대된다.

참고문헌 (23)

Bishop, Christopher M. Pattern recognition and machine learning. springer, 2006.
Stam, Cornelis J., and Jaap C. Reijneveld. "Graph theoretical analysis of complex networks in the brain." Nonlinear biomedical physics 1.1 (2007): 3.

상세보기
Siegelmann, Hava T., and Eduardo D. Sontag. "Turing computability with neural nets." Applied Mathematics Letters 4.6 (1991): 77-80.

상세보기
Sutskever, Ilya, Oriol Vinyals, and Quoc VV Le. "Sequence to sequence learning with neural networks." Advances in neural information processing systems. 2014.
Hagan, Martin T., and Mohammad B. Menhaj. "Training feedforward networks with the Marquardt algorithm." Neural Networks, IEEE Transactions on 5.6 (1994): 989-993.

상세보기
Paul J Werbos. Backpropagation through time: what it does and how to do it. Proceedings of the IEEE, 78(10):1550-1560, 1990.

상세보기
Williams, Ronald J., and David Zipser. "A learning algorithm for continually running fully recurrent neural networks." Neural computation 1.2 (1989): 270-280.

상세보기
Nair, Vinod, and Geoffrey E. Hinton. "Rectified linear units improve restricted boltzmann machines." Proceedings of the 27th International Conference on Machine Learning (ICML- 10). 2010.
Bengio, Yoshua, Nicolas Boulanger-Lewandowski, and Razvan Pascanu. "Advances in optimizing recurrent networks." Acoustics, Speech and Signal Processing (ICASSP), 2013 IEEE International Conference on. IEEE, 2013.
Graves, Alex. Supervised sequence labelling with recurrent neural networks. Vol. 385. Heidelberg: Springer, 2012.
Cajal, Santiago Ry, Pedro Pasik, and Tauba Pasik. Texture of the Nervous System of Man and the Vertebrates: I. Vol. 1. Springer Science & Business Media, 1999.
Wikipedia. Rectifier (neural network) - Wikipedia, the free encyclopedia, 2015. [Online; accessed 22-July- 2015]
Hochreiter, Sepp, and Jurgen Schmidhuber. "Long short-tenn memory." Neural computation 9.8 (1997): 1735-1780.

상세보기
Graves, Alan, Abdel-rahman Mohamed, and Geoffrey Hinton. "Speech recognition with deep recurrent neural networks." Acoustics, Speech and Signal Processing (ICASSP), 2013 IEEE International Conference on. IEEE, 2013.
Gers, Felix A., Nicol N. Schraudolph, and Jurgen Schmidhuber. "Learning precise timing with LSTM recurrent networks." The Journal of Machine Learning Research 3 (2003): 115-143.
A. Graves, M. Liwicki, S. Fernandez, R. Bertolanli, H. Bunke, and J. Schmidhuber. "A novel connectionst system for unconstrained handwriting recognition", IEEE Transactions on Pattern Analysis and Machine Intelligence, Volume 31 Issue 5, May 2009 pp. 855-868.

상세보기
Kenneth M. Sayre, "Machine Recognition of Handwritten Words: A Project Report, " Pattern Recognition, Pergamon Press, Vol. 5, 1973, pp. 213-228.

상세보기
A. Graves, S. Fernandez, F. Gomez, I. Schmidhuber. "Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks", ICML 2006, Pittsburgh, USA, pp. 369-376.
Zaremba, Wojciech, and Ilya Sutskever. "Learning to execute." arXiv preprint arXiv:1410.4615 (2014).
Chung, Junyoung, et al. "Empirical evaluation of gated recurrent neural networks on sequence modeling." arXiv preprint arXiv:1412.3555 (2014).
Junyoung Chung, Caglar Gulcehre, Kyunghyun Cho, Yoshua Bengio "Gated Feedback Recurrent Neural Networks", ICML2015, Lille, France, pp. 2067 - 2075.
https://en.wikipedia.org/wiki/Sigmoid_function
http://www.cs.toronto.edu/-graves/handwriting.html

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

순환 신경망의 구조와 필기체 인식 원문보기

AI 본문요약
AI-Helper

문제 정의

가설 설정

이론/모형

성능/효과

후속연구

참고문헌 (23)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

순환 신경망의 구조와 필기체 인식 원문보기

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

가설 설정

이론/모형

성능/효과

후속연구

참고문헌 (23)

이 논문을 인용한 문헌

저자의 다른 논문 :

정교민 (5)

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

AI 본문요약
AI-Helper