$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

다층퍼셉트론의 출력 노드 수 증가에 의한 성능 향상
Performance Improvement of Multilayer Perceptrons with Increased Output Nodes 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.9 no.1, 2009년, pp.123 - 130  

오상훈 (목원대학교 정보통신공학과)

초록
AI-Helper 아이콘AI-Helper

일반적으로 다층퍼셉트론패턴인식 문제에 적용할 경우 클래스 당 하나의 출력 노드를 배정하고, 이 출력 노드의 인덱스가 입력 패턴의 클래스를 뜻하도록 한다. 이 논문에서는 이와 달리 다층퍼셉트론의 성능 향상을 위하여 클래스 당 출력노드 수를 증가시키는 방법을 제안한다. 두 개의 클래스 문제를 대상으로 클래스 발생확률이 동일하고 각 클래스 내에서 출력노드가 균일분포를 지닌다는 가정 하에, 이 방법의 효용성을 확률론적인 유도를 통하여 증명하였다. 그리고, 50개의 고립단어 인식의 시뮬레이션으로 출력노드를 증가 시킬 경우 성능이 향상됨을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

When we apply MLPs(multilayer perceptrons) to pattern classification problems, we generally allocate one output node for each class and the index of output node denotes a class. On the contrary, in this paper, we propose to increase the number of output nodes per each class for performance improveme...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이 논문에서는 이러한 접근들과 달리 MLP의 성능을 향상시키기 위하여 출력노드 수를 증가시키는 새로운 방법을 제안한다. 일반적으로, 패턴인식 문제에서 클래스 당 하나의 출력노드가 할당되고, 임의의 입력패턴이 주어지면 MLP의 출력 값을 계산한 후 최대의 출력 값을 지닌 출력노드의 인덱스가 입력 패턴이 속한 클래스를 나타내는 Max.
  • 이 논문에서는 패턴인식 문제에 MLP를 적용시킬 경우에 성능을 향상시키는 방법으로 클래스 당 출력 노드 수를 증가시키는 것을 제안하였다. 이 방법의 효용성을, 클래스 발생 확률이 동일하며 출력노드는 각 클래스 내에서 균일분포를 가진다는 가정 하에, 확률론적으로 분석하여 증명하였다.
  • 이 경우는 최종 판단을 내리기 위한 별도의 네트웤이 구축되고 학습되어야 한다. 이와 달리, 여기서 제안하는 방법은 클래스 당 출력노드 수를 증가시키고 학습에 의해 여러 출력들이 스스로 융합하는 효과가 있는 것을 보이고자 한다.
  • 이제 역방향 계산량을 비교해보겠다. N-H-M로 구성된 MLP는 n=4인 경우 (10)의 계산에 2M만큼의 곱하기 연산이 필요하며, 이를 사용한 (6)의 계산에 2M(H+1)만큼의 곱하기가 수행된다.

가설 설정

  • 즉, 기존 방법인 클래스 당 출력노드가 하나인 경우보다 클래스 당 출력노드 수를 증가시킨 경우에 좋은 성능을 얻지 못하였다. III장에서 수학적으로 유도한 모델은 각 클래스가 발생할 확률이 동일하며 출력노드는 각 클래스 내에서 균일분포를 가진다고 가정하였다. 그렇지만, CEDAR 데이터 베이스에 구축된 필기체 숫자인식 문제의 경우, 각 클래스는 발생 확률이 다르기 때문에 이러한 가정에 부합하지 않아서 성능이 향상되지 않은 것으로 여겨진다.
  • 이 경우 출력노드의 목표값은 입력이 클래스 1에 속하면 -1로 주어지고 클래스 2에 속하면 +1로 주어졌다고 하자. 또한, 각 클래스에 속하는 입력패턴에 대하여 MLP의 출력노드는 균일분포를 가진다고 가정하자.
  • 와 같이 균일 분포(uniform distribution)을 가진다고 가정한다. 여기서, #은 음이고 #는 양이라고 가정한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
출력노드 수를 증가시킨다고 성능이 지속적으로 좋아지지는 않은 이유는 무엇인가? 그렇지만, 출력노드 수를 증가시킨다고 성능이 지속적으로 좋아지지는 않았다. 그 이유는 이론적 유도에서 세운 가정-출력노드가 클래스 내에서 균일분포를 지닌다-이 성립되지 않기 때문으로 추정된다.
MLP의 학습은 어떤 알고리즘을 따르는가? 그렇지만, MLP의 학습은 MSE(mean-squared error)를 최소화 시키는 EBP(error back-propagation) 알고리즘[4]을 따르는데, 이 EBP 알고리즘의 학습속도가 느리거나 혹은 시험패턴에 대한 인식률이 충분치 않다는 단점을 해결하기 위하여 많은 개선책들이 제안되었다.
다층퍼셉트론이 많은 응용 문제에 적용될 수 있었던 근거는 무엇인가? 다층퍼셉트론(MLP: multilayer perceptron)은 충분한 중간층 노드 수가 있으면 임의의 함수를 근사화 할 수 있다는 수학적 증명을 근거로 많은 응용 문제에 적용되어 왔으며, 특히 패턴인식 문제에 많이 사용되었다[1]. 패턴인식 문제에 사용되는 경우, MLP의 구조에서 출력층 노드는 패턴의 클래스(class) 수만큼 주어져, 하나의 출력노드가 하나의 클래스를 대표하게 된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (19)

  1. Y. Ito, "Approximation of continuous functions on rdby linear combinations of shifted rotations of a sigmoid function with and without scaling," Neural Networks, Vol.5, pp.105-115, 1992. 

  2. H. White, "Learning in artificial neural networks: a statistical perspective," Neural Computation, Vol.1, pp.425-464, 1989. 

  3. 오상훈, "다층퍼셉트론의 잡음강건성 분석 및 향상 방법," 한국콘텐츠학회 논문지, 제9권, 제1호. 

  4. Y. Lee, S.-H. Oh, and M. W. Kim, "An analysis of premature saturation in back-propagation learning," Neural networks, Vol.6, pp.719-728, 1993. 

  5. A. van Ooyen and B. Nienhuis, "Improving the convgence of the back-propagation algorithm," Neural Networks, Vol.5, pp.465-471, 1992. 

  6. S.-H. Oh, "Improving the error back-propagation algorithm with a modified error function," IEEE Trans. Neural Networks, Vol.8, pp.799-803, 1997. 

  7. S.-H. Oh and S.-Y. Lee, "An adaptive learning rate with limited error signals for training of multilayer perceptrons," ETRI Journal, Vol.22, No.3, pp.10-18, 2000(9). 

  8. J. B. Hampshire II and A. H. Waibel, "A novel objective function for improved phoneme recognirtion using time-delay neural networks," IEEE Trans. Neural Networks, Vol.1, pp.216-228, 1990(6). 

  9. B. B. Chaudhuri and U. Bhattacharya, "Efficient training and improved performance of multilayer perceptron in pattern classification," Neurocomputing, Vol.34, pp.11-27, 2000. 

  10. K.-Y. Park and S.-Y. Lee, "Out-of vocabulary rejection based on selective attention model," Neural Processing Letters, Vol.12, pp.41-48, 2000. 

  11. F. J. Owens, G. H. Zheng, and D. A. Irvine, "A multi-output-layer perceptron," Neural Computation & Applications, Vol.4, pp.10-20, 1996. 

  12. T. P. Vogl, J. K. Mangis, A. K. Rigler, W. T. Zink, and D. L. Alkon, "Accelerating the convergence of the back-propagation method," Biol. Cybern., Vol.59, pp.257-263, 1988. 

  13. J. Y. F. Yam and W. S. Chow, "Extended least squares based algorithm for training feedfoward networks," IEEE Trans. Neural Networks, Vol.8, pp.806-810, 1997. 

  14. R. Paris, E. D. Di Claudio, G. Orlandi, "A generalized learning paradigm exploiting the structure of feedforward neural networks," IEEE Trans. Neural Networks, Vol.7, pp.1450-1459, 1996. 

  15. C. Yu, M. T. Manry, J. Li, and P. L. Narasimha, "An efficient hidden layer training method for multilayer perceptron," Neurocomputing, Vol.70, pp.525-535, 2006. 

  16. S.-H. Oh and S.-Y. Lee, "A new error function at hidden layers for fast training of multilayer perceptrons," IEEE Trans. Neural Networks, Vol.10, pp.960-964, 1999. 

  17. J.-H. Jeong, H. Kim, D.-S. Kim, and S.-Y. Lee, "Speaker adaptation based on judge neural networks for real world implementations of voice-command systems," Information Science, Vol.123, pp.13-24, 2000. 

  18. D.-S. Kim, S.-Y. Lee, and R.-M. Kil, "Auditory processig of speech signals for robust speech recognition in real-worldnoisy environments," IEEE Trans. Speech and Audio Processing, Vol.7, pp.55-69, 1999. 

  19. J. J. Hull, "A database for handwritten text recognition research," IEEE Trans. Pat. Ana. Mach. Int., Vol.16, pp.550-554, 1994. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로