정보와 통신 : 한국통신학회지 = Information & communications magazine, v.33 no.10, 2016년, pp.49 - 56  

문성은 (연세대학교) ,  장수범 (연세대학교) ,  이정혁 (연세대학교) ,  이종석 (연세대학교)

본 논문에서는 패턴 인식 및 회귀 문제를 풀기 위해 쓰이는 기계학습에 대한 전반적인 이론과 설계방법에 대해 알아본다. 대표적인 기계학습 방법인 신경회로망과 기저벡터머신 등에 대해 소개하고 이러한 기계학습 모델을 선택하고 구축하는 데에 있어 고려해야 하는 문제점들에 대해 이야기 한다. 그리고 특징 추출 과정이 기계학습 모델의 성능에 어떻게 영향을 미치는지, 일반적으로 특징 추출을 위해 어떤 방법들이 사용되는 지에 대해 알아본다. 또한, 최근 새로운 패러다임으로 대두되고 있는 딥러닝에 대해 소개한다. 자가인코더, 제한볼츠만기계, 컨볼루션신경회로망, 회귀신경회로망과 같이 딥러닝 기술이 적용된 대표적인 신경망 구조에 대해 설명하고 기존의 기계학습 모델과 비교하여 딥러닝이 가지고 있는 특장점을 알아본다.

문제 정의

  • 본 논문에서는 기계학습에 대한 전반적인 내용을 설명하고 특히 최근 많은 주목을 받고 있는 딥러닝에 대해 소개했다. 기존의 기계학습은 여러 가지 모형들인 신경회로망, 기저벡터머신, PCA 등의 여러 가지 기법들이 다양하게 연구되고 이용되었다.
  • 특히, 예전에는 기계학습이 많이 사용되지 않았던 자연과학 분야 등에서도 기계학습을 도입하려는 움직임이 나타나면서 기계학습은 인공지능이나 패턴 인식 등에 쓰이는 것을 넘어서 매우 범용적인 기술이 되었다. 본 논문에서는 기존의 기계학습 모델들과 그 한계, 그리고 딥러닝의 개념과 그 가능성에 대해 간략하게 다루며 최근 기계학습이 이루어낸 발전에 대해 살펴본다.
핵심어 질문 논문에서 추출한 답변
확률 밀도 분포를 추정함으로써 기계학습을 수행하는 방법에는 무엇이 있는가? 결정경계를 찾는 신경회로망이나 기저벡터머신과 달리, 각 클래스의 확률 밀도 분포를 추정함으로써 기계학습을 수행하는 방법들도 있다. 대표적인 예로는 Parzen's window, Gaussian mixture model, hidden Markov model 등이 있다<그림 5>.
기계학습 문제는 어떻게 나눌 수 있는가? 기계학습을 통해 풀 수 있는 문제는 크게 주어진 데이터의 클래스를 구분해야 하는 패턴인식(pattern classification) 문제와 연속적인 어떤 값을 추정해야 하는 회귀(regression) 또는 함수 근사화(function approximation) 문제로 나눌 수 있다. 또한 학습 방법에 따라서는 패턴인식이나 회귀 문제에서 학습데이터의 클래스나 출력 값을 알고 이에 대한 피드백을 통해 학습하는 지도학습(supervised learning), 학습 데이터의 클래스나 출력 값을 이용하지 않고 데이터 패턴이나 클러스터, 밀도 등을 추정하는 비지도학습(unsupervised learning), 클래스나 출력 값을 아는 데이터(labeled data)와 모르는 데이터(unlabeled data)를 함께 사용하는 반지도학습(semi-supervised learning), 결과에 대한 피드백만 주어지고 정확한 클래스나 출력 값은 주어지지 않는 강화학습(reinforcement learning)으로 나눌 수 있다.
CNN의 핵심 요소에는 무엇이 있는가? CNN은 사람의 시각뉴런의 수용장(receptive field) 개념을 이용하여서 만들어진 신경망[18]이다<그림 9>. CNN은 컨볼루션 신경층(convolution layer), 풀링 신경층(pooling layer)과 정류선형유닛(rectified linear unit; ReLU)을 핵심 요소로 가진다. 컨볼루션 신경층은 입력과 출력을 어떤 신호의 형태로 보고 가중치를 작은 크기의 필터의 형태로 나타낸 가중치 커널이 특징이다.
