최근 이미지 인식, 영상 인식, 음성 인식, 자연어 처리 등 다양한 분야에 인공지능이 적용되면서 딥러닝(Deep learning) 기술에 관한 관심이 높아지고 있다. 딥러닝 중에서도 가장 대표적인 알고리즘으로 이미지 인식 및 분류에 강점이 있고 각 분야에 많이 쓰이고 있는 CNN(Convolutional Neural Network)에 대한 많은 연구가 진행되고 있다. 본 논문에서는 일반적인 CNN 구조를 변형한 새로운 네트워크 구조를 제안하고자 한다. 일반적인 CNN 구조는 convolution layer, pooling layer, fully-connected layer로 구성된다. 그러므로 본 연구에서는 일반적인 CNN 구조 내부에 FC를 첨가한 새로운 네트워크를 구성하고자 한다. 이러한 변형은 컨볼루션된 이미지에 신경회로망이 갖는 장점인 일반화 기능을 포함시켜 정확도를 올리고자 한다.
최근 이미지 인식, 영상 인식, 음성 인식, 자연어 처리 등 다양한 분야에 인공지능이 적용되면서 딥러닝(Deep learning) 기술에 관한 관심이 높아지고 있다. 딥러닝 중에서도 가장 대표적인 알고리즘으로 이미지 인식 및 분류에 강점이 있고 각 분야에 많이 쓰이고 있는 CNN(Convolutional Neural Network)에 대한 많은 연구가 진행되고 있다. 본 논문에서는 일반적인 CNN 구조를 변형한 새로운 네트워크 구조를 제안하고자 한다. 일반적인 CNN 구조는 convolution layer, pooling layer, fully-connected layer로 구성된다. 그러므로 본 연구에서는 일반적인 CNN 구조 내부에 FC를 첨가한 새로운 네트워크를 구성하고자 한다. 이러한 변형은 컨볼루션된 이미지에 신경회로망이 갖는 장점인 일반화 기능을 포함시켜 정확도를 올리고자 한다.
Recently, artificial intelligence has been applied to various fields such as image recognition, image recognition speech recognition, and natural language processing, and interest in Deep Learning technology is increasing. Many researches on Convolutional Neural Network(CNN), which is one of the mos...
Recently, artificial intelligence has been applied to various fields such as image recognition, image recognition speech recognition, and natural language processing, and interest in Deep Learning technology is increasing. Many researches on Convolutional Neural Network(CNN), which is one of the most representative algorithms among Deep Learning, have strong advantages in image recognition and classification and are widely used in various fields. In this paper, we propose a new network structure that transforms the general CNN structure. A typical CNN structure consists of a convolution layer, ReLU layer, and a pooling layer. Therefore in this paper, We intend to construct a new network by adding fully connected layer inside a general CNN structure. This modification is intended to increase the learning and accuracy of the convoluted image by including the generalization which is an advantage of the neural network.
Recently, artificial intelligence has been applied to various fields such as image recognition, image recognition speech recognition, and natural language processing, and interest in Deep Learning technology is increasing. Many researches on Convolutional Neural Network(CNN), which is one of the most representative algorithms among Deep Learning, have strong advantages in image recognition and classification and are widely used in various fields. In this paper, we propose a new network structure that transforms the general CNN structure. A typical CNN structure consists of a convolution layer, ReLU layer, and a pooling layer. Therefore in this paper, We intend to construct a new network by adding fully connected layer inside a general CNN structure. This modification is intended to increase the learning and accuracy of the convoluted image by including the generalization which is an advantage of the neural network.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 기존의 CNN 구조와 제안된 CNN 구조 사이의 학습성능을 비교하였다. 제안된 CNN 구조는 FC를 1번째 pooling layer와 2번째 convolution layer 사이에 포함해 구성하였다.
본 논문에서는 신경회로망의 장점을 갖는 Fully connected layer를 내부에 연결하는 새로운 CNN 구조를 제안하고자 하였다. 제안된 CNN 구조를 통해 기존 CNN 구조의 학습 정도와 확연한 차이가 나지 않으나, 의미 있는 결과를 얻은 것으로 생각된다.
본 연구에서는 이러한 신경회로망의 장점을 최대한 높이면서 CNN의 성능을 향상할 수 있는 구조를 제안하고자 한다. 일반적인 CNN 구조에 신경회로망 구조인 FC를 CNN 내부에 첨가한 새로운 네트워크를 구성하여 더 정밀한 정확도를 갖는 네트워크를 제안하고자 한다.
본 연구에서는 이러한 신경회로망의 장점을 최대한 높이면서 CNN의 성능을 향상할 수 있는 구조를 제안하고자 한다. 일반적인 CNN 구조에 신경회로망 구조인 FC를 CNN 내부에 첨가한 새로운 네트워크를 구성하여 더 정밀한 정확도를 갖는 네트워크를 제안하고자 한다.
제안 방법
학습에 사용된 데이터 세트는 Matlab에서 제공하는 손으로 쓴 숫자로 구성된 28×28 크기의 이미지 셋을 사용하였다. 데이터는 각 숫자(digit) 당 1000개로 구성되어있으며, 학습을 위하여 5번의 epoch를 수행하였다. 그림 2는 1000번의 학습이 수행된 후 기존 CNN의 학습성능은 평균 정도가 0.
본 논문에서 제안된 CNN 구조는 convolution kernel의 Generalized linear model을 FC layer를 통하여 nonlinear model로 바꾸어 성능을 향상할 수 있도록 하였다. 그림 1은 제안된 CNN 구조를 나타내었다.
본 논문에서는 기존의 CNN 구조와 제안된 CNN 구조 사이의 학습성능을 비교하였다. 제안된 CNN 구조는 FC를 1번째 pooling layer와 2번째 convolution layer 사이에 포함해 구성하였다. 학습에 사용된 데이터 세트는 Matlab에서 제공하는 손으로 쓴 숫자로 구성된 28×28 크기의 이미지 셋을 사용하였다.
대상 데이터
학습에 사용된 데이터 세트는 Matlab에서 제공하는 손으로 쓴 숫자로 구성된 28×28 크기의 이미지 셋을 사용하였다.
성능/효과
본 논문에서는 신경회로망의 장점을 갖는 Fully connected layer를 내부에 연결하는 새로운 CNN 구조를 제안하고자 하였다. 제안된 CNN 구조를 통해 기존 CNN 구조의 학습 정도와 확연한 차이가 나지 않으나, 의미 있는 결과를 얻은 것으로 생각된다. 추후 더 많은 연구와 실험으로 전체적인 학습시간과 연산량 증가에 대한 개선사항이 고려되어야 할 것으로 판단된다.
후속연구
일반적인 신경회로망은 인간이 가지고 있는 지적능력을 모방하여 일반화 기능 및 비선형함수를 모델링 할 수 있는 장점이 있으나, CNN의 등장으로 단순히 데이터 분류를 위한 기능만으로 축소되어 이러한 장점들이 많이 퇴색된 측면이 있다. 그리고 CNN은 사람이나 동물의 시각처리 과정을 모방하여 영상 정보를 인식하는 구조이므로 사람이 인지하지 못하는 영상이나 함수에 대하여서는 신경회로망이 더 뛰어난 성능을 나타낼 것으로 기대된다.
제안된 CNN 구조를 통해 기존 CNN 구조의 학습 정도와 확연한 차이가 나지 않으나, 의미 있는 결과를 얻은 것으로 생각된다. 추후 더 많은 연구와 실험으로 전체적인 학습시간과 연산량 증가에 대한 개선사항이 고려되어야 할 것으로 판단된다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.