보조 분류기 및 주목 방법 기반의 계층형 적대적 생성 신경망을 이용한 영상 생성 Generating image with Auxiliary Classifier and Attention Method Based Stack Generative Adversarial Network원문보기
본 논문에서는 영상의 특징을 표현한 문장을 바탕으로 영상을 생성하는 적대적 생성 신경망(GAN: Generative Adversarial Network)을 제안한다. 제안하는 영상 생성 방법은 두 가지 목표를 가진다. 첫 번째 목표는 생성할 영상 내 객체를 세밀한 부분까지 조정할 수 있도록 문장을 통해 생성되도록 하는 것이다. 두 번째 목표는 생성된 영상의 해상도를 실제 영상의 해상도와 가까워지도록 하는 것이다. 제안하는 영상 생성 방법에서는 이러한 목적을 달성하기 위해 문장에서 영상을 생성하는 방법으로는 문장 주목 방법을 이용하였고, 해상도를 개선하려는 방법으로는 보조 분류기 및 계층형 구조를 함께 적용한 ...
본 논문에서는 영상의 특징을 표현한 문장을 바탕으로 영상을 생성하는 적대적 생성 신경망(GAN: Generative Adversarial Network)을 제안한다. 제안하는 영상 생성 방법은 두 가지 목표를 가진다. 첫 번째 목표는 생성할 영상 내 객체를 세밀한 부분까지 조정할 수 있도록 문장을 통해 생성되도록 하는 것이다. 두 번째 목표는 생성된 영상의 해상도를 실제 영상의 해상도와 가까워지도록 하는 것이다. 제안하는 영상 생성 방법에서는 이러한 목적을 달성하기 위해 문장에서 영상을 생성하는 방법으로는 문장 주목 방법을 이용하였고, 해상도를 개선하려는 방법으로는 보조 분류기 및 계층형 구조를 함께 적용한 적대적 생성 신경망을 구성하였다. 본 논문에서 제안한 모델을 이용하여 생성한 영상의 효용성을 검증하기 위해 Inception Score 방식으로 평가하였다. 입력 데이터로 Oxpord-102를 이용하였고 전체 자료의 70%인 57,320장을 신경망 모델의 학습에 사용하였고, 그 외의 30%인 24,570장을 영상 생성 실험 및 성능 평가에 이용하였다. Inception Score를 책정한 결과, 평균 3.37p의 성능을 나타내어 기존의 영상 생성 방법보다 높은 점수를 얻을 수 있었고, 생성된 영상의 효용성 또한 확인할 수 있었다.
본 논문에서는 영상의 특징을 표현한 문장을 바탕으로 영상을 생성하는 적대적 생성 신경망(GAN: Generative Adversarial Network)을 제안한다. 제안하는 영상 생성 방법은 두 가지 목표를 가진다. 첫 번째 목표는 생성할 영상 내 객체를 세밀한 부분까지 조정할 수 있도록 문장을 통해 생성되도록 하는 것이다. 두 번째 목표는 생성된 영상의 해상도를 실제 영상의 해상도와 가까워지도록 하는 것이다. 제안하는 영상 생성 방법에서는 이러한 목적을 달성하기 위해 문장에서 영상을 생성하는 방법으로는 문장 주목 방법을 이용하였고, 해상도를 개선하려는 방법으로는 보조 분류기 및 계층형 구조를 함께 적용한 적대적 생성 신경망을 구성하였다. 본 논문에서 제안한 모델을 이용하여 생성한 영상의 효용성을 검증하기 위해 Inception Score 방식으로 평가하였다. 입력 데이터로 Oxpord-102를 이용하였고 전체 자료의 70%인 57,320장을 신경망 모델의 학습에 사용하였고, 그 외의 30%인 24,570장을 영상 생성 실험 및 성능 평가에 이용하였다. Inception Score를 책정한 결과, 평균 3.37p의 성능을 나타내어 기존의 영상 생성 방법보다 높은 점수를 얻을 수 있었고, 생성된 영상의 효용성 또한 확인할 수 있었다.
In this paper, we propose a Generative Adversarial Network(GAN) that can generate images through sentences. GAN, which is a generation model, has recently demonstrated excellent performance in image generation. The proposed image generation method has two goals. The first goal is to make the objects...
In this paper, we propose a Generative Adversarial Network(GAN) that can generate images through sentences. GAN, which is a generation model, has recently demonstrated excellent performance in image generation. The proposed image generation method has two goals. The first goal is to make the objects in the image to be generated through a sentence so that the details of the objects in the image can be adjusted. The second goal is to make the resolution of the generated image close to the resolution of the actual image. In order to achieve this goal, the proposed image generation method uses a sentence attention method as a method of generating an image in a sentence, and GAN as a method of improving resolution by using auxiliary classifier and stack structure together. Oxpord-102 was used as the input data, and 57,320 of 70% of the total data were used for the learning of the neural network model, and 24,570 of the other 30% were used for the image generation experiment and performance evaluation. As a result of evaluating the Inception Score, the average score of 3.37p was obtained, which was higher than that of the existing image generation method, and the effectiveness of the generated image was confirmed.
In this paper, we propose a Generative Adversarial Network(GAN) that can generate images through sentences. GAN, which is a generation model, has recently demonstrated excellent performance in image generation. The proposed image generation method has two goals. The first goal is to make the objects in the image to be generated through a sentence so that the details of the objects in the image can be adjusted. The second goal is to make the resolution of the generated image close to the resolution of the actual image. In order to achieve this goal, the proposed image generation method uses a sentence attention method as a method of generating an image in a sentence, and GAN as a method of improving resolution by using auxiliary classifier and stack structure together. Oxpord-102 was used as the input data, and 57,320 of 70% of the total data were used for the learning of the neural network model, and 24,570 of the other 30% were used for the image generation experiment and performance evaluation. As a result of evaluating the Inception Score, the average score of 3.37p was obtained, which was higher than that of the existing image generation method, and the effectiveness of the generated image was confirmed.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.