[국내논문] 이미지 생성을 위한 변동 자동 인코더 분산 제약
Variational Auto Encoder Distributed Restrictions for Image Generation 원문보기

The journal of the institute of internet, broadcasting and communication : JIIBC, v.23 no.3, 2023년, pp.91 - 97  

김용길 (조선이공대학교 컴퓨터보안과)

AI-Helper 아이콘AI-Helper

GAN(Generative Adversarial Networks)이 합성 이미지 생성 및 기타 다양한 응용 프로그램에 현재 사용되고 있지만, 생성 모델을 제어하기가 어렵다. 문제는 생성 모델의 잠재 공간에 있는데, 이미지 생성과 관련하여 입력된 잠재코드를 받아 특정 텍스트 및 신호에 따라 지정된 대상 속성이 향상되도록 하고 다른 속성은 크게 영향을 받지 않도록 하기 위해서는 상당한 제약이 요구된다. 본 연구에서는 이미지 생성 및 조작과 관련하여 변동 자동 인코더의 잠재 벡터에 관해 특정 제약을 수반한 모델을 제안한다. 제안된 모델에 관해 TensorFlow의 변동 자동 인코더를 통해 실험한 결과 이미지의 생성 및 조작과 관련하여 비교적 우수한 성능을 갖는 것으로 확인된다.

Abstract AI-Helper 아이콘AI-Helper

Recent research shows that latent directions can be used to image process towards certain attributes. However, controlling the generation process of generative model is very difficult. Though the latent directions are used to image process for certain attributes, many restrictions are required to en...


제안 방법

  • 특히, 인코더 분포와 배후 분포 간에 KL Divergence를 최소화하도록 VAE를 훈련하는 것이 중요하다. 본 연구에서는 이미지 생성과 관련하여 VAE 제약을 하는 형태와 표준 자동 인코더의 주의 사항을 극복하는 문제, VAE 손실 함수 및 VAE의 Reparametrization 기법을 나타내고, 특정 이미지 데이터 세트에서 TensorFlow의 인코더 및 디코더를 구현한다.
참고문헌 (13)

  1. H G. E. Hinton and R. R. Salakhutdinov. Reducing the?Dimensionality of Data with Neural Networks.?SCIENCE, vol. 313, pp. 504-507, 2006.?DOI: https://doi.org/10.1126/science.1127647 

  2. AJ. Yoo, H. Eom and Y. S. Choi. Image-To-Image?Translation Using a Cross-Domain Auto-Encoder and?Decoder. Appl. Sci. vol. 9, no. 22, 4780, 2019.?DOI: https://doi.org/10.3390/app9224780 

  3. .LP. Cristovao, H. Nakada, Y. Tanimura, and H. Asoh.?Generating In-Between Images Through Learned?Latent Space Representation Using Variational?Autoencoders. IEEE Access, vol. 8, pp.?149456-149467, 2020..?DOI: https://doi.org/10.1109/ACCESS.2020.3016313 

  4. AD. P. Kingma and M. Welling. Auto-Encoding?Variational Bayes. 2nd International Conference on?Learning Representations, ICLR 2014, Banff, AB,?Canada, April 14-16, 2014..?DOI: https://doi.org/10.48550/arXiv.1312.6114 

  5. LC. Louizos and M. Welling. Multiplicative?normalizing flows for variational Bayesian neural?networks. International Conference on Machine?Learning. 2218-2227, 2017.. 

  6. JB. Kim, S. Shin, and H. Jung. Variational?Autoencoder-Based Multiple Image Captioning Using?a Caption Attention Map. Appl. Sci. Vol.9, No.13,?2699, 2019..?DOI: https://doi.org/10.3390/app9132699 

  7. SN. D. Lawrence, A unifying probabilistic perspective?for spectral dimensionality reduction: insights and?new models. Journal of Machine Learning Research.?13, 1609-1638, 2012. 

  8. Y.G Kim, K.I Moon. Hair Classification and Region?Segmentation by Location Distribution and Graph?Cutting. The Journal of The Institute of Internet,?Broadcasting and Communication (IIBC). Vol.22,?No.3, pp1-8 Jun.30.2022?DOI: https://doi.org/10.7236/JIIBC.2022.22.3.1 

  9. MJ. A. Lee and M. Verleysen, Nonlinear Dimensionality?Reduction. Springer, 2007, ISBN 978-0-387-39350-6..?Y.G Kim, K.I Moon. Object Detection Based on?Hellinger Distance IoU and Objectron Application.?The Journal of The Institute of Internet, Broadcasting?and Communication (IIBC). Vol,22, No2, pp.63-70?Apr.30. 2022?DOI: https://doi.org/10.7236/JIIBC.2022.22.2.63 

  10. AB. U. Dideriksen, K. Derosche, Z. H. Tan, iVAE-GAN:?Identifiable VAE-GAN Models for Latent Representation?Learning. IEEE Access, vol. 10, pp. 48405-48418,?03,May,2022.?DOI: https://doi.org/10.1109/ACCESS.2022.3172333 

  11. J. Duda. Gaussian AutoEncoder arXiv:1811.04751v4?[cs.LG] 14 Jan 2019.?DOI: https://doi.org/10.48550/arXiv.1811.04751 

  12. Y.G Kim, K.I Moon. Image Restoration Based on Inverse?Order and Power Spectrum Density, The Journal of?The Institute of Internet, Broadcasting and Communication?(IIBC). Vol.16, No.2, pp.113~122, 2016.?DOI: https://doi.org/10.7236/JIIBC.2016.16.2.113 

  13. Y.G Kim, Image Reconstruction Using Poisson Model?Screened from Image Gradient. The Journal of The?Institute of Internet, Broadcasting and Communication?(IIBC). Vol.18, No 2, pp.117-123, 2018.?DOI: https://doi.org/10.7236/JIIBC.2018.18.2.117 

