$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

RNN Auto-Encoder의 시계열 임베딩을 이용한 자동작곡
Automatic Composition using Time Series Embedding of RNN Auto-Encoder 원문보기

멀티미디어학회논문지 = Journal of Korea Multimedia Society, v.21 no.8, 2018년, pp.849 - 857  

김경환 (Dept. of Electronics and Information Eng., Hansung University) ,  정성훈 (Dept. of Electronics and Information Eng., Hansung University)

Abstract AI-Helper 아이콘AI-Helper

In this paper, we propose an automatic composition method using time series embedding of RNN Auto-Encoder. RNN Auto-Encoder can learn existing songs and can compose new songs from the trained RNN decoder. If one song is fully trained in the RNN Auto-Encoder, the song is embedded into the vector valu...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 RNN Auto-Encoder를 이용한 자동작곡 방법을 제안하였다. RNN Auto-Encoder를 구현하여 곡을 학습시켰다.
  • 본 논문에서는 RNN과 Auto-Encoder를 결합한 새로운 구조의 신경망을 제안한다. RNN Auto- Encoder는 기존 Auto-Encoder의 Encoder와 Decoder를 RNN으로 구성한다.
  • 그러므로 많은 곡을 학습시킨 후 작곡을 위한 벡터 입력을 적절히 넣어주면 다수의 학습시킨 곡의 특징을 갖는 곡이 출력된다. 본 논문에서는 작곡을 위한 새로운 벡터를 넣는 방법으로 학습된 두 곡의 벡터 평균을 넣는 방법과 무작위 벡터를 넣는 방법에 대하여 실험하였다. 실험결과 두 곡의 벡터 평균을 넣는 경우 해당 곡의 특징이 잘 섞이는 것을 볼 수 있었으며 무작위 벡터를 넣는 경우 다양한 곡의 특징이 융합되는 것을 볼 수 있었다.
  • 또한 다수의 곡을 학습한 후에 임의의 상태벡터를 RNN Decoder에 넣어주면 기존 곡들의 상태벡터와 작곡을 위해 넣어준 상태벡터의 관계를 통하여 기존의 학습된 곡들의 특징을 갖는 새로운 곡을 출력할 수 있었다. 본 연구에서는 근음만을 학습하고 근음만을 작곡하는 것을 구현하였다. 추후 작곡된 근음으로 화성을 만들어 화성이 있는 곡을 만드는 연구를 진행할 예정이다.
  • 이러한 문제를 해결하고자 본 논문에서는 다수의 곡을 잘 학습하기 위한 새로운 신경망 구조를 제안한다. 우리는 시계열 데이터를 학습하기에 적합한 Re- current Neural Network(RNN)과 학습 데이터의 특징을 은닉층에 압축시키는 신경망 구조인 Auto- Encoder를 결합했다.

가설 설정

  • 그래서 우리는 쉼표의 경우 숫자 50을 사용하여 시계열 데이터를 만들었다[9,10]. 박자는 4/4박자에서 16분 음표를 1로 가정하고 하나의 점음표까지만 허용하여 1, 2, 3, 4, 6, 8, 12, 16의 총 8개의 박자를 사용하였다[9].
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
인공신경망으로 작곡할 때 갖는 장점은 무엇인가? 마디구분으로 사용하는 수는 그 값 자체가 중요한 것이 아니라 학습 시와 작곡 시에 마디를 구분만하면 되는 것이기 때문에 무작위로 만들어도 된다. 학습된 인공신경망으로 작곡 할 때 학습 시 사용한 마디구분을 이용하여 곡의 위치를 설정할 수 있으며 또한 학습 시에 사용한 마디구분 값을 변형함으로서 작곡하는 멜로디에 변형을 가할 수 있는 등 많은 장점이 있다. 더 나아가 작곡 시에 마디구분을 반복적으로 배치함으로서 반복적인 곡을 생성할 수 있다.
Auto-Encoder는 어떤 것인가? Auto-Encoder는 출력레이블 없이 입력 데이터만으로 신경망을 학습하여 은닉층에 데이터의 특징을 압축시키는 비지도 학습 방법이다. Encoder와 Decoder로 구성되어 있으며 Fig.
인공신경망이 출력한 곡이 지닌 문제는 무엇인가? 그러나 인공신경망이 출력한 음표/쉼표/박자는 학습된 음표/쉼표/박자 공간의 값을 출력한 것으로 음악적 이론에 맞지 않는 경우가 종종 발생한다. 박자의 경우 못갖춘마디가 발생하고 음표의 경우 특정 조성에 없는 음이 발생하거나 마디 내에서 어울리지 않는 화성의 음표가 발생하기도 한다. 이를 해결하기 위하여 박자후처리, 화성후처리, 조성후처리를 수행하였다[11].
질의응답 정보가 도움이 되었나요?

참고문헌 (14)

  1. B. Johanson and R. Poli, "GP-music: An Interactive Genetic Programming System for Music Generation with Automated Fitness Raters," Proceeding of the Third Annual Conference, pp. 181-186, 1998. 

  2. N. Tokui and H. Iba, "Music Composition with Interactive Evolutionary Computation," Proceeding of the Third International Conference on Generative Art, pp. 215-226, 2000. 

  3. C. Chen and R. Miikkulainen, "Creating Melodies with Evolving Recurrent Neural Networks," Proceedings of the 2001 International Joint Conference on Neural Networks, pp. 2241-2246, 2001. 

  4. T. Oliwa and M. Wagner, "Composing Music with Neural Networks and Probabilistic Finitestate Machines," Applications of Evolutionary Computing, pp. 503-508, 2008. 

  5. H. Kim, B. Kim, and B. Zhang, "Learning Music and Generation of Crossover Music Using Evolutionary Hypernetworks," Proceeding of Korea Computer Congress, pp. 134-138, 2009. 

  6. G. Bickerman, S. Bosley, P. Swire, and Rober M. Keller, "Learning to Create Jazz Melodies Using Deep Belief Nets," Proceeding of the International Conference on Computational Creativity, pp. 228-237, 2010. 

  7. A.E. Coca, R.A.F. Romero, and L. Zhao, "Generation of Composed Musical Structures Through Recurrent Neural Networks Based on Chaotic Inspiration," Proceeding of International Joint Conference on Neural Networks, pp. 3220-3226, 2011. 

  8. J.D. Fernandez and F. Vico, "AI Methods in Algorithmic Composition: A Comprehensive Survey," Journal of Artificial Intelligence Research, Vol. 48, pp. 513-582, 2013. 

  9. J. Cho, E.M. Ryu, J. Oh, and S.H. Jung, "Training Method of Artificial Neural Networks for Implementation of Automatic Composition Systems," Korea Information Processing Society Transactions on Software and Data Engineering, Vol. 3, No. 8, pp. 315-320, 2014. 

  10. J. Oh, J. Song, K. Kim, and S.H. Jung, "Automatic Composition Using Training Capability of Artificial Neural Networks and Chord Progression," Journal of Korea Multimedia Society, Vol. 18, No. 11, pp. 1358-1366, 2015. 

  11. K. Kim and S.H. Jung, "Postprocessing for Tonality and Repeatability, and Average Neural Networks for Training Multiple Songs in Automatic Composition," Journal of Korean Institute of Intelligent Systems, Vol. 26, No. 6, pp. 445-451, 2016. 

  12. K. Kim and S.H. Jung, "Adoption of Artificial Neural Network for Rest, Enhanced Post-processing of Beats and Initial Melody Processing for Automatic Composition System," Journal of Korea Digital Contents Society, Vol. 17, No. 6, pp. 449-459, 2016. 

  13. K. Kim and S.H. Jung, "Automatic Generation of a Configured Song with Hierarchical Artificial Neural Networks," Journal of Korea Digital Contents Society, Vol. 18, No. 4, pp. 641-647, 2017. 

  14. S. Nitish, M. Elman, and S. Ruslan, "Unsupervised Learning of Video Representations Using LSTMs," Proceeding of the 32nd International Conference on Machine Learning, Vol. 37, No. 10, pp. 843-852, 2015. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로