최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.7 no.12, 2018년, pp.485 - 496
이현옥 (고려대학교 빅데이터 융합학과) , 임희석 (고려대학교 컴퓨터학과)
So far, the deep learning, a field of artificial intelligence, has achieved remarkable results in solving problems from unstructured data. However, it is difficult to comprehensively judge situations like humans, and did not reach the level of intelligence that deduced their relations and predicted ...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
RN 기반 심층 신경망 모델의 성능 개선을 위해 제안된 방법은? | RN 기반 심층 신경망 모델의 성능개선 방법으로 모델 구축 시 사용한 성능개선 핵심 방법 외의 배치 사이즈, 초기 학습률 등의 하이퍼 파라미터 튜닝방법을 제안하였다. | |
신경망 학습 최적화 기법으로는 무엇이 있는가? | 이러한 최적화에는 여러 가지 방법이 있다. 가장 간단한 방법으로는 손실함수의 그래프에서 가장 낮은 지점을 찾아가도록 손실함수의 기울기를 구해 기울어진 방향으로 매개변수의 값을 갱신해나가는 확률적 경사 하강법(SGD)[12]과 이 방법의 단점을 개선한 Momentum[13], AdaGrad[14], Adam 방법이 있다. 본 논문에서의 RN 기반 심층 신경망 모델은 최적화 방법 중에서 가장 큰 장점을 가지고 있는 Adam 기법을 사용하였다. | |
Sort-of-CLEVR 데이터 셋이란? | Sort-of-CLEVR 데이터 셋은 구글의 딥마인드가 RN 아키텍처가 일반적 신경망 아키텍처보다 관계형 추론에 더 적합하다는 가설을 증명하기 위하여 구축한 데이터 셋이다. 이 데이터 셋은 CLEVR[17]의 간소화 버전으로 기존 시각적 질의응답 데이터 셋의 이미지 처리의 복잡성을 줄이고 언어학적 모호성과 편향성을 보완한 데이터 셋이다. |
Adam Santoro, David Raposo, David G.T. Barrett, Mateusz Malinowski, Razvan Pascanu, Peter Battaglia, and Timothy Lillicrap, "A simple neural network module for relational reasoning," arXiv: 1706.01427v1, 2017.
David Raposo, Adam Santoro, David Barrett, Razvan Pascanu, Timothy Lillicrap, and Peter Battaglia, "Discovering objects and their relations from entangled scene representations," arXiv:1702.05068, 2017.
Nicholas Watters, Andrea Tacchetti, Theophane Weber, Razvan Pascanu, Peter Battaglia, and Daniel Zoran, "Visual Interaction Networks," arXiv:1706.01433v1, 2017.
Stanislaw Antol, Aishwarya Agrawal, Jiasen Lu, Margaret Mitchell, Dhruv Batra, C Lawrence Zitnick, and Devi Parikh, "Vqa: Visual question answering," arXiv:1505.00468v7, 2015.
Antoine Bordes, Jason Weston, Sumit Chopra, and Tomas Mikolov, "Towards ai-complete question answering: A set of prerequisite toy tasks," arXiv:1502.05698, 2015.
Sainbayar Sukhbaatar, Arthur Szlam, Jason Weston, and Rob Fergus, "End-To-End Memory Networks," arXiv:1503.08895v5, 2015.
Sergey Ioffe and Christan Szegedy, "Batch Normalization : Accelerating Deep Network Training by Reducing Internal Covariate Shift," arXiv:1502.03167, 2015.
N. Srivastava, G. Hinton. A. Krizhevsky. I. Sutskever, and R. Salakhutdinov, "Dropout : A simple way to prevent neural networks from overfitting," The Journal of Machine Learning Research, 15, pp.1929-1958, 2014.
Diederik Kingma and Jimmy Ba, "Adam : A Method for Stochastic Optimization," arXiv: 1412.6980, 2014.
James Bergstra and Yoshua Bengio, "Random Search for Hyper Parameter Optimization," Journal of Machine Learning Research, Vol.13, pp.281-305, 2012.
Jason Weston, "Dialog-based Language Learning," arXiv: 1604.06045, 2016.
Sebastian Ruder, "An overview of gradient descent optimization algorithms," arXiv:1609.04747v2, 2016.
Ilya Sutskever, James Martens, George Dahl, and Geoffrey Hinton, "On the importance of initialization and momentum in deep learning," Proceedings of the 30th International Conference on Machine Learning, pp.1139-1147, 2013.
John Duchi, Elad Hazan, and Yoram Singer, "Adaptive Subgradient Methods for Online Learning and Stochastic Optimization," Journal of Machine Learning Research, Vol.12, pp.2121-2159, 2011.
Jasper Snoek, Hugo Larochelle, and Ryan P. Adams. "Practical Bayesian optimization of machine learning algorithms," arXiv:1206.2944v2, 2012.
Matthias Feurer, Benjamin Letham, and Eytan Bakshy, "Scalable Meta-Learning for Bayesian Optimization," arXiv: 1802.02219, 2018.
Justin Johnson, Bharath Hariharan, Laurens van der Maaten, Li Fei-Fei, C Lawrence Zitnick, and Ross Girshick., "Clevr: A diagnostic dataset for compositional language and elementary visual reasoning," arXiv:1612.06890v1, 2017.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.