최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기방송공학회논문지 = Journal of broadcast engineering, v.25 no.2, 2020년, pp.157 - 165
In this paper. we propose an effective compensation scheme to the quantization error arisen from quantized learning in a machine learning on an embedded system. In the machine learning based on a gradient descent or nonlinear signal processing, the quantization error generates early vanishing of a g...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
AdaDelta란 무엇인가? | 특히, 양자화를 사용하는 기계학습의 경우, 양자화 오 차에서 파생되는 학습 오차가 데이터당 반복 (Iteration)혹 은 전체 데이터 집합 당 반복(Epoch)에서 더욱될 수 있으 므로, 학습 오차를 최소화시킬 수 있는 최적 학습률을 내부 루프 없이 계산할 수 있는 알고리즘이 필요하다. 기존 기계 학습에서는 적응적 학습률을 구현하기 위하여 일반적으로 Newton-Rapson 최적화법에 기반한 알고리즘 (AdaDelta, AdaGrad, ADAM등)이 존재했으나 이들 역시, 근사 Hessian을 사용하여 경사 도함수의 적용 비율에 대한 변화만을 주었을 뿐, 근본적으로 일정한 학습률을 사용하였다[6][7][8]. 때문에, 현재 제안된 거의 대부분의 확률적 최급 강하법에 의한 학습 방정식으로는 전체 데이터집합 반복 수행에서 국소적으로도 점근적인 수렴성(Asymptotically Convergence)을 Hessian의 최대값 제한과 같은 완비성 조건(Compact Condition)이 없이는 완전히 보장할 수 없다. | |
양자화 오차에 의한 전체적인 알고리즘의 성능 하락은 어떻게 보상하는가? | 경사 도함수(Gradient)를 사용하는 기계학습이나 비선형 신호처리 알고리즘에서 양자화 오차는 경사 도함수의 조기 소산(Early Vanishing Gradient)을 야기하여 전체적인 알고리즘의 성능 하락을 가져온다. 이를 보상하기 위하여 경사 도함수의 최대 성분에 대하여 직교하는 방향의 보상 탐색 벡터를 유도하여 양자화 오차로 인한 성능 하락을 보상하도록 한다. 또한, 기존의 고정 학습률 대신, 내부 순환(Inner Loop) 없는 비선형 최적화 알고리즘에 기반한 적응형 학습률 결정 알고리즘을 제안한다. | |
경사 도함수(Gradient)를 사용하는 기계학습이나 비선형 신호처리 알고리즘에서 양자화 오차는 어떤 문제를 발생시키는가? | 본 논문에서는 임베디드 시스템에서의 양자화 기계학습을 수행할 경우 발생하는 양자화 오차를 효과적으로 보상하기 위한 방법론을 제안한다. 경사 도함수(Gradient)를 사용하는 기계학습이나 비선형 신호처리 알고리즘에서 양자화 오차는 경사 도함수의 조기 소산(Early Vanishing Gradient)을 야기하여 전체적인 알고리즘의 성능 하락을 가져온다. 이를 보상하기 위하여 경사 도함수의 최대 성분에 대하여 직교하는 방향의 보상 탐색 벡터를 유도하여 양자화 오차로 인한 성능 하락을 보상하도록 한다. |
R. M. Gray, and D. L. Neuhoff, "Quantization.", IEEE Transactions on Inform. Theory, Vol. 44, No. 6, pp. 2325-2383, June, 2006.
D. Alistarh, D. Grubic, L. J. Ryota, and V. Milan, "QSGD: Communication-efficient sgd via gradient quantization and encoding.", Advances in Neural Information Processing Systems, Vol. 30, pp. 1709-1720, January, 2017
G. Tenenbaum, 'Introduction to Analytic and Probabilistic Number Theory', Academic mathematical Society, 2014.
D. G. Luenberger, Y. Ye, 'Linear and Nonlinear Programming', Springer, 2015.
S. Sra, S. Nowozin, S.J.Wright, 'Optimization for Machine Learning', MIT press, 2012.
J. Duchi, E. Hazan, and Y. Singer. Adaptive Subgradient Methods for Online Learning and Stochastic Optimization. The Journal of Machine Learning Research, 2011.
M. Zeiler, "ADADELTA: an adaptive learning rate", arXiv preprint, https://arxiv.org/abs/1212.5701, arXiv:1212.5701, 2012.
D. Kingma, J. Ba. Adam: A Method for Stochastic Optimization. International Conference for Learning Representations, 2015.
S. M. Goldfeld, R. E. Quandt, and H. F. Trotter, "Maximization by Quadratic Hill-Climbing", Econometrica, pp. 541-551, July, 1966.
S. Boyd, L. Vandenberghe, Convex Optimization, Cambridge University Press, Cambridge, 2004
M.S. Bazaraa, H.D. Sherali, C.M. Shetty, Nonlinear Programming: Theory and Algorithms. Wiley-Interscience, New Jersey, 2006
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.