최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기퍼지 및 지능시스템학회 논문지 = Journal of fuzzy logic and intelligent systems, v.15 no.4, 2005년, pp.395 - 399
In this paper, we presents HIGH-Q learning algorithm with reinforcement learning for more fast and exact topic-directed web spidering. The purpose of reinforcement learning is to maximize rewards from environment, an reinforcement learning agents learn by interacting with external environment throug...
박찬건, 양성봉, '강화 학습에서의 탐색과 이용의 균 형을 통한 범용적 온라인 Q-학습이 적용된 에이전트 의 구현,' 정보과학회 논문지(B), Vol. 30, No. 7, pp. 672-680, 2003
정태진, 장병탁, '강화 학습을 이용한 웹 정보 검색,' 정보과학회 제 28회 추계학술대회, Vol. 28, No. 2, pp. 94-96, 2001
C. J. Watkins and P. Dayan, 'Technical note : QLearning,' Machine Learning, 8, pp .279-292, 1992
F. Menczer, 'ARACHNID: Adaptive retrieval agents choosing heuristic neighborhoods for information discovery,' In proceedings of 14th International Conference on Machine Learning, pp. 227-235, 1997
H. Lieberman, 'Letizia: An agent that assists web browsing,' In Proocedings of the International Joint Conference on Arti cial Intelligence (IJCAI95), pp. 924-929, 1995
J. Boyan, D. Freitag, and T. Joachimas, 'A machine learning architecture for optimizing web search engines,' In proceedings of AAAI workshop on Internet-Based Information Systems, pp. 1-8, 1996
J. Peng, and R. Williams, 'Incremental multi-step Q-learning,' Machine Learning, vol. 22, pp. 283- 290, 1996
J. Rennie and A. McCallum, 'Using Reinforcement Learning to Spider the Web Efficiently,' In proceedings of the 16th International Conference on Machine Learning(ICML-99), pp. 335-343, 1999
L. P. Kaelbling, 'Learning in Embedded System,' PhD thesis, Departmenr of Computer Science, Stanford University, 1990
R. Dearden, N. Friedman and S. Russell, 'Bayesian Q-Learning,' In proceedings of AAA-98, 1989
R. S. Sutton and A. G. Barto, Reinforcement Learning : An Introduction. The MIT Press, 1998
S. B. Thrun, 'The role of exploration in learning control,' Handbook of Intelligent Control:Neural, Fussy and Adaptive Approaches. 1992
T. Joachims, D. Freitag, and T. M. Mitchell. 'A WebWatcher: A Tour Guide for the World Wide Web,' In Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence (IJCAI'97), pp. 770-777, 1997
T. M. Mitchell, Machine Learning, McGraw-Hill, 1997
M. Tan, Multi-agent reinforcement learning: Independent vs. cooperative agents. In Proc. of the Tenth International Conf. on Machine Learning, pp. 330.337, 1993
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.