최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국인터넷방송통신·TV학회논문지 = The Journal of The Institute of Webcasting, Internet Television and Telecommunication, v.9 no.3, 2009년, pp.25 - 30
한송이 (을지대학교 의료전산학전공) , 정용규 (을지대학교 의료전산학전공)
Recent days intellectual systems using reinforcement learning are being researched at various fields of game and web searching applications. A good training models are called to be fitted with trainning data and also classified with new records accurately. A overfitted model with training data may p...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
웹 검색 에이전트는 어떻게 문서를 찾는가? | 웹 검색 문제는 문제의 특성상 강화 학습과 밀접한 관련이 있다. 웹 검색 에이전트는 여러 웹 페이지를 링크를 따라 이동하며 목적하는 문서를 찾는다. 즉 각 웹 페이지는 상태(state), 웹 페이지 내부의 링크는 행동(action)에 각각 대응되고 목적하는 웹 페이지에 도달했을 경우 보상(reward)를 받는 것에 대응되게 된다. | |
강화 학습이란 무엇인가? | 강화 학습은 주어진 환경과의 상호 작용을 통하여 받는 보답의 합을 극대화하기 위한 각 상태에서의 최적행위 책략을 배우는 것이다. 강화 학습에서 사용되고 있는 agent 는 학습을 하는 개체로서, 행위(a)를 통해 환경과 상호 작용을 하며 환경으로부터 보답 신호를 받고, 환경 (environment)은 agent 가 상호 작용하는 것으로 agent 에 임의로 바뀌지 않는다. | |
엔트로피의 법칙이란 무엇인가? | 자연 현상은 관리를 제대로 하고자 하는 노력을 하지 않고 그대로 내버려 두면 모든 것이 잘 정돈되어 있던 질서상태에서 무질서한 상태로 진행된다. 이런 현상을 물리학적 용어로 엔트로피의 법칙이라고 부른다. |
김정인, 엔트로피를 이용한 다개체 로봇 시스템의 자율 그룹핑 방법에 관한 연구, 건국대학교 석사 논문, 2007.
차종환, 연속 상태 및 행위 공간에 대한 영역 Q-학습기법 연구, 석사학위논문, 2001.
김상헌, 정재영, 윤학수, 박민욱, 김과형 "강화학습을 사용한 실시간 이동 물체 추적에 관한 연구" 한국퍼지 및 지능 시스템학회 추계학술대회 학술발표논문집, 2003
권기덕, 효율적인 멀티 에이전트 강화학습을 위한 나이브베이지안 기반 상대 정책 모델, 박사학위논문,2008
이승준, 장병탁 "강화학습을 사용한 개인화된 웹 검색" 한국퍼지 및 지능시스템학회 학술발표논문집, 2001.
정태진, 강화학습을 이용한 웹 정보 검색, 서울대학교 석사 논문, 2002
Ron Kohavi, Dan Sommerfideld ''Feature Subset Selection using Wrapper Method: Overfitting and Dynamic Search Space Topology, AAAI, 1995
Ian H. Witten, Frank Eibe, "Data Mining: Practical Machine Learning Tools and Techniques", Morgan Kaufmann, 2000
C. E. Shannon, "A Mathematical Theory of Communications," Bell System Technical Journal, 1948, pp.623-656
장정호, 장병탁, 김영택, "최대 엔트로피 기반 문서 분류기 학습" 한국정보과학회 학술 발표논문집, 1999
Pang-Ning Tan, Michael Steinbach, Vipin Kumar, "Introduction to Datamining", Addison-Wesley, 2005
박성배, 장병탁 "최대 엔트로피 모델을 이용한 텍스트 단위화 학습" 한글 및 한국어정보처리학술대회, 2001
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.