

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

삼목 게임을 위해 개선된 몬테카를로 트리탐색 알고리즘
Enhanced strategic Monte-Carlo Tree Search algorithm to play the game of Tic-Tac-Toe 원문보기

한국게임학회 논문지 = Journal of Korea Game Society, v.16 no.4, 2016년, pp.79 - 86  

이병두 (세한대학교 체육학부 바둑학과)

AI-Helper 아이콘AI-Helper

몬테카를로 트리탐색은 최대우선탐색 알고리즘이며, 많은 게임 특히 바둑 게임에 성공적으로 적용되어 왔다. 삼목 게임에서 MCTS 간의 대국을 통해 성능을 평가하고자 했다. 첫 번째 대국자는 항상 두 번째 대국자에 비해 압도적인 우위를 보였으며, 최선의 게임 결과가 무승부가 됨에도 불구하고 첫 번째 대국자가 두 번째 대국자에 비해 우월한 이유를 찾고자 했다. MCTS는 반복적인 무작위 샘플링을 기반으로 하는 통계적 알고리즘이기 때문에, 특히 두 번째 대국자를 위해 전략을 요하는 시급한 문제를 적절히 대처하지 못한다. 이를 위해 전략적 MCTS(S-MCTS)를 제안하며, S-MCTS는 결코 삼목 게임에서 지지 않는다는 것을 보였다.

Abstract AI-Helper 아이콘AI-Helper

Monte-Carlo Tree Search(MCTS) is a best-first tree search algorithm and has been successfully applied to various games, especially to the game of Go. We evaluate the performance of MCTS playing against each other in the game of Tic-Tac-Toe. It reveals that the first player always has an overwhelming...


AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 인공지능 분야에서 이러한 위대한 역사를 만들어 낸 MCTS의 적극적인 활용을 위해, 저자는 소규모의 게임인 삼목 게임을 통해 순수 MCTS의 문제점과 이에 대한 대처 방안을 제시하고자 한다.
본문요약 정보가 도움이 되었나요?


핵심어 질문 논문에서 추출한 답변
게임트리탐색에서 최적의 해를 구하는 데에 있어 고려해야 할 사항은 무엇인가? 대부분의 게임프로그래밍은 평가함수(evaluation function)를 이용한 게임트리탐색를 활용한다[1,2]. 게임트리탐색에서의 최적의 해를 구하는 데에 있어 고려해야 할 사항으로는 게임트리의 분기수와 깊이의 규모에 있다. 분기수와 깊이가 비교적 작은 경우에는 최소최대탐색 또는 알파-베타 가지치기를 수행하여 최적의 해를 구할 수 있으나, 바둑과 같이 분기수와 깊이가 매우 큰 경우에는 이를 이용한 전역탐색(exhaustive search)을 수행할 수가 없어 MCTS를 활용해야 한다[1,2,13].
삼목 게임은 무엇인가? 삼목 게임(Tic-Tac-Toe)은 전 세계적으로 잘 알려진 게임 중의 하나로 두 대국자가 3⨯3칸으로 된 종이 위에 ☓와 ◯를 번갈아 연필로 써서 가로, 세로 또는 대각선상에 동일한 모양이 연속하여 3개가 형성되면 이기는 게임이다[12]. 참고로 [Fig.
질의응답 정보가 도움이 되었나요?

참고문헌 (18)

  1. B.D. Lee, D.S. Park and Y.W. Choi, "The UCT algorithm applied to find the best first move in the game of Tic-Tac-Toe", Journal of Korea Game Society, Vol. 15, No. 5, pp. 109-118, 2015. 

  2. B.D. Lee, "Competition between MCTS and UCT in the game of Tic-Tac-Toe", Journal of Korean Society for Computer Game, Vol. 29, No. 1, pp. 1-6, 2016. 

  3. B.D. Lee, "Analysis of Tic-Tac-Toe Game Strategies using Genetic Algorithm", Journal of Korea Game Society, Vol. 14, No. 6, pp. 39-48, 2014. 

  4. B.D. Lee, "Monte-Carlo Tree Search Applied to the Game of Tic-Tac-Toe", Journal of Korea Game Society, Vol. 14, No. 3, pp. 47-54, 2014. 

  5. D. Silver et al., "Mastering the game of Go with deep neural networks and tree search", Journal of Nature, Vol. 529, Issue 7587, pp. 484-489, 2016. 

  6. P.S. Jang "Overseas Innovation Trend", from http://www.stepi.re.kr, 2016. 

  7. B.D. Lee and Y.W. Choi, "The best move sequence in playing Tic-Tac-Toe game", Journal of The Korean Society for Computer Game, Vol. 27, No. 3, pp. 11-16, 2014. 

  8. B.D. Lee, "Evolutionary neural network model for recognizing strategic fitness of a finished Tic-Tac-Toe game", Journal of Korean Society for Computer Game, Vol. 28, No. 2, pp. 95-101, 2015. 

  9. S. Gelly, M. Schoenauer, M. Sebag, O. Teytaud, L. Kocsis, D. Silver and C. Szepesvari, "The Grand Challenge of Computer Go: Monte Carlo Tree Search and Extensions", Communications of the ACM, Vol. 55, No. 3, pp. 106-113, 2012. 

  10. G. Chaslot, "Monte-Carlo Tree Search", Ph.D. dissertation, University of Masstricht, 2010. 

  11. Wikipedia, "Computer Go", from http://en.wikipedia.org/wiki/Computer_Go, 2016. 

  12. Wikipedia, "Tic-Tac-Toe", from http://en.wikipedia.org/wiki/Tic-Tac-Toe, 2016. 

  13. A.A.J van der Kleij, "Monte Carlo Tree Search and Opponent Modeling through Player Clustering in no-limit Texas Hold'en Poker", Master thesis, University of Groningen, 2010. http://en.wikipedia.org/wiki/Tic-Tac-Toe, 2016. 

  14. N. Sephton, P.I. Cowling, E. Powley and N.H. Slaven, "Heuristic Move Pruning in Monte Carlo Tree Search for the Strategic Card Game Lords of War", In Computational Intelligence and Games (CIG) of IEEE, pp. 1-7, 2014. 

  15. T. Pepels, "Novel Selection Methods for Monte-Carlo Tree Search", Master thesis, University of Masstricht, 2014. 

  16. D. Brand and S. Kroon, "Sample Evaluation for Action Selection in Monte Carlo Tree Search", from http://dl.acm.org/citation.cfm?doid2664591.2664612, 2016. 

  17. Y. Wang and S. Gelly, "Modification of UCT and sequence-like simulations for Monte-Carlo Go", from http://dept.stat.lsa.umich.edu/-yizwang/publications/wang07modifications.pdf, 2016. 

  18. B.D. Lee, "Implementation of robust Tic-Tac-Toe game player, using enhanced Monte-Carlo algorithm", Journal of Korean Society for Computer Game, Vol. 28, No. 3, pp. 135-141, 2015. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형


Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트
