正在加载图片...
Motivation 目前已有大量的研究从离线学习中发现泛化能力,相比之下 很少有人关注在线实时搜索时如何利用算法泛化带来的好处。 这篇论文提出了记忆增强的MCTS算法,为利用在线泛化 提供了一个不一样的方法。 作者设计了一个记忆结构(memory), 每一个入口包含某 一个特定状态的信息,作为构建在线值近似的基础。论文从 理论和实践(围棋游戏实验)上证实了该基于记忆的框架对 MCTS性能的提升.Motivation • 目前已有大量的研究从离线学习中发现泛化能力,相比之下 很少有人关注在线实时搜索时如何利用算法泛化带来的好处。 这篇论文提出了记忆增强的 MCTS 算法,为利用在线泛化 提供了一个不一样的方法。 • 作者设计了一个记忆结构(memory),每一个入口包含某 一个特定状态的信息,作为构建在线值近似的基础。论文从 理论和实践(围棋游戏实验)上证实了该基于记忆的框架对 MCTS 性能的提升
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有