正在加载图片...
背景介绍 MCTS: ·选举selection)是根据当前获得所 BaCK-PF008B8T16 有子步骤的统计结果,选择一个 最优的子步骤。 Select tne pest action ang reture 扩展(expansion)在当前获得的统 计结果不足以计算出下一个步骤 时,随机选择一个子步骤。 模拟(simulation)模拟游戏,进入 下一步。 ingry.Stay Foolis 反向传播Back-Propagation)根据 游戏结束的结果,计算对应路径 上统计记录的值。背景介绍 MCTS: • 选举(selection)是根据当前获得所 有子步骤的统计结果,选择一个 最优的子步骤。 • 扩展(expansion)在当前获得的统 计结果不足以计算出下一个步骤 时,随机选择一个子步骤。 • 模拟(simulation)模拟游戏,进入 下一步。 • 反向传播(Back-Propagation)根据 游戏结束的结果,计算对应路径 上统计记录的值
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有