Node Evaluation = # Crucial chain’s F_中国高校课件下载中心

正在加载图片...

·86 智能系统学报第2卷 Node Evaluation =Crucial chain's First lib- 小节点的最差可能值.使用这些值，很多分支可以被 erties *4+#Crucial chain's Second liberties 裁减掉 1.4终止状态测试在儿子节点被最好排序的情况下，Alpha-Beta 算法中设定一个节点评估值的上限来进行终止搜索为求解问题需要访问的节点数目约为w2,w 状态测试.如果节点的评估值大于这个上限，则目标是平均候选着法的数目，d是搜索的深度.在最坏情棋块被认为可以逃脱.如果目标棋块可以被直接吃况下，为了求解它需要搜索整个博弈树掉或者被征子吃掉则被认为可以吃掉文中使用Alpha-Beta搜索及迭代加深、置换表.每次迭代深度增加为2.关于置换表使用Zobrist 2 博弈树搜索算法哈希161和线性探查对于二人、零和、完备信息的棋类游戏，例如围几种常用的用于博弈树搜索算法比较的指标棋、象棋、国际象棋和跳棋，博弈树算法对构建一个有：CPU时间、访问的叶子节点数、访问的所有节点强大的博弈程序是关键的.博弈树搜索的目标是要数.文中使用访问的所有节点数来衡量算法的表找到极大极小博弈树或者与和树的最佳值以及最佳现着法序列.一般博弈树非常大以至于不能被当前的这里使用Kano围棋系列的第3册中的吃子问计算机所求解.降低博弈树大小的策略包括缩小候题来检验算法效果.每一个问题的搜索时间被限制选着法的数目以缩小展开因子、当搜索到某一深度在200s内.表1包含了Alpha-Beta搜索不使用置时使用评估函数以及使用搜索路径选择策略.选择换表和使用置换表的测试结果候选着法以及使用评估函数很大程度上取决于领域使用置换表的算法表现比不使用置换表的算法知识.搜索路径选择策略则一般与领域知识无关.深表现好：使用的时间较少、访问的节点较少，将节点度优先搜索和最佳优先搜索是最主要的2种搜索路的最佳值存储在置换表中可以避免对同样的局面重径选择策略新计算，在迭代加深中使用置换表也可以帮助候选 AlpharBeta搜索是深度优先搜索算法而且是着法排序。当前博弈游戏程序最广泛使用的博弈树搜索算候选着法排序的质量对Alpha-Beta搜索的效法io..候选着法的排序对于Alpha-Beta搜索的率是关键的.但对于不同问题很难给出统一的评估效率是关键的.Alpha-Beta搜索有很多扩展，其中函数去得到候选着法的最佳排序.进一步的工作可包括迭代加深、置换表、历史启发函数等，大多数用以使用模式数据库去帮助候选着法排序于得到更好的候选着法排序，使用迭代加深的A: 结果发现Alpha-Beta搜索不能解决的问题主 pha-Beta搜索可以得到某一深度的最优值，这可以要由于以下3个原因：作为限制时间搜索下的近似解.Alpha-Beta搜索的 I)在时间限制下Alpha-Beta搜索很难搜索到缺点是很难搜索到很深的深度很深的深度.对于那些需要很深深度搜索才能求解 pn搜索是最佳优先搜索算法.对于非均衡树的的问题，Alpha-Beta搜索一般用光时间从而失败. 求解，pn搜索是非常强大的2].pn搜索需要将整个 2)候选着法没有包括所有可能着法：正确着法搜索树保存在内存中，所以内存消耗很大.近年来，缺失出现了一些pn搜索的深度优先搜索的变体，例如 3)解决此问题需要其他知识如连接和死活知 pn*l、df-pn和df-pn+.使用proof number 识和disproof number的阈值，这些算法可以以深度优先的方式去搜索博弈树，但是所展开的博弈树与pn proof-number搜索搜索是一样的.这些深度优先的变体可以减少内存 pn搜索是最佳优先搜索算法.对于非均衡树的的使用，但是效果与pn搜索相似求解pn搜索是非常强大的.pn搜索的思想是总是目前Alpha-Beta搜索及其扩展仍然是最广泛展开那些用最小代价就可以证明或者否证与或博弈使用的博弈树搜索算法山.pn搜索及其变体变得树的节点2.pn搜索将节点分为2种：与节点和或越来越流行口节点.在每个与节点努力去否证节点，在每个或节点努力去证明节点.在每个节点上使用2个数值： 3 Alpha-Beta搜索 proof number最少需要展开的叶子节点去证明 Alpha-Beta搜索的思想是利用Alpha值此节点的数目；disproof number最少需要展开对于极大节点的最差可能值和Beta值对于极的叶子节点去否证此节点的数目.对于博弈树有时 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.netNode Evaluation = # Crucial chain’s First lib2 erties 3 4 + # Crucial chain’s Second liberties 114 终止状态测试算法中设定一个节点评估值的上限来进行终止状态测试. 如果节点的评估值大于这个上限 ,则目标棋块被认为可以逃脱. 如果目标棋块可以被直接吃掉或者被征子吃掉则被认为可以吃掉. 2 博弈树搜索算法对于二人、零和、完备信息的棋类游戏 ,例如围棋、象棋、国际象棋和跳棋 ,博弈树算法对构建一个强大的博弈程序是关键的. 博弈树搜索的目标是要找到极大极小博弈树或者与和树的最佳值以及最佳着法序列. 一般博弈树非常大以至于不能被当前的计算机所求解. 降低博弈树大小的策略包括缩小候选着法的数目以缩小展开因子、当搜索到某一深度时使用评估函数以及使用搜索路径选择策略. 选择候选着法以及使用评估函数很大程度上取决于领域知识. 搜索路径选择策略则一般与领域知识无关. 深度优先搜索和最佳优先搜索是最主要的 2 种搜索路径选择策略. Alp ha2Beta 搜索是深度优先搜索算法而且是当前博弈游戏程序最广泛使用的博弈树搜索算法[10 - 11 ] . 候选着法的排序对于 Alp ha2Beta 搜索的效率是关键的. Alp ha2Beta 搜索有很多扩展 ,其中包括迭代加深、置换表、历史启发函数等 ,大多数用于得到更好的候选着法排序. 使用迭代加深的 Al2 p ha2Beta 搜索可以得到某一深度的最优值 ,这可以作为限制时间搜索下的近似解. Alp ha2Beta 搜索的缺点是很难搜索到很深的深度. p n 搜索是最佳优先搜索算法. 对于非均衡树的求解 ,p n 搜索是非常强大的[12 ] . p n 搜索需要将整个搜索树保存在内存中 ,所以内存消耗很大. 近年来 , 出现了一些 p n 搜索的深度优先搜索的变体 ,例如 p n 3 [13 ] 、df - p n 和 df - p n + [14 ] . 使用 proof number 和 disproof number 的阈值 ,这些算法可以以深度优先的方式去搜索博弈树 ,但是所展开的博弈树与 p n 搜索是一样的. 这些深度优先的变体可以减少内存的使用 ,但是效果与 p n 搜索相似. 目前 Alp ha2Beta 搜索及其扩展仍然是最广泛使用的博弈树搜索算法[11 ] . p n 搜索及其变体变得越来越流行[1 ] . 3 Alp ha2Beta 搜索 Alp ha2Beta 搜索的思想是利用 Alp ha 值 ——— 对于极大节点的最差可能值和 Beta 值 ———对于极小节点的最差可能值. 使用这些值 ,很多分支可以被裁减掉[ 15 ] . 在儿子节点被最好排序的情况下 ,Alp ha2Beta 搜索为求解问题需要访问的节点数目约为 w d/ 2 , w 是平均候选着法的数目 , d 是搜索的深度. 在最坏情况下 ,为了求解它需要搜索整个博弈树. 文中使用 Alp ha2Beta 搜索及迭代加深、置换表. 每次迭代深度增加为 2. 关于置换表使用 Zobrist 哈希[16 ]和线性探查. 几种常用的用于博弈树搜索算法比较的指标有 :CPU 时间、访问的叶子节点数、访问的所有节点数[17 ] . 文中使用访问的所有节点数来衡量算法的表现. 这里使用 Kano 围棋系列的第 3 册中的吃子问题来检验算法效果. 每一个问题的搜索时间被限制在 200 s 内. 表 1 包含了 Alp ha2Beta 搜索不使用置换表和使用置换表的测试结果. 使用置换表的算法表现比不使用置换表的算法表现好 :使用的时间较少、访问的节点较少. 将节点的最佳值存储在置换表中可以避免对同样的局面重新计算. 在迭代加深中使用置换表也可以帮助候选着法排序. 候选着法排序的质量对 Alp ha2Beta 搜索的效率是关键的. 但对于不同问题很难给出统一的评估函数去得到候选着法的最佳排序. 进一步的工作可以使用模式数据库去帮助候选着法排序. 结果发现 Alp ha2Beta 搜索不能解决的问题主要由于以下 3 个原因 : 1) 在时间限制下 Alp ha2Beta 搜索很难搜索到很深的深度. 对于那些需要很深深度搜索才能求解的问题 ,Alp ha2Beta 搜索一般用光时间从而失败. 2) 候选着法没有包括所有可能着法 :正确着法缺失. 3) 解决此问题需要其他知识如连接和死活知识. 4 proof2number 搜索 p n 搜索是最佳优先搜索算法. 对于非均衡树的求解 p n 搜索是非常强大的. p n 搜索的思想是总是展开那些用最小代价就可以证明或者否证与或博弈树的节点[12 ] . p n 搜索将节点分为 2 种 :与节点和或节点. 在每个与节点努力去否证节点 ,在每个或节点努力去证明节点. 在每个节点上使用 2 个数值 : proof number ———最少需要展开的叶子节点去证明此节点的数目 ; disproof number ———最少需要展开的叶子节点去否证此节点的数目. 对于博弈树有时 ·86 · 智能系统学报第 2 卷

<<向上翻页向下翻页>>

点击下载：人工智能基础：使用不同的博弈树搜索算法解决计算机围棋的吃子问题