正在加载图片...
.790 智能系统学报 第11卷 neural networks,DNN)的机器学习模型。2013年1 除了以上竞赛,还有各种世界范围内的人机大 月,百度宣布成立“深度学习研究所”(institue of 战活动,这些竞赛活动极大地激发了人们的挑战热 deep learning,IDL)。在2015年10月5:0击败了 情和创新精神,为社会培养了大量的科技精英,在促 欧洲围棋冠军樊麾后,2016年1月,谷歌DeepMind 进了人工智能技术快速发展的同时,还产生了新的 团队在自然杂志(Nature)上发表封面论文称,他们 科研成果。 研发出基于神经网络进行深度学习的人工智能围棋 3计算机博弈系统设计 程序AlphaGo,能够在极其复杂的围棋游戏中战胜 专家级人类选手[)。2016年3月,AlphaGo又以 计算机博弈系统是指在特定规则下具有博弈能 4:1战胜世界围棋冠军李世石,在学术界产生了空 力的智能系统。在设计系统时,需要考虑知识表示、 前的影响,这标志着计算机博弈技术取得重大成功, 着法产生、搜索与评估几个方面。 是计算机博弈发展史上新的跃迁。 典型的计算机博弈系统的核心架构设计如图1 2赛事与学术交流 所示,可以划分为博弈平台和搜索引擎两大模块。 其中,博弈平台主要负责界面显示、棋规判断、行棋 由国际机器博弈协会(International Computer 过程控制、信息传递等],在其设计过程中,通常考 Games Association,ICGA)组织的国际计算机博弈比 虑通用性、易用性、健壮性、艺术性:博弈引擎主要负 赛(Computer Olympiad,C0)每年一届,已经有了30 责知识学习、开(或残)局库设计[20,6]、棋局评估、博 多年的历史。比赛项目包括中国象棋、六子棋、亚马 弈树搜索、着法生成等。 逊棋、围棋等,通过竞赛促进了世界范围内的计算机 行 博弈技术的发展。同时,ICGA还每年组织学术研讨 信 棋 棋 会,并出版ICGA季刊2,0]。 传 面 判 程 从1969年开始,国际人工智能联合会议(Inter- 递 示 national Joint Conference on Artificial Intelligence.IJ- CAI)每两年举行一次,ICAI是人工智能研究人员 平台要素数字化建模 前端: 博弈平台 最主要国际会议之一。通过学术交流,发表计算机 博弈的最新研究成果[3-] 2006年8月,由中国人工智能学会首次主办中 数据结构定义 后端: 搜索引擎 国计算机博弈锦标赛,至今已举办10届。从2011 年开始,由中国人工智能学会与教育部高等学校计 博 算机类专业教学指导委员会共同主办全国大学生计 局 弈 机 弈 法 知 算机博弈大赛暨全国锦标赛[36-7】,目前已举办6 面 树 识 估 搜 展 成 习 库 届。这项赛事所设定的各项比赛,涉及计算机博弈 开 相关的知识库、博弈平台[38)、搜索引擎、神经网络」 机器学习与局面评估[90]等多种技术,吸引了越来 博弈控制策略 越多的专家、学者与计算机博弈爱好者参与到计算 机博弈相关研究中,为计算机博弈技术的交流与验 图1计算机博弈系统典型架构 证提供了一个公平、开放的平台。目前,竞赛项目涵 Fig.1 Typical architecture of computer game system 盖了多种类型的博弈: 相对整个计算机博弈系统而言,后端搜索引擎 1)按参与人数划分,包括双人博弈(如中国 是整个系统的核心部分,它是决定博弈胜负的关键, 象棋、围棋)和多人博弈(如二打一扑克): 在搜索引擎的开发过程中,除了考虑与博弈平台的 2)按参与人对他人了解程度划分,包括完备信 接口外,还要根据各个棋种的特点,选择合适的搜索 息博弈](如中国象棋、围棋、六子棋、亚马逊棋、苏 算法和评估函数[4748】。 拉卡尔塔棋等)和非完全信息博弈[24,44(如幻影围 4博奔树搜索技术 棋、军棋、二打一扑克): 3)按参与人之间有无合作划分,包括合作博弈 4.1博弈树复杂度 (如桥牌])与非合作博弈(如中国象棋)。 博弈树是由树枝和节点构成单向无环图,如图 2所示。博弈树的节点对应于某一个棋局,其分支neural networks,DNN) 的机器学习模型。 2013 年 1 月,百度宣布成立“ 深度学习研究所” ( institue of deep learning,IDL)。 在 2015 年 10 月 5 ∶ 0 击败了 欧洲围棋冠军樊麾后,2016 年 1 月,谷歌 DeepMind 团队在自然杂志(Nature)上发表封面论文称,他们 研发出基于神经网络进行深度学习的人工智能围棋 程序 AlphaGo,能够在极其复杂的围棋游戏中战胜 专家级人类选手[3] 。 2016 年 3 月, AlphaGo 又以 4 ∶ 1战胜世界围棋冠军李世石,在学术界产生了空 前的影响,这标志着计算机博弈技术取得重大成功, 是计算机博弈发展史上新的跃迁。 2 赛事与学术交流 由国际机器博弈协会 ( International Computer Games Association,ICGA)组织的国际计算机博弈比 赛(Computer Olympiad,CO)每年一届,已经有了 30 多年的历史。 比赛项目包括中国象棋、六子棋、亚马 逊棋、围棋等,通过竞赛促进了世界范围内的计算机 博弈技术的发展。 同时,ICGA 还每年组织学术研讨 会,并出版 ICGA 季刊[27,30-32] 。 从 1969 年开始,国际人工智能联合会议(Inter⁃ national Joint Conference on Artificial Intelligence,IJ⁃ CAI)每两年举行一次,IJCAI 是人工智能研究人员 最主要国际会议之一。 通过学术交流,发表计算机 博弈的最新研究成果[33-35] 。 2006 年 8 月,由中国人工智能学会首次主办中 国计算机博弈锦标赛,至今已举办 10 届。 从 2011 年开始,由中国人工智能学会与教育部高等学校计 算机类专业教学指导委员会共同主办全国大学生计 算机博弈大赛暨全国锦标赛[36-37 ] ,目前已举办 6 届。 这项赛事所设定的各项比赛,涉及计算机博弈 相关的知识库、博弈平台[38] 、搜索引擎、神经网络、 机器学习与局面评估[39-40]等多种技术,吸引了越来 越多的专家、学者与计算机博弈爱好者参与到计算 机博弈相关研究中,为计算机博弈技术的交流与验 证提供了一个公平、开放的平台。 目前,竞赛项目涵 盖了多种类型的博弈: 1)按参与人数划分,包括双人博弈[41] (如中国 象棋、围棋)和多人博弈(如二打一扑克[42] ); 2)按参与人对他人了解程度划分,包括完备信 息博弈[43] (如中国象棋、围棋、六子棋、亚马逊棋、苏 拉卡尔塔棋等) 和非完全信息博弈[24,44] (如幻影围 棋、军棋、二打一扑克); 3)按参与人之间有无合作划分,包括合作博弈 (如桥牌[45] )与非合作博弈(如中国象棋)。 除了以上竞赛,还有各种世界范围内的人机大 战活动,这些竞赛活动极大地激发了人们的挑战热 情和创新精神,为社会培养了大量的科技精英,在促 进了人工智能技术快速发展的同时,还产生了新的 科研成果。 3 计算机博弈系统设计 计算机博弈系统是指在特定规则下具有博弈能 力的智能系统。 在设计系统时,需要考虑知识表示、 着法产生、搜索与评估几个方面。 典型的计算机博弈系统的核心架构设计如图 1 所示,可以划分为博弈平台和搜索引擎两大模块。 其中,博弈平台主要负责界面显示、棋规判断、行棋 过程控制、信息传递等[38] ,在其设计过程中,通常考 虑通用性、易用性、健壮性、艺术性;博弈引擎主要负 责知识学习、开(或残)局库设计[20,46] 、棋局评估、博 弈树搜索、着法生成等。 图 1 计算机博弈系统典型架构 Fig.1 Typical architecture of computer game system 相对整个计算机博弈系统而言,后端搜索引擎 是整个系统的核心部分,它是决定博弈胜负的关键, 在搜索引擎的开发过程中,除了考虑与博弈平台的 接口外,还要根据各个棋种的特点,选择合适的搜索 算法和评估函数[47-48] 。 4 博弈树搜索技术 4.1 博弈树复杂度 博弈树是由树枝和节点构成单向无环图,如图 2 所示。 博弈树的节点对应于某一个棋局,其分支 ·790· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有