ｎｅｕｒａｌｎｅｔｗｏｒｋｓ，ＤＮＮ）的机器学习模型。２０１３年

正在加载图片...

.790 智能系统学报第11卷 neural networks,DNN)的机器学习模型。2013年1 除了以上竞赛，还有各种世界范围内的人机大月，百度宣布成立“深度学习研究所”(institue of 战活动，这些竞赛活动极大地激发了人们的挑战热 deep learning,IDL)。在2015年10月5：0击败了情和创新精神，为社会培养了大量的科技精英，在促欧洲围棋冠军樊麾后，2016年1月，谷歌DeepMind 进了人工智能技术快速发展的同时，还产生了新的团队在自然杂志(Nature)上发表封面论文称，他们科研成果。研发出基于神经网络进行深度学习的人工智能围棋 3计算机博弈系统设计程序AlphaGo,能够在极其复杂的围棋游戏中战胜专家级人类选手[)。2016年3月，AlphaGo又以计算机博弈系统是指在特定规则下具有博弈能 4:1战胜世界围棋冠军李世石，在学术界产生了空力的智能系统。在设计系统时，需要考虑知识表示、前的影响，这标志着计算机博弈技术取得重大成功，着法产生、搜索与评估几个方面。是计算机博弈发展史上新的跃迁。典型的计算机博弈系统的核心架构设计如图1 2赛事与学术交流所示，可以划分为博弈平台和搜索引擎两大模块。其中，博弈平台主要负责界面显示、棋规判断、行棋由国际机器博弈协会(International Computer 过程控制、信息传递等]，在其设计过程中，通常考 Games Association,ICGA)组织的国际计算机博弈比虑通用性、易用性、健壮性、艺术性：博弈引擎主要负赛(Computer Olympiad,C0)每年一届，已经有了30 责知识学习、开（或残）局库设计[20,6]、棋局评估、博多年的历史。比赛项目包括中国象棋、六子棋、亚马弈树搜索、着法生成等。逊棋、围棋等，通过竞赛促进了世界范围内的计算机行博弈技术的发展。同时，ICGA还每年组织学术研讨信棋棋会，并出版ICGA季刊2,0]。传面判程从1969年开始，国际人工智能联合会议(Inter- 递示 national Joint Conference on Artificial Intelligence.IJ- CAI)每两年举行一次，ICAI是人工智能研究人员平台要素数字化建模前端：博弈平台最主要国际会议之一。通过学术交流，发表计算机博弈的最新研究成果[3-] 2006年8月，由中国人工智能学会首次主办中数据结构定义后端：搜索引擎国计算机博弈锦标赛，至今已举办10届。从2011 年开始，由中国人工智能学会与教育部高等学校计博算机类专业教学指导委员会共同主办全国大学生计局弈机弈法知算机博弈大赛暨全国锦标赛[36-7】，目前已举办6 面树识估搜展成习库届。这项赛事所设定的各项比赛，涉及计算机博弈开相关的知识库、博弈平台[38)、搜索引擎、神经网络」机器学习与局面评估[90]等多种技术，吸引了越来博弈控制策略越多的专家、学者与计算机博弈爱好者参与到计算机博弈相关研究中，为计算机博弈技术的交流与验图1计算机博弈系统典型架构证提供了一个公平、开放的平台。目前，竞赛项目涵 Fig.1 Typical architecture of computer game system 盖了多种类型的博弈：相对整个计算机博弈系统而言，后端搜索引擎 1)按参与人数划分，包括双人博弈（如中国是整个系统的核心部分，它是决定博弈胜负的关键，象棋、围棋)和多人博弈（如二打一扑克）：在搜索引擎的开发过程中，除了考虑与博弈平台的 2)按参与人对他人了解程度划分，包括完备信接口外，还要根据各个棋种的特点，选择合适的搜索息博弈]（如中国象棋、围棋、六子棋、亚马逊棋、苏算法和评估函数[4748】。拉卡尔塔棋等)和非完全信息博弈[24,44（如幻影围 4博奔树搜索技术棋、军棋、二打一扑克)： 3)按参与人之间有无合作划分，包括合作博弈 4.1博弈树复杂度 (如桥牌])与非合作博弈（如中国象棋）。博弈树是由树枝和节点构成单向无环图，如图 2所示。博弈树的节点对应于某一个棋局，其分支ｎｅｕｒａｌｎｅｔｗｏｒｋｓ，ＤＮＮ）的机器学习模型。２０１３年１月，百度宣布成立“ 深度学习研究所” （ｉｎｓｔｉｔｕｅｏｆｄｅｅｐｌｅａｒｎｉｎｇ，ＩＤＬ）。在２０１５年１０月５ ∶ ０击败了欧洲围棋冠军樊麾后，２０１６年１月，谷歌ＤｅｅｐＭｉｎｄ团队在自然杂志（Ｎａｔｕｒｅ）上发表封面论文称，他们研发出基于神经网络进行深度学习的人工智能围棋程序ＡｌｐｈａＧｏ，能够在极其复杂的围棋游戏中战胜专家级人类选手［３］。２０１６年３月，ＡｌｐｈａＧｏ又以４ ∶ １战胜世界围棋冠军李世石，在学术界产生了空前的影响，这标志着计算机博弈技术取得重大成功，是计算机博弈发展史上新的跃迁。２赛事与学术交流由国际机器博弈协会（ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｍｐｕｔｅｒＧａｍｅｓＡｓｓｏｃｉａｔｉｏｎ，ＩＣＧＡ）组织的国际计算机博弈比赛（ＣｏｍｐｕｔｅｒＯｌｙｍｐｉａｄ，ＣＯ）每年一届，已经有了３０多年的历史。比赛项目包括中国象棋、六子棋、亚马逊棋、围棋等，通过竞赛促进了世界范围内的计算机博弈技术的发展。同时，ＩＣＧＡ还每年组织学术研讨会，并出版ＩＣＧＡ季刊［２７，３０－３２］。从１９６９年开始，国际人工智能联合会议（Ｉｎｔｅｒ⁃ ｎａｔｉｏｎａｌＪｏｉｎｔＣｏｎｆｅｒｅｎｃｅｏｎＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ，ＩＪ⁃ ＣＡＩ）每两年举行一次，ＩＪＣＡＩ是人工智能研究人员最主要国际会议之一。通过学术交流，发表计算机博弈的最新研究成果［３３－３５］。２００６年８月，由中国人工智能学会首次主办中国计算机博弈锦标赛，至今已举办１０届。从２０１１年开始，由中国人工智能学会与教育部高等学校计算机类专业教学指导委员会共同主办全国大学生计算机博弈大赛暨全国锦标赛［３６－３７］，目前已举办６届。这项赛事所设定的各项比赛，涉及计算机博弈相关的知识库、博弈平台［３８］、搜索引擎、神经网络、机器学习与局面评估［３９－４０］等多种技术，吸引了越来越多的专家、学者与计算机博弈爱好者参与到计算机博弈相关研究中，为计算机博弈技术的交流与验证提供了一个公平、开放的平台。目前，竞赛项目涵盖了多种类型的博弈：１）按参与人数划分，包括双人博弈［４１］（如中国象棋、围棋）和多人博弈（如二打一扑克［４２］）；２）按参与人对他人了解程度划分，包括完备信息博弈［４３］（如中国象棋、围棋、六子棋、亚马逊棋、苏拉卡尔塔棋等）和非完全信息博弈［２４，４４］（如幻影围棋、军棋、二打一扑克）；３）按参与人之间有无合作划分，包括合作博弈（如桥牌［４５］）与非合作博弈（如中国象棋）。除了以上竞赛，还有各种世界范围内的人机大战活动，这些竞赛活动极大地激发了人们的挑战热情和创新精神，为社会培养了大量的科技精英，在促进了人工智能技术快速发展的同时，还产生了新的科研成果。３计算机博弈系统设计计算机博弈系统是指在特定规则下具有博弈能力的智能系统。在设计系统时，需要考虑知识表示、着法产生、搜索与评估几个方面。典型的计算机博弈系统的核心架构设计如图１所示，可以划分为博弈平台和搜索引擎两大模块。其中，博弈平台主要负责界面显示、棋规判断、行棋过程控制、信息传递等［３８］，在其设计过程中，通常考虑通用性、易用性、健壮性、艺术性；博弈引擎主要负责知识学习、开（或残）局库设计［２０，４６］、棋局评估、博弈树搜索、着法生成等。图１计算机博弈系统典型架构Ｆｉｇ．１Ｔｙｐｉｃａｌａｒｃｈｉｔｅｃｔｕｒｅｏｆｃｏｍｐｕｔｅｒｇａｍｅｓｙｓｔｅｍ相对整个计算机博弈系统而言，后端搜索引擎是整个系统的核心部分，它是决定博弈胜负的关键，在搜索引擎的开发过程中，除了考虑与博弈平台的接口外，还要根据各个棋种的特点，选择合适的搜索算法和评估函数［４７－４８］。４博弈树搜索技术４．１博弈树复杂度博弈树是由树枝和节点构成单向无环图，如图２所示。博弈树的节点对应于某一个棋局，其分支 ·７９０· 智能系统学报第１１卷

<<向上翻页向下翻页>>

点击下载：【综述】计算机博弈的研究与发展