【智能系统】竞技二打一游戏中同等牌力的研究

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：3.99MB

第16卷第3期智能系统学报 Vol.16 No.3 2021年5月 CAAI Transactions on Intelligent Systems May 2021 D0L:10.11992tis.202007005 竞技二打一游戏中同等牌力的研究李淑琴只，陈子鹏2，郑蓝舟3，孟坤2 (1.北京信息科技大学计算机学院，北京100101；2.北京信息科技大学感知与计算智能联合实验室，北京 100101:3.微智娱（北京）科技有限公司，北京100101) 摘要：全国竞技二打一扑克锦标赛是国家体育总局棋牌运动管理中心推出的新兴项目，比赛采用复式赛赛制，然而这种赛制存在无法杜绝线上比赛作弊的问题，为此提出用同等牌力赛制来代替复式赛制进行比赛的设想。本文主要针对如何判定和选取具有同等牌力的初始手牌进行研究，提出用等级难度评估指标来计算初始手牌的难度，初始手牌难度相近的牌认定为同等牌力，并给出了同等牌力的选取方法：为保证一副牌所得等级难度评估指标的可靠性，提出用多个不同水平的“二打一AI程序”来代替真人打牌产生牌谱的方法。实验证明了同等牌力生成方法的有效性，本文提出的同等牌力方法应用于比赛是可行的。关键词：计算机博弈；竞技二打一：同等牌力：等级难度：扑克锦标赛：手牌：神经网络；人工智能中图分类号：TP18文献标志码：A 文章编号：1673-4785(2021)03-0466-08 中文引用格式：李淑琴，陈子鹏，郑蓝舟，等.竞技二打一游戏中同等牌力的研究.智能系统学报，2021,16(3)：466-473. 英文引用格式：LIShuqin,CHEN Zipeng,.ZHENG Lanzhou,,ctal.Research on the equal card force competition system of compet.- itive two against one game[J].CAAI transactions on intelligent systems,2021,16(3):466-473. Research on the equal card force competition system of competitive two against one game LI Shuqin,CHEN Zipeng2,ZHENG Lanzhou2,MENG Kun2 (1.School of Computer Science,Beijing Information Science&Technology University,Beijing 100101,China;,2.Sensing &Com- putational Intelligence Joint Lab,Beijing Information Science&Technology University,Beijing 100101,China;3.WEIZHIYU (Beijing)Technology co.,LTd.,Beijing 100101,China) Abstract:The General Administration of Sport of China launched a new project that uses a double competition system, namely,the National Competitive Doudizhu(Two-on-One)Poker Tournament;however,this system does not eliminate online cheating.As a remedy,the idea of using the equal card force competition system to replace the double competi- tion system has been proposed.This paper focuses mainly on how to judge and select the initial hand with equal card force,suggesting the evaluation index of grade difficulty as a method of measuring the difficulty of the initial hand.This system offers a way to select cards of equal card force.Cards of similar grade difficulty in the initial hand are con- sidered to have equal card force.To ensure the reliability of the resultant evaluation of a deck of cards,this paper pro- poses an innovative "Doudizhu AI program"with different levels as an alternative.The validity of this method is veri- fied by experiments.It is feasible to apply this method in competitions. Keywords:computer game;competitive two against one game;the equal card force;grade difficulty;poker champion- ship;cards in hand;neural network;artificial intelligence 国家体育总局棋牌运动管理中心以“创新、协国民素质与人民健康水平为发展目标，提出了“传统调、绿色、开放、共享”的发展理念为指导，以提升棋牌项目趣味化”和“趣味棋牌项目竞技化”的重收稿日期：2020-07-03. 要发展战略。在巩固传统五棋一牌项目（围棋基金项目：北京信息科技大学科技项目(5211910927,5121911019. KM201911232002). 象棋、国际象棋、国际跳棋阿、五子棋切、桥牌例通信作者：李淑琴.E-mail:lishugin de@126.com 基础的同时，针对趣味棋牌竞技化的发展战略

DOI: 10.11992/tis.202007005 竞技二打一游戏中同等牌力的研究李淑琴1,2，陈子鹏1,2，郑蓝舟2,3，孟坤1,2 （1. 北京信息科技大学计算机学院，北京 100101; 2. 北京信息科技大学感知与计算智能联合实验室，北京 100101; 3. 微智娱 (北京) 科技有限公司，北京 100101）摘要：全国竞技二打一扑克锦标赛是国家体育总局棋牌运动管理中心推出的新兴项目，比赛采用复式赛赛制，然而这种赛制存在无法杜绝线上比赛作弊的问题，为此提出用同等牌力赛制来代替复式赛制进行比赛的设想。本文主要针对如何判定和选取具有同等牌力的初始手牌进行研究，提出用等级难度评估指标来计算初始手牌的难度，初始手牌难度相近的牌认定为同等牌力，并给出了同等牌力的选取方法；为保证一副牌所得等级难度评估指标的可靠性，提出用多个不同水平的“二打一 AI 程序”来代替真人打牌产生牌谱的方法。实验证明了同等牌力生成方法的有效性，本文提出的同等牌力方法应用于比赛是可行的。关键词：计算机博弈；竞技二打一；同等牌力；等级难度；扑克锦标赛；手牌；神经网络；人工智能中图分类号：TP18 文献标志码：A 文章编号：1673−4785(2021)03−0466−08 中文引用格式：李淑琴, 陈子鹏, 郑蓝舟, 等. 竞技二打一游戏中同等牌力的研究 [J]. 智能系统学报, 2021, 16(3): 466–473. 英文引用格式：LI Shuqin, CHEN Zipeng, ZHENG Lanzhou, et al. Research on the equal card force competition system of competitive two against one game[J]. CAAI transactions on intelligent systems, 2021, 16(3): 466–473. Research on the equal card force competition system of competitive two against one game LI Shuqin1,2 ，CHEN Zipeng1,2 ，ZHENG Lanzhou2,3 ，MENG Kun1,2 (1. School of Computer Science, Beijing Information Science & Technology University, Beijing 100101, China; 2. Sensing & Computational Intelligence Joint Lab, Beijing Information Science & Technology University, Beijing 100101, China; 3. WEIZHIYU (Beijing) Technology co., LTd., Beijing 100101, China) Abstract: The General Administration of Sport of China launched a new project that uses a double competition system, namely, the National Competitive Doudizhu (Two-on-One) Poker Tournament; however, this system does not eliminate online cheating. As a remedy, the idea of using the equal card force competition system to replace the double competition system has been proposed. This paper focuses mainly on how to judge and select the initial hand with equal card force, suggesting the evaluation index of grade difficulty as a method of measuring the difficulty of the initial hand. This system offers a way to select cards of equal card force. Cards of similar grade difficulty in the initial hand are considered to have equal card force. To ensure the reliability of the resultant evaluation of a deck of cards, this paper proposes an innovative “Doudizhu AI program” with different levels as an alternative. The validity of this method is verified by experiments. It is feasible to apply this method in competitions. Keywords: computer game; competitive two against one game; the equal card force; grade difficulty; poker championship; cards in hand; neural network; artificial intelligence 国家体育总局棋牌运动管理中心以“创新、协调、绿色、开放、共享”的发展理念为指导，以提升国民素质与人民健康水平为发展目标，提出了“传统棋牌项目趣味化”和“趣味棋牌项目竞技化”的重要发展战略。在巩固传统五棋一牌项目 (围棋[1-3] 、象棋[4] 、国际象棋[5] 、国际跳棋[6] 、五子棋[7] 、桥牌[8] ) 基础的同时，针对趣味棋牌竞技化的发展战略，收稿日期：2020−07−03. 基金项目：北京信息科技大学科技项目 (5211910927，5121911019， KM201911232002). 通信作者：李淑琴. E-mail：lishuqin_de@126.com. 第 16 卷第 3 期智能系统学报 Vol.16 No.3 2021 年 5 月 CAAI Transactions on Intelligent Systems May 2021

第3期李淑琴，等：竞技二打一游戏中同等牌力的研究 ·467· 国家体育总局棋牌运动管理中心首先推出了以民牌的玩家为获胜者。如果对局结束，统计此次对间趣味棋牌运动“斗地主例为原型的竞技二打一局每个玩家的得分。扑克项目。2016年9月3日，举办了首届全国竞对于竞技游戏，每一场牌局可以被视为一次技二打一扑克锦标赛(China competitive poker 考试，给选手发的初始手牌可以看作考试试题。 championship,CCPC)o,锦标赛中引入了复式赛试题的区分度计算可以参照心理学著名的经典测制四，复式赛制就是在不同的牌桌上，同一个方位试理论s-i(classical test theory,CTT),在CTT框架的选手发一模一样的牌，把相同牌面下打出的成下，通过每个试题与总测试分数的相关关系来反绩进行汇总，看谁能打出最好的效果，这样就完映试题区分度。基于此想法，文献[17]通过统计全避免了发牌的偶然性，达到竞技化的目的。复真人牌谱，计算初始手牌的得分均值和方差，利式赛制的这些特点决定了二打一游戏等项目能够用得分的均值和方差划分将初始手牌划分为被纳入智力运动这一体系。但与传统线下的比赛 10个分类，认为同一类中的手牌具有同等牌力。不同，在互联网环境下，复式赛制尚存在一些不然而，这种用得分均值和方差来划分区间的分类公平因素，例如，两个不同方位的人很容易通过方法存在较大的误差，为此文献[18]对其进行了语音、视频等方式互相告知自己的手牌，存在网改进，通过统计真人牌谱计算初始手牌的得分概上作弊的问题。同等牌力赛制不需要把同样的牌率分布，并以得分概率分布为特征进行聚类从而发给每个参赛的人，而是发同样牌力的牌，以此将初始手牌划分成若干个分类。然而，其仍存在杜绝网络上打相同牌带来的作弊问题。同时，在两个问题：1)通过统计不同批玩家的得分分布，同等牌力赛制中，用户不再需要同时开赛，可以来计算不同初始手牌的得分概率分布，作为该初充分利用其碎片时间随时参赛，也可以中途停始手牌的特征，这个方法在小样本的情况下，顿，而不会影响整个竞赛的过程，等完成打牌的由于不同批玩家统计的得分概率分布不同，实验人数满足比赛要求时就计算排名，比复式赛制更结果难以验证；2)聚类个数是人为预设定的，无加方便。同时，同等牌力的相关研究成果还能应法在实际应用中准确地设定出准确的类别数。为用于能力评测系统。目前该项目已列人中国大学解决第1个问题，本文训练了多个不同水平的“竞生计算机博弈大赛暨全国锦标赛竞标赛中2。技二打一AI程序”，作为固定的“玩家”，打牌生成因此，本文拟对竞技二打一比赛中的同等牌力问大量的牌谱，易于同等牌力的验证；为解决第2个题进行研究。问题，本文提出同等牌力的选取方法。 1相关工作 2同等牌力系统设计与实现竞技二打一是一种玩法简单、娱乐性强的 2.1同等牌力系统设计思想 3人扑克牌游戏。一局牌需3个玩家，1个玩家称同等牌力就是初始手牌的难度近似。本文通为地主，地主的逆时针第1个农民称为下家，逆时过等级评估指标(grade difficulty index,GD)来表针第2个农民称为上家或顶家。在每一局游戏示初始手牌的难度。等级难度评估指标的含义中，地主独立存在，而其他两名玩家以农民的身是：假设一局牌玩完对应的得分共有k种，得分按份组成一队与地主对抗。农民队伍只要有一人比从小到大排列，将它们看成k个等级。本文认为地主先出完手中的牌，农民便可获得游戏胜利，如果玩家能达到第ⅰ个等级，则玩家必能达到第否则地主胜，并计算本局地主得分。 i-1个等级，不必考虑比他低的等级。故玩家能一副完整的纸牌共54张牌，由1张红色小丑达到第ⅰ个等级的难度就是玩家能达到第ⅰ个及牌、1张黑色小丑牌和52张标准牌组成。52张标其以上等级的概率。由于玩家达到第1个等级的准牌共包括大小不同的13种牌(2、A、K、Q、J、概率是100%，所以不考虑玩家达到第1个等级的 T(10)、9、8、7、6、5、4、3),每一种牌各有4张，且难度。等级评估指标由k-1个等级概率值组成。大小相同。在每一轮开始时，地主将持有20张定义1等级难度评估指标。衡量一副牌难牌，其他人每人有17张牌。地主先出牌，且可以易程度的指标，记为G=(g1,g2,…,g-,其中g表打一张牌或任何合法的组合。按逆时针顺序玩家示固定玩家能达到第ⅰ个及其以上等级的概率，依次出牌，每个后续玩家必须要么“过”（不打牌） k表示二打一规则中规定得分的数量。要么通过打出相同数量的牌和相同类型的牌的更定义2具有同等牌力的初始手牌。两副初高组合来击败前一个玩家。最先出完手中的所有始手牌，由同一批玩家打，得到的两个GDI的欧

国家体育总局棋牌运动管理中心首先推出了以民间趣味棋牌运动“斗地主” [9] 为原型的竞技二打一扑克项目。2016 年 9 月 3 日，举办了首届全国竞技二打一扑克锦标赛 (China competitive poker championship，CCPC)[10] ，锦标赛中引入了复式赛制 [11] ，复式赛制就是在不同的牌桌上，同一个方位的选手发一模一样的牌，把相同牌面下打出的成绩进行汇总，看谁能打出最好的效果，这样就完全避免了发牌的偶然性，达到竞技化的目的。复式赛制的这些特点决定了二打一游戏等项目能够被纳入智力运动这一体系。但与传统线下的比赛不同，在互联网环境下，复式赛制尚存在一些不公平因素，例如，两个不同方位的人很容易通过语音、视频等方式互相告知自己的手牌，存在网上作弊的问题。同等牌力赛制不需要把同样的牌发给每个参赛的人，而是发同样牌力的牌，以此杜绝网络上打相同牌带来的作弊问题。同时，在同等牌力赛制中，用户不再需要同时开赛，可以充分利用其碎片时间随时参赛，也可以中途停顿，而不会影响整个竞赛的过程，等完成打牌的人数满足比赛要求时就计算排名，比复式赛制更加方便。同时，同等牌力的相关研究成果还能应用于能力评测系统。目前该项目已列入中国大学生计算机博弈大赛暨全国锦标赛竞标赛中[12-14]。因此，本文拟对竞技二打一比赛中的同等牌力问题进行研究。 1 相关工作竞技二打一是一种玩法简单、娱乐性强的 3 人扑克牌游戏。一局牌需 3 个玩家，1 个玩家称为地主，地主的逆时针第 1 个农民称为下家，逆时针第 2 个农民称为上家或顶家。在每一局游戏中，地主独立存在，而其他两名玩家以农民的身份组成一队与地主对抗。农民队伍只要有一人比地主先出完手中的牌，农民便可获得游戏胜利，否则地主胜，并计算本局地主得分。一副完整的纸牌共 54 张牌，由 1 张红色小丑牌、1 张黑色小丑牌和 52 张标准牌组成。52 张标准牌共包括大小不同的 13 种牌 (2、A、K、Q、J、 T(10)、9、8、7、6、5、4、3)，每一种牌各有 4 张，且大小相同。在每一轮开始时，地主将持有 20 张牌，其他人每人有 17 张牌。地主先出牌，且可以打一张牌或任何合法的组合。按逆时针顺序玩家依次出牌，每个后续玩家必须要么“过”(不打牌)，要么通过打出相同数量的牌和相同类型的牌的更高组合来击败前一个玩家。最先出完手中的所有牌的玩家为获胜者。如果对局结束，统计此次对局每个玩家的得分。对于竞技游戏，每一场牌局可以被视为一次考试，给选手发的初始手牌可以看作考试试题。试题的区分度计算可以参照心理学著名的经典测试理论[15-16] (classical test theory，CTT)，在 CTT 框架下，通过每个试题与总测试分数的相关关系来反映试题区分度。基于此想法，文献 [17]通过统计真人牌谱，计算初始手牌的得分均值和方差，利用得分的均值和方差划分将初始手牌划分为 10 个分类，认为同一类中的手牌具有同等牌力。然而，这种用得分均值和方差来划分区间的分类方法存在较大的误差，为此文献 [18] 对其进行了改进，通过统计真人牌谱计算初始手牌的得分概率分布，并以得分概率分布为特征进行聚类从而将初始手牌划分成若干个分类。然而，其仍存在两个问题：1) 通过统计不同批玩家的得分分布，来计算不同初始手牌的得分概率分布，作为该初始手牌的特征，这个方法在小样本的情况下，由于不同批玩家统计的得分概率分布不同，实验结果难以验证；2) 聚类个数是人为预设定的，无法在实际应用中准确地设定出准确的类别数。为解决第 1 个问题，本文训练了多个不同水平的“竞技二打一 AI 程序”，作为固定的“玩家”，打牌生成大量的牌谱，易于同等牌力的验证；为解决第 2 个问题，本文提出同等牌力的选取方法。 2 同等牌力系统设计与实现 2.1 同等牌力系统设计思想同等牌力就是初始手牌的难度近似。本文通过等级评估指标 (grade difficulty index，GDI) 来表示初始手牌的难度。等级难度评估指标的含义是：假设一局牌玩完对应的得分共有 k 种，得分按从小到大排列，将它们看成 k 个等级。本文认为如果玩家能达到第 i 个等级，则玩家必能达到第 i−1 个等级，不必考虑比他低的等级。故玩家能达到第 i 个等级的难度就是玩家能达到第 i 个及其以上等级的概率。由于玩家达到第 1 个等级的概率是 100%，所以不考虑玩家达到第 1 个等级的难度。等级评估指标由 k−1 个等级概率值组成。 G = (g1,g2,··· ,gk−1) gi 定义 1 等级难度评估指标。衡量一副牌难易程度的指标，记为，其中表示固定玩家能达到第 i 个及其以上等级的概率， k 表示二打一规则中规定得分的数量。定义 2 具有同等牌力的初始手牌。两副初始手牌，由同一批玩家打，得到的两个 GDI 的欧第 3 期李淑琴，等：竞技二打一游戏中同等牌力的研究 ·467·

·468· 智能系统学报第16卷氏距离小于一定阈值，则两副初始手牌具有同等个DDZAI训练集中，共分为n个训练集，要求每牌力。个训练集中数据量尽量均衡。然而，从现有的真人打牌数据中难以找到同使用文献[21]中提出的竞技二打一出牌算一批玩家打若干副初始手牌的数据集，短时间内法，分别训练出n个具有不同水平的DDZAI程召集一批玩家打若干副初始手牌同样不现实。因序。为了验证用上述方法选出的n个DDZAI水此，本文提出生成多个不同水平的“二打一AI程平是否有差异，本文通过让这n个DDZAI进行复序”来代替真人打牌，以保证一副牌所得等级难度式赛，其中n个DDZAI的对手相同，并组成评估指标的可靠性。 n桌。复式赛包括m场比赛，每一场比赛包括多利用“二打一AI程序”生成的大量牌谱数据，轮比赛来保证n桌DDZAI的地主a1,a2,…,an的本文构建了一个可指定难度的同等牌力生成系排名满足：a:的水平高于a的水平，，这表明用统。同等牌力生成系统主要由4部分构成：1)训上述方法选出的n个DDZAI水平有异。具体验练多个不同水平的DDZAI来产生大量牌谱；2)统证方法如图2所示。计牌谱，计算每个初始手牌的等级难度评估指统计每桌地标；3)基于等级难度评估指标，指定1个或几个主的牌难度作为同等牌力的中心，设定阈值，进行不同获得每牌谱分类，即得到不同级别的同等牌力；4)验证个名次同等牌力生成方法的可靠性。同等牌力系统框架的概率第统计每桌地如图1所示。主的牌场 ® 名，Xm 收集其人玩家训练多个不同水平图2多个DDZAI不同水平的验证方法的对局数据的DDZAI来产生 Fig.2 Verification methods at different DDZAI levels 大量牌谱 2.3计算初始手牌的等级难度评估指标为了对指定难度挑选同等牌力的初始手牌，基于GDL,指定I 个或几个难度作统计牌谱，计算需要将每副牌难度量化为GDL,初始手牌h的为同等牌力的中每个初始手牌心，设定圆值，进 GDI的计算过程为：假设一局牌玩完对应的得分的GDI 行牌谱分类共有k种可能的分值，即s1,S2,…,;选取n个地主DDZAI,每个地主DDZAI,与同1个下家 DDZAI和1个顶家DDZAI组成1桌，共构成验证同等牌力生成方法的可靠性 n桌AI牌局。为每桌分发同一副初始手牌h,对局后记录每桌的地主得分，假设得分分别为图1同等牌力系统框架 C1,c2,…,C,其中Cm∈{s1,2,…,5l,=1,2,,n按等 Fig.1 System framework of the equal card force 级排序，统计得分对应的等级次数记为 2.2训练多个不同水平的“二打一A程序” l4,2,…,l。计算初始手牌h对应的等级难度评估笔者将真人打牌日志进行整理，依据输赢次指标G=(g1,82,…,gx),8影的计算公式为数进行归类，使用文献[19-25]中提出的竞技二打一出牌算法，该算法通过真人打牌日志使用CNN j+1 模型训练出具有似人智能的出牌策略。训练n个 81= (1) 不同水平的“二打一AI程序”，具体如算法1。例1根据比赛规则，得分计算公式为：分数= 算法1训练n个不同水平的DDZAI程序胜负系数×本局出现的炸弹数量+胜负系数。若输入真人打牌日志；地主胜利则胜负系数为1，否则胜负系数为-1。输出n个不同水平DDZAI程序。本局出现的炸弹数量为1，则本局的分数为集合 1)将同一玩家的牌谱划分到同一个牌谱集； ={-2,-1,1,2}中的数之一。这4个分数从小到 2)清洗掉牌谱集中数据量少于10局的牌大排序，定义它们对应的等级分别是1、2、3、4，谱集；那么一副牌对应的等级难度评估指标G=(g1,82,83, 3)统计玩家的胜率，并按照胜率对玩家进行结束后统计得分情况：1桌地主获得-2分，3桌地主非递减排序；获得-1分，2桌地主获得1分，4桌地主获得2分， 4)将水平接近玩家对应的牌谱集划分到同一则81=3+2+4 10 09,=2=06,=合-04， 10

氏距离小于一定阈值，则两副初始手牌具有同等牌力。然而，从现有的真人打牌数据中难以找到同一批玩家打若干副初始手牌的数据集，短时间内召集一批玩家打若干副初始手牌同样不现实。因此，本文提出生成多个不同水平的“二打一 AI 程序”来代替真人打牌，以保证一副牌所得等级难度评估指标的可靠性。利用“二打一 AI 程序”生成的大量牌谱数据，本文构建了一个可指定难度的同等牌力生成系统。同等牌力生成系统主要由 4 部分构成：1) 训练多个不同水平的 DDZAI 来产生大量牌谱；2) 统计牌谱，计算每个初始手牌的等级难度评估指标；3) 基于等级难度评估指标，指定 1 个或几个难度作为同等牌力的中心，设定阈值，进行不同牌谱分类，即得到不同级别的同等牌力；4) 验证同等牌力生成方法的可靠性。同等牌力系统框架如图 1 所示。收集真人玩家的对局数据训练多个不同水平的 DDZAI 来产生大量牌谱统计牌谱, 计算每个初始手牌的 GDI 验证同等牌力生成方法的可靠性基于 GDI, 指定 1 个或几个难度作为同等牌力的中心,设定阈值, 进行牌谱分类图 1 同等牌力系统框架 Fig. 1 System framework of the equal card force 2.2 训练多个不同水平的“二打一 AI 程序” 笔者将真人打牌日志进行整理，依据输赢次数进行归类，使用文献 [19-25] 中提出的竞技二打一出牌算法，该算法通过真人打牌日志使用 CNN 模型训练出具有似人智能的出牌策略。训练 n 个不同水平的“二打一 AI 程序”，具体如算法 1。算法 1 训练 n 个不同水平的 DDZAI 程序输入真人打牌日志；输出 n 个不同水平 DDZAI 程序。 1) 将同一玩家的牌谱划分到同一个牌谱集； 2) 清洗掉牌谱集中数据量少于 10 局的牌谱集； 3) 统计玩家的胜率，并按照胜率对玩家进行非递减排序； 4) 将水平接近玩家对应的牌谱集划分到同一个 DDZAI 训练集中，共分为 n 个训练集，要求每个训练集中数据量尽量均衡。 a1,a2,··· ,an ai aj 使用文献 [21] 中提出的竞技二打一出牌算法，分别训练出 n 个具有不同水平的 DDZAI 程序。为了验证用上述方法选出的 n 个 DDZAI 水平是否有差异，本文通过让这 n 个 DDZAI 进行复式赛，其中 n 个 DDZAI 的对手相同，并组成 n 桌。复式赛包括 m 场比赛，每一场比赛包括多轮比赛来保证 n 桌 DDZAI 的地主的排名满足：的水平高于的水平，i<j，这表明用上述方法选出的 n 个 DDZAI 水平有异。具体验证方法如图 2 所示。第 1 场第 m 场 · · · A B A A B B 1 n n A B 1 ··· ··· 统计统计每桌地主的牌名, x1 每桌地主的牌名, xm 获得每个名次的概率图 2 多个 DDZAI 不同水平的验证方法 Fig. 2 Verification methods at different DDZAI levels 2.3 计算初始手牌的等级难度评估指标 s1,s2,··· ,sk c1, c2,··· , cn cu ∈ {s1,s2,··· ,sk} u= 1,2,··· l1,l2,··· ,lk Gh = (g1,g2,··· ,gk) gj 为了对指定难度挑选同等牌力的初始手牌，需要将每副牌难度量化为 GDI，初始手牌 h 的 GDI 的计算过程为：假设一局牌玩完对应的得分共有 k 种可能的分值，即；选取 n 个地主 DDZAI，每个地主 DDZAI，与同 1 个下家 DDZAI 和 1 个顶家 DDZAI 组成 1 桌，共构成 n 桌 AI 牌局。为每桌分发同一副初始手牌 h，对局后记录每桌的地主得分，假设得分分别为，其中，，n 按等级排序，统计得分对应的等级次数记为。计算初始手牌 h 对应的等级难度评估指标，的计算公式为 gj = ∑ li⩾j+1 li n (1) G = (g1,g2,g3) g1 = 3+2+4 10 = 0.9 g2 = 2+4 10 = 0.6 g3 = 4 10 = 0.4 例 1 根据比赛规则，得分计算公式为：分数= 胜负系数×本局出现的炸弹数量+胜负系数。若地主胜利则胜负系数为 1，否则胜负系数为−1。本局出现的炸弹数量为 1，则本局的分数为集合 R={−2，−1，1，2}中的数之一。这 4 个分数从小到大排序，定义它们对应的等级分别是 1、2、3、4，那么一副牌对应的等级难度评估指标，结束后统计得分情况：1 桌地主获得−2 分，3 桌地主获得−1 分，2 桌地主获得 1 分，4 桌地主获得 2 分，则，，， ·468· 智能系统学报第 16 卷

第3期李淑琴，等：竞技二打一游戏中同等牌力的研究 ·469· 这副牌对应的等级难度G=(0.9,0.6,0.4)。 2080 Ti GPU和Ubuntu16.04系统的服务器，Py- 一般来说，g:值表示玩家能达到等级ⅰ的概 thon语言，对所提方法进行了3个实验。率，某等级对应的值越大代表能获胜的难度越实验1生成多个具有区分度的DDZAI 小。如例1，G:的难度就表示地主的获胜的难度利用国内某著名竞技二打一游戏平台提供是0.6，出炸弹能够胜利的难度是0.4。的7000万条游戏日志，使用算法1，将地主的数 2.4选取具有同等牌力的初始手牌据集划分为70个，分别训练了70个地主DDZAI; 若两副初始手牌的GDI值完全相同或差距足另外利用下家和顶家数据，训练了1个下家够小，就认为这两副牌的难度相同，即它们具有 DDZAI和1个顶家DDZAI。每桌固定下家和顶同等牌力。等级难度评估指标的n个值之间的差家DDZAI,与不同的地主共组成70桌牌局。本距可用欧氏距离计算，计算公式为文随机选取了其中的10桌DDZAI,根据图2所示进行复式赛。I0个DDZAI获得每个名次的概率 g1-82) (2) 以及每个DDZAI的排名如图3所示。式中两副初始手牌的等级难度评估指标分别为 1.0 0.8 G1=(g11,812,…,g1n)和G2=(g21,822,…,g2n),若d12值小于预设距离阈值，则G,与G2具有同等牌力值， 0.6 否则不具有同等牌力。系统中也可以任意地或者有目的性地指定一 03 个难度G。比如一轮同等牌力比赛中决定分发 0 2345 67 8910 一副难度中等的手牌，就可以指定G。=0.75,0.52, 名次 0.25),G的难度就表示地主获胜的难度是0.52，出图310个DDZAI获得每个名次的概率炸弹能够胜利的难度是025。然后设定一个阈 Fig.3 Probability of ten DDZAI winning each place 值，通过找出GDI与G。的距离小于e的初始手实验结果表明：10个DDZAI在不同名次的牌，来生成与这个难度相对应的同等牌力的牌。概率值是不同的，与复式赛得出的排名基本为验证同等牌力生成方法的可靠性，本文指致，表明生成的DDZAI是具有一定区分度的。定了n个不同水平的地主DDZAI,与相同的1个实验2具有同等牌力的初始手牌测试下家DDZAI和1个上家DDZAI组成n桌，作为随机生成20万副3家持有的炸弹总和数为同一批比赛选手，分别进行复式赛、同等牌力赛 1的初始手牌，发给70桌，共生成1400万个牌和随机发牌赛。复式赛指每一轮为每桌分发相同谱，分别计算20万副初始手牌的GDI。的初始手牌。同等牌力赛是指每一轮为每桌分发本文以初始手牌Center难度GDI=(0.96 0.91,0.79)作为参照，设置参数=0.15，选取了5个不同的具有同等牌力的初始手牌。随机发牌赛指具有不同难度的GDL,如表1所示。利用式(2). 每一轮为每桌随机分发不同的初始手牌。分别计算与center的距离，计算结果显示前3个 3种比赛都采用同一批选手，分别进行r场比都小于0.15，这表明三者具有同等牌力。后2个赛，每场比赛进行m轮。每轮比赛记录每桌DDZAI 计算与center的距离大于0.l5,表明这两者不具的地主得分。m轮比赛后，统计每桌DDZAI地主有同等牌力。总得分，并记录每桌DDZAI的地主名次。r场比赛后，统计每桌DDZAI地主获得每个名次的概表15个具有不同难度的GDI Table 1 Five GIDs with different difficulties 率，并以概率最大对应的名次作为地主DDZAI的中心点排名。由于比赛选手固定，如果r场比赛后，同等 81 82 83 Centerl 0.950 0.950 0.809 牌力赛后选手排名与复式赛后选手的排名基本一 Center2 0.971 0.971 0.824 致，而与随机发牌比赛后选手的排名不一致，就 Center3 1.000 0.85 0.720 表明同等牌力生成方法是有效的，同等牌力赛代替复式赛是可行的。 Center4 0.736 0.677 0.618 Center5 1.000 1.000 1.000 3实验与分析首先从手牌对应的难度值上分析同等牌力情本文使用Intel Xeon E5-2640CPU,NVIDIA 况。手牌Center难度GD=(0.96,0.91,0.79)表明此

这副牌对应的等级难度 Gk = (0.9,0.6,0.4)。 gi Gk 一般来说，值表示玩家能达到等级 i 的概率，某等级对应的值越大代表能获胜的难度越小。如例 1，的难度就表示地主的获胜的难度是 0.6，出炸弹能够胜利的难度是 0.4。 2.4 选取具有同等牌力的初始手牌若两副初始手牌的 GDI 值完全相同或差距足够小，就认为这两副牌的难度相同，即它们具有同等牌力。等级难度评估指标的 n 个值之间的差距可用欧氏距离计算，计算公式为 d12 = vt∑n j=1 (g1 j −g2 j) 2 (2) G1 = (g11,g12,··· ,g1n) G2 = (g21,g22,··· ,g2n) d12 G1 G2 式中两副初始手牌的等级难度评估指标分别为和，若值小于预设距离阈值，则与具有同等牌力值，否则不具有同等牌力。 Gc Gc = (0.75,0.52, 0.25) Gc Gc 系统中也可以任意地或者有目的性地指定一个难度。比如一轮同等牌力比赛中决定分发一副难度中等的手牌，就可以指定，的难度就表示地主获胜的难度是 0.52，出炸弹能够胜利的难度是 0.25。然后设定一个阈值，通过找出 GDI 与的距离小于 ε 的初始手牌，来生成与这个难度相对应的同等牌力的牌。为验证同等牌力生成方法的可靠性，本文指定了 n 个不同水平的地主 DDZAI，与相同的 1 个下家 DDZAI 和 1 个上家 DDZAI 组成 n 桌，作为同一批比赛选手，分别进行复式赛、同等牌力赛和随机发牌赛。复式赛指每一轮为每桌分发相同的初始手牌。同等牌力赛是指每一轮为每桌分发不同的具有同等牌力的初始手牌。随机发牌赛指每一轮为每桌随机分发不同的初始手牌。 3 种比赛都采用同一批选手，分别进行 r 场比赛，每场比赛进行 m 轮。每轮比赛记录每桌 DDZAI 的地主得分。m 轮比赛后，统计每桌 DDZAI 地主总得分，并记录每桌 DDZAI 的地主名次。r 场比赛后，统计每桌 DDZAI 地主获得每个名次的概率，并以概率最大对应的名次作为地主 DDZAI 的排名。由于比赛选手固定，如果 r 场比赛后，同等牌力赛后选手排名与复式赛后选手的排名基本一致，而与随机发牌比赛后选手的排名不一致，就表明同等牌力生成方法是有效的，同等牌力赛代替复式赛是可行的。 3 实验与分析本文使用 Intel Xeon E5-2 640 CPU，NVIDIA 2080Ti GPU 和 Ubuntu 16.04 系统的服务器，Python 语言，对所提方法进行了 3 个实验。实验 1 生成多个具有区分度的 DDZAI 利用国内某著名竞技二打一游戏平台提供的 7 000 万条游戏日志，使用算法 1，将地主的数据集划分为 70 个，分别训练了 70 个地主 DDZAI；另外利用下家和顶家数据，训练了 1 个下家 DDZAI 和 1 个顶家 DDZAI。每桌固定下家和顶家 DDZAI，与不同的地主共组成 70 桌牌局。本文随机选取了其中的 10 桌 DDZAI，根据图 2 所示进行复式赛。10 个 DDZAI 获得每个名次的概率以及每个 DDZAI 的排名如图 3 所示。 1 2 3 4 5 6 7 8 9 10 名次 0 0.2 0.4 0.6 0.8 1.0 概率值图 3 10 个 DDZAI 获得每个名次的概率 Fig. 3 Probability of ten DDZAI winning each place 实验结果表明：10 个 DDZAI 在不同名次的概率值是不同的，与复式赛得出的排名基本一致，表明生成的 DDZAI 是具有一定区分度的。实验 2 具有同等牌力的初始手牌测试随机生成 20 万副 3 家持有的炸弹总和数为 1 的初始手牌，发给 70 桌，共生成 1 400 万个牌谱，分别计算 20 万副初始手牌的 GDI。本文以初始手牌 Center 难度 GDI=(0.96, 0.91,0.79) 作为参照，设置参数 ε=0.15，选取了 5 个具有不同难度的 GDI，如表 1 所示。利用式 (2)，分别计算与 center 的距离，计算结果显示前 3 个都小于 0.15，这表明三者具有同等牌力。后 2 个计算与 center 的距离大于 0.15，表明这两者不具有同等牌力。表 1 5 个具有不同难度的 GDI Table 1 Five GIDs with different difficulties 中心点 g1 g2 g3 Center1 0.950 0.950 0.809 Center2 0.971 0.971 0.824 Center3 1.000 0.85 0.720 Center4 0.736 0.677 0.618 Center5 1.000 1.000 1.000 首先从手牌对应的难度值上分析同等牌力情况。手牌 Center 难度 GDI=(0.96,0.91,0.79) 表明此第 3 期李淑琴，等：竞技二打一游戏中同等牌力的研究 ·469·

·470· 智能系统学报第16卷牌有91%的概率赢得比赛，有79%的概率出炸弹四的概率为72%，对于地主来说获胜难度较小。并赢得比赛，对于地主来说获胜难度很小。Cen- Center4获胜的概率是67.7%，出炸弹并能胜利的 ter1对应的初始手牌有95%的概率赢得比赛，有概率为61.8%，对于地主来说打牌难度很大。 95%的概率出炸弹并赢得比赛，对于地主来说获 Center5获胜的概率是100%，出炸弹并能胜利的胜难度很小。Center2获胜的概率是97%，出炸弹概率为100%，对于地主来说打牌获胜过于简单。并能胜利的概率为82%，对于地主来说获胜难度对应表1生成的初始手牌事例，如表2所示，小。Center.3获胜的概率是85%，出炸弹并能胜利下面从牌面对这5副初始手牌的难度进行分析。表2生成的与center具有同等牌力的初始手牌事例 Table 2 Generated initial hand case with the same force as center 第副手牌地主手牌下家手牌顶家手牌 1 33444556789 TJKKA2222 556677889TTJQQKAX 33467899TJJQQKAAD 2 4455566799TJJJQQQQA2 33466778889JKKA2D 3345789TTTKKAA22X 3 33334577888 JQQKKK22X 44455699TTTJQKA2D 566677899TJJQAAA2 4 34444588TTJOKKKAAA2D 3355666778899JQQ2 3567799TTJJOKA22X 5 333677899 TTTTJQQQ222 34456667JJQKKAA2D 44555788899 JKKAAX 第1副初始手牌：地主持有最大的3张，且地 0.20、0.25。复式赛每个DDZAI获得排名1~5的主出顺子6789TJ或者56789TJ后会将农民的手概率如表3所示。牌拆散，若农民的水平不够，只要放走地主一手表3复式赛中每个DDZAI获得前5名的概率小单牌或者小对子，则地主能够出炸弹并胜利， Table 3 Probability of each DDZAI winning the first five 因此第l副初始手牌符合Center的难度。 places in a duplicate tournament 第2副初始手牌：地主持有最大的3张，且复式赛中比赛 2家农民掉张过多，会放走地主的小牌，地主能够 DDZAI第1第2第3第4第5 DDZAI 轮次大概率出炸弹并胜利，因此第2副初始手牌符合名次 Center的难度。 0 0.700.20 0 0 0.05 第3副初始手牌：地主持有最大的对子，如果 0.050.750.15 0 0.05 2 农民拆AAA管地主的QQ,则地主的KKK又变 5 00.050.700.200.05 3 成最大，地主能够大概率出炸弹并胜利，因此第 3副初始手牌符合Center的难度。 3 0.1000.100.700.10 第4副初始手牌：农民持有最大的对子，且地 4 0.050.050.050.100.75 5 主不善于打对子，农民有控制牌权的能力，且地 0 0.710.200.04 0.05 主小牌较多，但是地主持有KKKAAA2D大牌和炸弹，能够大概率胜利，但是难度要高于前3副牌。 0.050.750.15 0 0.05 2 第5副初始手牌：地主持有3个3张带单， 2 0 0.040.710.20 0.05 3 1个炸弹，2个对子，地主必能出炸弹胜利，此手 3 0.1000.100.700.10 4 牌过于简单，因此第5副初始手牌也不符合Center 4 0.050.100 0.100.75 5 的难度。 0 0.700.25 0 0 0.05 实验结果表明，根据不同初始手牌GDI值的相近程度，来认定哪些牌具有同等牌力的方法是 1 0.050.750.15 00.05 可行的。 20 00.050.700.200.05 实验3验证同等牌力应用于比赛的可行性 3 0.100 0.100.700.10 4 本文共选取了5桌DDZAI参加比赛，复式 4 0.050.050.050.100.75 赛、随机发牌赛和同等牌力赛的比赛场数都为 20,一场比赛的轮数分别设置为5、10、20。选取随机发牌赛每个DDZAI获得排名1~5的概同等牌力的初始手牌时，设置Center难度为率如表4所示，参数ε不同取值的同等牌力赛后， GD=(0.96,0.91,0.79),e的取值分别设置为0.15、每个DDZAI获得排名1~5的概率如表5所示

牌有 91% 的概率赢得比赛，有 79% 的概率出炸弹[14] 并赢得比赛，对于地主来说获胜难度很小。Center1 对应的初始手牌有 95% 的概率赢得比赛，有 95% 的概率出炸弹并赢得比赛，对于地主来说获胜难度很小。Center2 获胜的概率是 97%，出炸弹并能胜利的概率为 82%，对于地主来说获胜难度小。Center3 获胜的概率是 85%，出炸弹并能胜利的概率为 72%，对于地主来说获胜难度较小。 Center4 获胜的概率是 67.7%，出炸弹并能胜利的概率为 61.8%，对于地主来说打牌难度很大。 Center5 获胜的概率是 100%，出炸弹并能胜利的概率为 100%，对于地主来说打牌获胜过于简单。对应表 1 生成的初始手牌事例，如表 2 所示，下面从牌面对这 5 副初始手牌的难度进行分析。表 2 生成的与 center 具有同等牌力的初始手牌事例 Table 2 Generated initial hand case with the same force as center 第i副手牌地主手牌下家手牌顶家手牌 1 33444556789TJKKA2222 556677889TTJQQKAX 33467899TJJQQKAAD 2 4455566799TJJJQQQQA2 33466778889JKKA2D 3345789TTTKKAA22X 3 33334577888JQQKKK22X 44455699TTTJQKA2D 566677899TJJQAAA2 4 34444588TTJQKKKAAA2D 3355666778899JQQ2 3567799TTJJQKA22X 5 333677899TTTTJQQQ222 34456667JJQKKAA2D 44555788899JKKAAX 第 1 副初始手牌：地主持有最大的 3 张，且地主出顺子 6789TJ 或者 56789TJ 后会将农民的手牌拆散，若农民的水平不够，只要放走地主一手小单牌或者小对子，则地主能够出炸弹并胜利，因此第 1 副初始手牌符合 Center 的难度。第 2 副初始手牌：地主持有最大的 3 张，且 2 家农民掉张过多，会放走地主的小牌，地主能够大概率出炸弹并胜利，因此第 2 副初始手牌符合 Center 的难度。第 3 副初始手牌：地主持有最大的对子，如果农民拆 AAA 管地主的 QQ，则地主的 KKK 又变成最大，地主能够大概率出炸弹并胜利，因此第 3 副初始手牌符合 Center 的难度。第 4 副初始手牌：农民持有最大的对子，且地主不善于打对子，农民有控制牌权的能力，且地主小牌较多，但是地主持有 KKKAAA2D 大牌和炸弹，能够大概率胜利，但是难度要高于前 3 副牌。第 5 副初始手牌：地主持有 3 个 3 张带单， 1 个炸弹，2 个对子，地主必能出炸弹胜利，此手牌过于简单，因此第 5 副初始手牌也不符合 Center 的难度。实验结果表明，根据不同初始手牌 GDI 值的相近程度，来认定哪些牌具有同等牌力的方法是可行的。实验 3 验证同等牌力应用于比赛的可行性本文共选取了 5 桌 DDZAI 参加比赛，复式赛、随机发牌赛和同等牌力赛的比赛场数都为 20，一场比赛的轮数分别设置为 5、10、20。选取同等牌力的初始手牌时，设置 Cente r 难度为 GDI=(0.96,0.91,0.79)，ε 的取值分别设置为 0.15、 0.20、0.25。复式赛每个 DDZAI 获得排名 1~5 的概率如表 3 所示。表 3 复式赛中每个 DDZAI 获得前 5 名的概率 Table 3 Probability of each DDZAI winning the first five places in a duplicate tournament 比赛轮次 DDZAI 第1 第2 第3 第4 第5 复式赛中 DDZAI 名次 5 0 0.70 0.20 0 0 0.05 1 1 0.05 0.75 0.15 0 0.05 2 2 0 0.05 0.70 0.20 0.05 3 3 0.10 0 0.10 0.70 0.10 4 4 0.05 0.05 0.05 0.10 0.75 5 10 0 0.71 0.20 0.04 0 0.05 1 1 0.05 0.75 0.15 0 0.05 2 2 0 0.04 0.71 0.20 0.05 3 3 0.10 0 0.10 0.70 0.10 4 4 0.05 0.10 0 0.10 0.75 5 20 0 0.70 0.25 0 0 0.05 1 1 0.05 0.75 0.15 0 0.05 2 2 0 0.05 0.70 0.20 0.05 3 3 0.10 0 0.10 0.70 0.10 4 4 0.05 0.05 0.05 0.10 0.75 5 随机发牌赛每个 DDZAI 获得排名 1~5 的概率如表 4 所示，参数 ε 不同取值的同等牌力赛后，每个 DDZAI 获得排名 1~5 的概率如表 5 所示。 ·470· 智能系统学报第 16 卷

第3期李淑琴，等：竞技二打一游戏中同等牌力的研究 ·471· 表4随机发牌赛中每个DDZAI获得前5名的概率续表5 Table 4 Probability of each DDZAI winning the first five 同等牌力 ε值比赛 places in a random licensing tournament DDZAI第1第2第3第4第5赛DDZAI 设置轮数随机发牌的名次比赛 DDZAI 第1第2第3第4第5赛中DDZAI 00.490.260.2500.05 轮次 1 0.050.350.150.400.10 名次 0.20 5 20.150.200.400.200.10 0 0.480.110.160.150.15 1 3 0.250.0500.300.45 0.110.270.160.050.45 40.100.200.250.150.35 2 0.150.260.220.260.16 00.400.350.2000.05 0.050.310.410.130.16 10.050.350.100.400.10 0.260.100.110.460.13 0.255 20.100.250.350.200.10 30250.0500.300.40 0 0.320.210.260.150.11 40.100.200.200.100.40 1 0.270.210.310.210.06 实验结果分析：1)对比表3、4、5，可以看出当 10 2 0.260.160.160.110.35 e=0.15时，同等牌力赛的DDZAI排名与复式赛 0.100.210.110.310.31 的DDZAI排名一致，与随机发牌赛的DDZAI排 4 0.110.270.210.260.21 名不一致，说明了同等牌力生成方法的可靠性：2)从 0.160.230.310.110.30 表4可以看出，当e增大时，DDZAI获得每个名次的概率分布越均衡，评估出AI名次的难度越大， 1 0.530.240.120.220 e<0.15是合适的取值，所以e的选择较关键。 20 2 0.310.210.230.230.13 3)对比表3、4、5，可以看出当ε确定时，随着比赛 00.220.230.430.23 轮数的增加，DDZAI获得每个名次的概率分布没 0.110.210.220.120.45 有变化，因此增加比赛轮数不会降低同等牌力赛评估出AI名次的难度。表5同等牌力赛中每个DDZAI获得前5名的概率 Table 5 Probability of each DDZAI winning the first five 4结束语 places in the equal card force 本文创新性地提出由多个不同水平的“二打同等牌力值比赛 A程序”来代替真人打牌，产生牌谱，生成同等 DDZAI第1第2第3第4第5赛DDZAI 设置轮数牌力并进行验证的方法，以保证实验结果的可靠的名次性；提出了用等级难度评估指标GDI来表示初始 00.500.400.050.050 手牌的难度，给出了判定具有同等牌力的初始手 1 0.200.500.300 0 2 牌的方法；通过指定DDZAI分别进行随机发牌 5 2 0.1000.580.260.06 ) 赛、复式赛和同等牌力赛。实验表明，在选择合 30.110.050.060.580.20 4 适阈值情况下，提出的同等牌力生成方法是有效 40.050.050.050.100.75 5 的，用同等牌力赛代替当前的复式赛是可行的。 00.550.200.2000.10 1 本文提出的方法需要通过DDZAI计算每 1 0.150.440.200.150.10 2 副初始手牌的GDL,消耗的时间较多，只能将得出 0.151020.100.150.490.200.10 3 的具有同等牌力的初始手牌提前存储在牌库中用 3 0.150.150.050.540.15 于比赛，这就需要建立一个可动态、随机生成指 40.100.100.100.250.50 5 定难度的初始手牌系统。本文在接下来的研究 00.570.330.100.100 0.300.400.200.200 2 中，将对动态的“同等牌力”生成系统进行研究。 20 20.110.100.510.180.20 3 参考文献： 3 0.010.200.100.590.10 4 0.100.100.200.200.50 5 [1]SILVER D.HUANG A.MADDISON C J.et al.Master- ing the game of Go with deep neural networks and tree

实验结果分析：1) 对比表 3、4、5，可以看出当 ε = 0.15 时，同等牌力赛的 DDZAI 排名与复式赛的 DDZAI 排名一致，与随机发牌赛的 DDZAI 排名不一致，说明了同等牌力生成方法的可靠性；2) 从表 4 可以看出，当 ε 增大时，DDZAI获得每个名次的概率分布越均衡，评估出 AI 名次的难度越大， ε<0.15 是合适的取值，所以 ε 的选择较关键。 3) 对比表 3、4、5，可以看出当 ε 确定时，随着比赛轮数的增加，DDZAI 获得每个名次的概率分布没有变化，因此增加比赛轮数不会降低同等牌力赛评估出 AI 名次的难度。 4 结束语本文创新性地提出由多个不同水平的“二打一 AI 程序”来代替真人打牌，产生牌谱，生成同等牌力并进行验证的方法，以保证实验结果的可靠性；提出了用等级难度评估指标 GDI 来表示初始手牌的难度，给出了判定具有同等牌力的初始手牌的方法；通过指定 DDZAI 分别进行随机发牌赛、复式赛和同等牌力赛。实验表明，在选择合适阈值情况下，提出的同等牌力生成方法是有效的，用同等牌力赛代替当前的复式赛是可行的。本文提出的方法需要通过 DDZAI 计算每一副初始手牌的 GDI，消耗的时间较多，只能将得出的具有同等牌力的初始手牌提前存储在牌库中用于比赛，这就需要建立一个可动态、随机生成指定难度的初始手牌系统。本文在接下来的研究中，将对动态的“同等牌力”生成系统进行研究。参考文献： SILVER D, HUANG A, MADDISON C J, et al. Mastering the game of Go with deep neural networks and tree [1] 表 4 随机发牌赛中每个 DDZAI 获得前 5 名的概率 Table 4 Probability of each DDZAI winning the first five places in a random licensing tournament 比赛轮次 DDZAI 第1 第2 第3 第4 第5 随机发牌赛中DDZAI 名次 5 0 0.48 0.11 0.16 0.15 0.15 1 1 0.11 0.27 0.16 0.05 0.45 5 2 0.15 0.26 0.22 0.26 0.16 — 3 0.05 0.31 0.41 0.13 0.16 3 4 0.26 0.10 0.11 0.46 0.13 4 10 0 0.32 0.21 0.26 0.15 0.11 — 1 0.27 0.21 0.31 0.21 0.06 — 2 0.26 0.16 0.16 0.11 0.35 — 3 0.10 0.21 0.11 0.31 0.31 — 4 0.11 0.27 0.21 0.26 0.21 — 20 0 0.16 0.23 0.31 0.11 0.30 — 1 0.53 0.24 0.12 0.22 0 — 2 0.31 0.21 0.23 0.23 0.13 — 3 0 0.22 0.23 0.43 0.23 — 4 0.11 0.21 0.22 0.12 0.45 — 表 5 同等牌力赛中每个 DDZAI 获得前 5 名的概率 Table 5 Probability of each DDZAI winning the first five places in the equal card force ε值设置比赛轮数 DDZAI 第1 第2 第3 第4 第5 同等牌力赛DDZAI 的名次 0.15 5 0 0.50 0.40 0.05 0.05 0 1 1 0.20 0.50 0.30 0 0 2 2 0.10 0 0.58 0.26 0.06 3 3 0.11 0.05 0.06 0.58 0.20 4 4 0.05 0.05 0.05 0.10 0.75 5 10 0 0.55 0.20 0.20 0 0.10 1 1 0.15 0.44 0.20 0.15 0.10 2 2 0.10 0.15 0.49 0.20 0.10 3 3 0.15 0.15 0.05 0.54 0.15 4 4 0.10 0.10 0.10 0.25 0.50 5 20 0 0.57 0.33 0.10 0.10 0 1 1 0.30 0.40 0.20 0.20 0 2 2 0.11 0.10 0.51 0.18 0.20 3 3 0.01 0.20 0.10 0.59 0.10 4 4 0.10 0.10 0.20 0.20 0.50 5 续表 5 ε值设置比赛轮数 DDZAI 第1 第2 第3 第4 第5 同等牌力赛DDZAI 的名次 0.20 5 0 0.49 0.26 0.25 0 0.05 — 1 0.05 0.35 0.15 0.40 0.10 — 2 0.15 0.20 0.40 0.20 0.10 — 3 0.25 0.05 0 0.30 0.45 — 4 0.10 0.20 0.25 0.15 0.35 — 0.25 5 0 0.40 0.35 0.20 0 0.05 — 1 0.05 0.35 0.10 0.40 0.10 — 2 0.10 0.25 0.35 0.20 0.10 — 3 0.25 0.05 0 0.30 0.40 — 4 0.10 0.20 0.20 0.10 0.40 — 第 3 期李淑琴，等：竞技二打一游戏中同等牌力的研究 ·471·

·472· 智能系统学报第16卷 search[J.Nature,.2016,529(7587):484-489 [18]LI Saisai,LI Shuqin,DING Meng.Landlord's equal cards [2]SILVER D.SCHRITTWIESER J,SIMONYAN K,et al. force generation algorithm[J].The journal of engineering, Mastering the game of Go without human knowledge[J]. 2018,2018(16):1590-1594. Nature,2017,550(7676):354-359. [19]陈子鹏，李淑琴，郑蓝舟，等区分二打一游戏竞技者能力 [3]范孙操围棋入门M.北京：中国纺织出版社，2019. 的测试用例研究U/OL]重庆理工大学学报（自然科学） [4]程明松.中国象棋谱大全M机.2版.成都：成都时代出版 (2021-01-21)[2021-03-20]https://kns.cnki.net/kcms/de- 社，2006， tai/50.1205.t.20210121.1143.004.html. [5]阿尔·劳伦斯，埃勒尚·穆拉迪阿巴迪.国际象棋入门教 CHEN Zipeng,LI shuqin,ZHENG Lanzhou,et al.A 程M.邵晖，洪成浸，译.北京：人民邮电出版社，2018. Study on the test cases for differentiating the ability of [6]杰里米西尔曼.从入门到大师：国际象棋残局大全[M, athlete in doudizhu[J/OL].Journal of Chongqing Uni- 向一凡，王知为，洪凡凌，等，译.北京：北京联合出版公 versity of Technology(natural science).(2021-01-21) 司.2017 [2021-03-20]https://kns.cnki.net/kcms/detail/50.1205.t.2 [7]李元秀.五子棋实战与布局一本通M.呼和浩特：内蒙 0210121.1143.004.html. 古人民出版社，2019 [20]LI Saisai,LI Shuqin,DING Meng,et al.Research on [8]宋召，王岩.桥牌入门M.上海：上海科学技术文献出版 fight the landlords'single card guessing based on deep 社，2009 learning[C]//Proceedings of the 27th International Confer- [9]朱扬.斗地主取胜秘籍[M].成都：成都时代出版社， ence on Artificial Neural Networks and Machine Learn- 2012 ing and Machine Learning.Rhodes,Greece,2018: [10们国家体育总局棋牌运动管理中心（中国棋院）.竞技二 363-372 打一扑克竞赛规则EB/0L.(2017-06-15)[2019-05-20] [21]LI Shuqin,LI Saisai,CAO Hengyang,et al.Study on the http://lw.ourgame.com/site/intro/list.do#. [11]国家体育总局棋牌运动管理中心（中国棋院）.竞技趣 strategy of playing Doudizhu game based on multirole 味棋牌[EB/OL].(2019-05-06)[2020-05-20]htp:∥ modeling[J/OL].Complexity.2020:1-9[2020-05-05] https:./doi.org/10.1155/2020/1764594 www.imsa.com.cn/category/681. [22]李赛赛.基于深度学习的斗地主博弈算法研究[D].北 [12]徐心和，邓志立，王骄，等.机器博弈研究面临的各种挑京：北京信息科技大学，2019 战[.智能系统学报，2008.3(4)288-293. LI Saisai.Research on the algorithm of Dou Dizhu game XU Xinhe,DENG Zhili,WANG Jiao,et al.Challenging issues facing computer game research[J].CAAI transac- based on deep learning[D].Beijing:Beijing Information tions on intelligent systems,2008,3(4):288-293. Science and Technology University,2019. [13]王亚杰，邱虹坤，吴燕燕，等.计算机博弈的研究与发展 [23]CAO Hengyang,LI Shuqin.Research on the Dou Dizhu's ).智能系统学报，2016,11(6)：788-798. playing strategy based on XGBoost[J].International WANG Yajie,QIU Hongkun,WU Yanyan,et al.Re- journal of wireless and mobile computing,2020,19(4): search and development of computer games[J].CAAI 391-400. transactions on intelligent systems,2016,11(6):788-798. [24]代鹏程.二打一游戏博弈算法研究与实现D]北京：北 [14]二打一扑克牌（斗地主）比赛规则.中国大学生计算机京信息科技大学，2020. 博弈大赛暨中国锦标赛[EB/OL].(2019-09-30) DAI Pengcheng.Research and implementation of Dou [2020-06-15]http://computergames.caai.cn/jsgz10.html Dizhu game algorithm[D].Beijing:Beijing Information [15]MOSES T.A review of developments and applications in Science and Technology University,2020. item analysis[M]//BENNETT R,VON DAVIER M.Ad- [25]陈子鹏.面向游戏二打一用例的研究D].北京：北京信 vancing Human Assessment:The Methodological,Psy- 息科技大学，2020 chological and Policy Contributions of ETS.Cham: CHEN Zipeng.Study on the use case of competitive two Springer,2017:19-46. against one game[D].Beijing:Beijing Information Sci- [16]DEMIRTAS H.A Note on the relationship between the ence and Technology University,2020. phi coefficient and the tetrachoric correlation under non- 作者简介： normal underlying distributions[J].The American statisti- 李淑琴，教授，主要研究方向为人 cian,2016,70(2):143-148. 工智能、计算机博弈。主持或参与科 [17]ZHANG Yipeng,CHEN Zipeng,ZHENG Lanzhou,et al. 研项目30余项。发表学术论文 Research on hand discrimination for Doudizhu 130余篇。 Game[C]//Proceedings of the 4th International Confer- ence on Education,Management,Arts,Economics and Social Science,Sanya,China,2017:443-446

search[J]. Nature, 2016, 529(7587): 484–489. SILVER D, SCHRITTWIESER J, SIMONYAN K, et al. Mastering the game of Go without human knowledge[J]. Nature, 2017, 550(7676): 354–359. [2] [3] 范孙操. 围棋入门 [M]. 北京: 中国纺织出版社, 2019. 程明松. 中国象棋谱大全 [M]. 2 版. 成都: 成都时代出版社, 2006. [4] 阿尔·劳伦斯, 埃勒尚·穆拉迪阿巴迪. 国际象棋入门教程 [M]. 邵晖, 洪成浸, 译. 北京: 人民邮电出版社, 2018. [5] 杰里米·西尔曼. 从入门到大师: 国际象棋残局大全 [M]. 向一凡, 王知为, 洪凡凌, 等, 译. 北京: 北京联合出版公司, 2017. [6] 李元秀. 五子棋实战与布局一本通 [M]. 呼和浩特: 内蒙古人民出版社, 2019. [7] 宋召, 王岩. 桥牌入门 [M]. 上海: 上海科学技术文献出版社, 2009. [8] 朱扬. 斗地主取胜秘籍 [M]. 成都: 成都时代出版社, 2012. [9] 国家体育总局棋牌运动管理中心 (中国棋院). 竞技二打一扑克竞赛规则 [EB/OL]. (2017−06−15)[2019−05−20] http://lw.ourgame.com/site/intro/list.do#. [10] 国家体育总局棋牌运动管理中心 (中国棋院). 竞技趣味棋牌 [EB/OL]. (2019−05−06)[2020−05−20]http:// www.imsa.com.cn/category/681. [11] 徐心和, 邓志立, 王骄, 等. 机器博弈研究面临的各种挑战 [J]. 智能系统学报, 2008, 3(4): 288–293. XU Xinhe, DENG Zhili, WANG Jiao, et al. Challenging issues facing computer game research[J]. CAAI transactions on intelligent systems, 2008, 3(4): 288–293. [12] 王亚杰, 邱虹坤, 吴燕燕, 等. 计算机博弈的研究与发展 [J]. 智能系统学报, 2016, 11(6): 788–798. WANG Yajie, QIU Hongkun, WU Yanyan, et al. Research and development of computer games[J]. CAAI transactions on intelligent systems, 2016, 11(6): 788–798. [13] 二打一扑克牌（斗地主）比赛规则.中国大学生计算机博弈大赛暨中国锦标赛 [EB/OL]. (2019−09−30) [2020−06−15]http://computergames.caai.cn/jsgz10.html [14] MOSES T. A review of developments and applications in item analysis[M]//BENNETT R, VON DAVIER M. Advancing Human Assessment: The Methodological, Psychological and Policy Contributions of ETS. Cham: Springer, 2017: 19−46. [15] DEMIRTAS H. A Note on the relationship between the phi coefficient and the tetrachoric correlation under nonnormal underlying distributions[J]. The American statistician, 2016, 70(2): 143–148. [16] ZHANG Yipeng, CHEN Zipeng, ZHENG Lanzhou, et al. Research on hand discrimination for Doudizhu Game[C]//Proceedings of the 4th International Conference on Education, Management, Arts, Economics and Social Science, Sanya, China, 2017: 443−446. [17] LI Saisai, LI Shuqin, DING Meng. Landlord's equal cards force generation algorithm[J]. The journal of engineering, 2018, 2018(16): 1590–1594. [18] 陈子鹏,李淑琴,郑蓝舟,等.区分二打一游戏竞技者能力的测试用例研究 [J/OL]. 重庆理工大学学报 (自然科学) (2021−01−21)[2021−03−20] https://kns.cnki.net/kcms/detail/50.1205.t.20210121.1143.004.html. CHEN Zipeng, LI shuqin, ZHENG Lanzhou, et al. A Study on the test cases for differentiating the ability of athlete in doudizhu[J/OL]. Journal of Chongqing University of Technology(natural science). (2021−01−21) [2021−03−20]https://kns.cnki.net/kcms/detail/50.1205.t.2 0210121.1143.004.html. [19] LI Saisai, LI Shuqin, DING Meng, et al. Research on fight the landlords’ single card guessing based on deep learning[C]//Proceedings of the 27th International Conference on Artificial Neural Networks and Machine Learning and Machine Learning. Rhodes, Greece, 2018: 363−372. [20] LI Shuqin, LI Saisai, CAO Hengyang, et al. Study on the strategy of playing Doudizhu game based on multirole modeling[J/OL]. Complexity.2020:1−9[2020−05−05] https://doi.org/10.1155/2020/1764594. [21] 李赛赛. 基于深度学习的斗地主博弈算法研究 [D]. 北京: 北京信息科技大学, 2019. LI Saisai. Research on the algorithm of Dou Dizhu game based on deep learning[D]. Beijing: Beijing Information Science and Technology University, 2019. [22] CAO Hengyang, LI Shuqin. Research on the Dou Dizhu’s playing strategy based on XGBoost[J]. International journal of wireless and mobile computing, 2020, 19(4): 391–400. [23] 代鹏程. 二打一游戏博弈算法研究与实现 [D]. 北京: 北京信息科技大学, 2020. DAI Pengcheng. Research and implementation of Dou Dizhu game algorithm[D]. Beijing: Beijing Information Science and Technology University, 2020. [24] 陈子鹏. 面向游戏二打一用例的研究 [D]. 北京: 北京信息科技大学, 2020. CHEN Zipeng. Study on the use case of competitive two against one game[D]. Beijing: Beijing Information Science and Technology University, 2020. [25] 作者简介：李淑琴，教授，主要研究方向为人工智能、计算机博弈。主持或参与科研项目 3 0 余项。发表学术论文 130 余篇。 ·472· 智能系统学报第 16 卷

第3期李淑琴，等：竞技二打一游戏中同等牌力的研究 ·473· 陈子鹏，硕士研究生，主要研究方郑蓝舟，微智娱（北京）科技有限向为人工智能、机器学习。公司首席技术官，主要研究方向为人工智能、机器学习、计算机博弈。第七届EEE云计算与智能系统国际会议 IEEE the 7th International Conference on Cloud Computing and Intelligent Systems 由中国人工智能学会与EEE北京分会共同主办，西安电子科技大学承办、西安民用航天基地管理委员会协办的2021年第七届EEE云计算与智能系统国际会议将于2021年11月6日至7日在中国西安举办。即日起至2021年7月31日，会议将面向全球征集稿件，经会议审稿后录用的稿件将由IEEE出版，符合 IEEE标准的会议论文可纳入IEEE Xplore数字图书馆。优秀论文将推荐至大会合作的World Wide Web Journal、Chinese Journal of Electronics、China Communications等SCI期f刊。该会议旨在对云计算、人工智能的前沿技术和热点问题进行深入研究和探讨，以促进相关技术和产业的发展。为扩大云计算与智能科学技术领域的国际交流和合作，增强该领域内的学术影响，并给国际同行提供一个交流的平台，使参会者了解最新的学术动态，分享最新的研究成果。云计算与智能系统国际会议已在北京、杭州、深圳、香港、新加坡成功举办六届。本届会议将邀请中国工程院院士李德毅、中国科学院院士黄维、西安电子科技大学副校长石光明等顶尖AI领域学者担任主席。会议诚邀各界同行投稿。主要领域（但不限于此）： 1)Computational Intelligence;2)Cloud Computing and Big Data Analysis;3)Big Data Models and Algorithms;4) Deep Learning;5)Machine Learning;6)Parallel and Distributed Computing;7)Neural Networks and Learning Systems:8)Evolving Neural Networks:9)Neural Network Applications:10)Big Data Security and Privacy:11)Com- puter Vision;12)Information Retrieval and Recommendation;13)Data Mining;14)Pattern Recognition and Image Pro- cessing,15)Human-Computer Interaction;16)Brain and Cognitive Science;17)Agents and Multi-Agent Systems;18) Complex System and Network;19)Smart Grid Control System;20)Smart City IoT;21)Intelligent Manufacturing;22) Hybrid Intelligence 投稿要求： 1)论文未曾在国内外杂志或会议上发表。 2)稿件写作必须使用英文，并严格按照模板要求进行排版。 3)投稿系统网址为：http:/202 1ccis.csp.escience.cn/dct/page/I。时间节点：论文投稿截止日期：2021年7月31日论文录用通知日期：2021年8月31日会议注册/终稿提交截止日期：2021年9月30日会议召开日期：2021年11月6日-7日

陈子鹏，硕士研究生，主要研究方向为人工智能、机器学习。郑蓝舟，微智娱（北京）科技有限公司首席技术官，主要研究方向为人工智能、机器学习、计算机博弈。第七届 IEEE 云计算与智能系统国际会议 IEEE the 7th International Conference on Cloud Computing and Intelligent Systems 由中国人工智能学会与 IEEE 北京分会共同主办，西安电子科技大学承办、西安民用航天基地管理委员会协办的 2021 年第七届 IEEE 云计算与智能系统国际会议将于 2021 年 11 月 6 日至 7 日在中国西安举办。即日起至 2021 年 7 月 31 日，会议将面向全球征集稿件，经会议审稿后录用的稿件将由 IEEE 出版，符合 IEEE 标准的会议论文可纳入 IEEE Xplore 数字图书馆。优秀论文将推荐至大会合作的 World Wide Web Journal、Chinese Journal of Electronics、China Communications 等 SCI 期刊。该会议旨在对云计算、人工智能的前沿技术和热点问题进行深入研究和探讨，以促进相关技术和产业的发展。为扩大云计算与智能科学技术领域的国际交流和合作，增强该领域内的学术影响，并给国际同行提供一个交流的平台，使参会者了解最新的学术动态，分享最新的研究成果。云计算与智能系统国际会议已在北京、杭州、深圳、香港、新加坡成功举办六届。本届会议将邀请中国工程院院士李德毅、中国科学院院士黄维、西安电子科技大学副校长石光明等顶尖 AI 领域学者担任主席。会议诚邀各界同行投稿。主要领域（但不限于此）: 1)Computational Intelligence;2)Cloud Computing and Big Data Analysis;3)Big Data Models and Algorithms;4） Deep Learning;5）Machine Learning;6）Parallel and Distributed Computing;7）Neural Networks and Learning Systems;8）Evolving Neural Networks; 9）Neural Network Applications;10）Big Data Security and Privacy;11）Computer Vision;12）Information Retrieval and Recommendation;13）Data Mining;14）Pattern Recognition and Image Processing;15）Human-Computer Interaction;16）Brain and Cognitive Science;17）Agents and Multi-Agent Systems; 18） Complex System and Network;19）Smart Grid Control System;20）Smart City & IoT;21）Intelligent Manufacturing;22） Hybrid Intelligence 投稿要求： 1）论文未曾在国内外杂志或会议上发表。 2）稿件写作必须使用英文，并严格按照模板要求进行排版。 3）投稿系统网址为:http://2021ccis.csp.escience.cn/dct/page/1。时间节点：论文投稿截止日期: 2021 年 7 月 31 日论文录用通知日期: 2021 年 8 月 31 日会议注册/终稿提交截止日期: 2021 年 9 月 30 日会议召开日期：2021 年 11 月 6 日-7 日第 3 期李淑琴，等：竞技二打一游戏中同等牌力的研究 ·473·

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录