正在加载图片...
第6卷第2期 智能系统学报 Vol.6 No.2 2011年4月 CAAI Transactions on Intelligent Systems Apr.2011 doi:10.3969/i.issn.1673-4785.2011.02.009 不完全信息博弈的机器人对抗决策 史晓茹,侯媛彬,张涛 (西安科技大学电气与控制工程学院,陕西西安710054) 摘要:针对机器人比赛时局势的动态变化给机器人对抗决策博弈局面带来的不完全性问题,提出了豪尔绍尼转换 和贝叶斯均衡相融合的不完全信息博弈算法,该算法克服了博弈局势中对未知信息的盲目“猜测”.以机器人足球比 赛时的数据为背景建立不完全信息博弈模型,研究机器人的决策对抗系统.仿真结果表明,不完全信息博弈算法可 以使得机器人进行较优策略的选择,从而进一步提高机器人在比赛中的自主性和智能性. 关键词:不完全信息博弈:贝叶斯均衡;豪尔绍尼转换;对抗决策;机器人比赛 中图分类号:TP391文献标识码:A文章编号:16734785(2011)02014705 The decision-making system of robots based on an incomplete information game SHI Xiaoru,HOU Yuanbin,ZHANG Tao Xi'an University of Science and Technology Xi'an 710054,China Abstract:While considering the incomplete game situation of decision-making in robot competition caused by the dynamic changes of the situation,games of incomplete information fusing Harsanyi conversion and Bayesian equilib- ria were proposed.This enabled the elimination of blind guessing of unknown information in game circumstances. Based on the robot soccer competition,a game model of incomplete information was established and a decision-mak- ing robot system was researched.The simulation results showed that the incomplete information game algorithm can help robots to choose better strategies,further improving the independence and intelligence of robots in competi- tion. Keywords:incomplete information game;Bayesian equilibria;Harsanyi conversion;decision-making;robot compc- tition 博弈论(game theory)作为一门现代科学体系, 近年来,博弈论在机器人方面的应用都有了一定 起源于20世纪初,在二战后发展成为一门完整而丰 的研究3)],意大利的学者N.Basilico和N.Gatt4在 富的理论科学.博弈算法经过不断的研究、改进与提 其论文中将博弈论理论应用于模拟机器人学,并提出 高,目前已经成为解决诸多动态复杂环境中决策问 了Leader-Follower平衡;美国耶鲁大学的专家M.Be 题的一种重要方法.以往的机器人决策方法主要采 etz、S.Buck等人[S)在其论文中将合作概率博弈应用 用了有限状态机法山和智能体强化学习法21.常规 于足球机器人策略选择中,提高了机器人应对复杂环 的方法都是建立在信息完全已知的前提条件下的. 境的能力;国内的学者柳长安等6]在对已有仿真足球 足球机器人在进行比赛时,虽然场地的信息及周围 机器人协作防守战术分析研究的基础上,运用合作 的环境信息是可以通过视觉系统完全已知,但是由 人博弈理论对防守战术进行分析研究,提出了一种基 于局势的动态变化导致敌方的信息无法直接获取. 于合作4人博弈的足球机器人协作防守对策,并建立 随着博弈理论的演化和发展,不完全信息博弈理论 了数学模型,最后通过仿真实验验证了其正确性和有 的应用对常规的方法是很好的补充和优化. 效性;王云等刀在协调博弈信念形成过程的基础上, 利用智能体策略相似性,提出换位推理的协调博弈学 收稿日期:2010-04-15. 基金项目:陕西省自然科学基金资助项目(2009M8002) 习方法,通过信念修正模型将客观观察行为和主观预 通信作者:史晓茹.E-mail:xiaoru.girl@163.com 测行为结合在一起,从而能取得更好的协调性能:宋
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有