第3卷第3期 智能系统学报 Vol 3 Na 3 2008年6月 CAA I Transactions on Intelligent Systems Jun 2008 类人足球机器人决策系统的设计 陈永利,刘国栋 (江南大学通信与控制工程学院,江苏无锡214122) 摘要:类人机器人足球比赛是机器人足球比赛的最高赛事.类人足球机器人的决策系统是基于独立视觉的自主决 策系统,很大程度上决定着比赛的胜败.介绍了自主研发的类人足球机器人决策系统的架构及实现方法,并在此基 础上运用有限状态机理论,对单个机器人的自主进攻策略进行了详细分析和研究,真实环境中的实验及比赛结果证 明了其有效性.该决策系统的设计及研究工作对基于自主决策的多智能体协作以及服务性机器人决策系统的研究 都具有重要的价值. 关键词:类人机器人;决策系统;有限状态机:进攻策略 中图分类号:TP2426文献标识码:A文章编号:1673-4785(2008)03-0239-06 Design ng a decision makng system for humanoid soccer robots CHEN Yong-li,L U Guo-dong School of Communication and Control Engineering,Jiangnan University,Wuxi 214122,China) Abstract:Soccer played by humanoid robots is the highest level of robot soccer The humanoid soccer robot's deci- sion-making system is based on independent vision and detem ines,to a large extent,the results of any competi- tion This paper introduces a framework and mplementation methods for a decisionmaking system for such robots On this basis,the offensive strategy of a single humanoid soccer robot was analysed and studied in detail using finite state machine (FSM)theory Physical experments in the lab environment and results in actual competitions proved the validity of the system design The research offers iportant developments for both multi-agent collaboration based on independent decisonmaking and the study of active robot decision-making systems Keywords:humano id robot decision-making system;FSM;offensive strategy 类人机器人是多门基础学科、多项高技术的集能体协作的高级阶段561.以2007年的RoboCup国 成,代表了机器人的尖端技术山.类人机器人足球际机器人大赛为例,类人组开展的仍是2对2比赛 比赛是伴随着智能机器人技术和分布式人工智能的 及技术挑战赛.本文也主要是为单类人足球机器人 发展而迅速兴起的一种高科技对抗活动,是机器人 的自主决策提供一种较好的实现方法,目标是使机 和人工智能领域最具挑战性的研究课题之一2] 器人能够在动态不确定环境下通过有限的传感器信 类人机器人足球比赛与其他机器人足球比赛的不同 息,自主地完成找球、走近球、传球、射门、摔倒后重 点之一在于参赛的每个机器人都具有独立的视觉系 新站立等基本任务 统和自主的决策系统.决策系统又是每个类人足球 1实验平台 机器人的核心子系统,随着类人机器人硬件技术的 飞速发展,决策系统将成为类人机器人比赛成败的 自主开发的类人足球机器人具有20个自由度 关键 头部2个、每条胳膊各3个、每条腿各6个),各个 类人机器人足球比赛尚处起步阶段,目前比拼 自由度均由航模舵机构成.控制系统由以XScale 的主要是单机器人的自主决策,还没有上升到多智 PXA270为处理器的主控制板和以ATMEGA16L低 功耗单片机为处理器的舵机控制板组成.其中主控 收稿日期:2007-11-05. 板是决策过程进行的基础,舵机控制板负责决策命 通讯作者:陈永利.Emai止C13925@163.cam 令的具体执行 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 3卷第 3期 智 能 系 统 学 报 Vol. 3 №. 3 2008年 6月 CAA I Transactions on Intelligent System s Jun. 2008 类人足球机器人决策系统的设计 陈永利 ,刘国栋 (江南大学 通信与控制工程学院 ,江苏 无锡 214122) 摘 要 :类人机器人足球比赛是机器人足球比赛的最高赛事. 类人足球机器人的决策系统是基于独立视觉的自主决 策系统 ,很大程度上决定着比赛的胜败. 介绍了自主研发的类人足球机器人决策系统的架构及实现方法 ,并在此基 础上运用有限状态机理论 ,对单个机器人的自主进攻策略进行了详细分析和研究 ,真实环境中的实验及比赛结果证 明了其有效性. 该决策系统的设计及研究工作对基于自主决策的多智能体协作以及服务性机器人决策系统的研究 都具有重要的价值. 关键词 :类人机器人 ;决策系统 ;有限状态机 ;进攻策略 中图分类号 : TP242. 6 文献标识码 : A 文章编号 : 167324785 (2008) 0320239206 Design ing a dec ision2making system for humanoid soccer robots CHEN Yong2li, L IU Guo2dong ( School of Communication and Control Engineering, Jiangnan University, W uxi 214122, China) Abstract:Soccer p layed by humanoid robots is the highest level of robot soccer. The humanoid soccer robot’s deci2 sion2making system is based on independent vision and determ ines, to a large extent, the results of any competi2 tion. This paper introduces a framework and imp lementation methods for a decision2making system for such robots. On this basis, the offensive strategy of a single humanoid soccer robotwas analysed and studied in detail using finite state machine (FSM) theory. Physical experiments in the lab environment and results in actual competitions p roved the validity of the system design. The research offers important developments for both multi2agent collaboration based on independent decision2making and the study of active robot decision2making system s. Keywords: humanoid robot; decision2making system; FSM; offensive strategy 收稿日期 : 2007211205. 通讯作者 :陈永利. E2mail: CYL3925@163. com. 类人机器人是多门基础学科、多项高技术的集 成 ,代表了机器人的尖端技术 [ 1 ] . 类人机器人足球 比赛是伴随着智能机器人技术和分布式人工智能的 发展而迅速兴起的一种高科技对抗活动 ,是机器人 和人工智能领域最具挑战性的研究课题之一 [ 224 ] . 类人机器人足球比赛与其他机器人足球比赛的不同 点之一在于参赛的每个机器人都具有独立的视觉系 统和自主的决策系统. 决策系统又是每个类人足球 机器人的核心子系统 ,随着类人机器人硬件技术的 飞速发展 ,决策系统将成为类人机器人比赛成败的 关键. 类人机器人足球比赛尚处起步阶段 ,目前比拼 的主要是单机器人的自主决策 ,还没有上升到多智 能体协作的高级阶段 [ 526 ] . 以 2007年的 RoboCup国 际机器人大赛为例 ,类人组开展的仍是 2对 2比赛 及技术挑战赛. 本文也主要是为单类人足球机器人 的自主决策提供一种较好的实现方法 ,目标是使机 器人能够在动态不确定环境下通过有限的传感器信 息 ,自主地完成找球、走近球、传球、射门、摔倒后重 新站立等基本任务. 1 实验平台 自主开发的类人足球机器人具有 20个自由度 (头部 2个、每条胳膊各 3个、每条腿各 6个 ) ,各个 自由度均由航模舵机构成. 控制系统由以 XScale PXA270为处理器的主控制板和以 ATMEGA16L低 功耗单片机为处理器的舵机控制板组成. 其中主控 板是决策过程进行的基础 ,舵机控制板负责决策命 令的具体执行. © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
·240- 智能系统学报 第3卷 由于RoboCup比赛规则中明确规定机器人只 和高层动作.低层动作是只需一个动作文件就可完 能用等效于人类某个感官的传感器来感知其环境, 成的简单动作,高层动作是加入策略行为的需要多 传感器位置也应与人类相近,特别要求不允许使用 个动作文件才可完成的复杂动作.所有这些动作构 发射型传感器(向环境发射光、声、电磁波以测量发 成了机器人可选动作的集合即动作空间,定义如下 射信号),所以比赛中的类人机器人只使用了视觉 B =bb TumLeft,TumR ight,SidleLeft,SidleRi 传感器、前后方向与左右方向2个倾角传感器.视觉 ght,ShooLeft,ShootR ight,HeadLeft,HeadR ight,Head- 传感器采用C©D摄像头,用于采集比赛场地的图像 Up,HeadDown,HeadReset,WalkFoward,Ball- 信息,倾角传感器主要用来实时监测机器人的姿态, PassLeft.BallPassR ight RevolveBalLeft.RevolveBall- 2 决策系统描述 R ight,.RestandUp…}. 各个低层动作功能说明如下: 决策系统是整个类人机器人系统的决定部分 TumLeft(TumR ight):机器人身体向左(右)转 机器人决策系统的结构如图1所示.机器人通过视 动45° 觉系统获取现场信息,决策系统基于经转换处理过 SidleLeft(SidleR ight):机器人身体向左(右)侧 的视觉信息以及倾角传感器信息,经分析计算后从 移一步 策略库中调用相应的比赛策略,给机器人下发相应 ShooLeft(ShootR ight):左脚(右脚)踢球,调整 的动作,完成比赛任务。 力度参数可以选择合适的踢球力度. 视觉信息 HeadLeft(HeadR ight HeadUp、HeadDown):头以 倾角传感器 指定的角度向左(佑、上、下)转动一次, 信息 基于有限状态机 信总预处理 的策略库 HeadReset头部复位,即头部2个自由度转到 无上下和左右偏转的初始态, 各个高层动作功能说明如下: 自主行为决策 RestandUp:机器人摔倒后重新站立.通过倾角传 感器信息得知机器人是向前摔倒还是向后摔倒,从而 机器人动作 决定机器人是前向重新站立还是后向重新站立 W alkForward:机器人径直向前走,该高层动作 图1机器人决策系统结构 通过调用起步、中步、止步3个动作文件来实现.调 Fig 1 Robot decisionmaking system structure 整速度参数可以改变机器人行走的速度,选择中步 类人足球机器人自主决策系统的输入是经处理 的循环次数可以实现机器人行走任意整步数 的视觉信息与倾角传感器信息,输出的是机器人的 BallPassLeft(BallPassR ight):向左(右)方传球, 动作信息.实际上整个决策系统就是从传感器空间 该高层动作通过机器人身体的左右转、左右侧移以 到动作空间的一个映射,定义为 及左右脚踢球把球向左(佑)传到适当的地方 D:A→B RevolveBalLeft(RevolveBallR ight):机器人绕球 D表示决策过程;A={OurRobots,.R ivalRobots, 左(右)转,通过机器人身体的左右转、左右侧移实 Bal,OurGoamouth,R ivalGoamouth},为含有我方机 现,一般用于球在脚下时找对方球门. 器人位姿、对方机器人位置、球位置和双方球门位置 22信息预处理模块设计 信息的传感器信息空间;B表示机器人的动作空 输入是视觉信息,输出是密切关系机器人决策 间,下文中将给出详细定义 的赛场信息,包括双方机器人、球和双方球门的位 21动作层设计 置.信息预处理模块首先要解决的就是从输入到输 类人足球机器人动作层设计属于机器人运动学 出的信息转换.在实际比赛过程中,由于场地的光照 和动力学的范畴,该层抽象了足球机器人的动作,封 条件往往不是很理想,再加上场地外围观众的干扰, 装了机器人的物理模型运动学模型和动力学模型, 视觉传感器采集的信息往往有很大的噪声.在这种 完成了从机器人关节空间到动作空间的映射,从而 情况下,必须通过信息预处理模块对视觉信息进行 从机器人关节空间的细枝末节中解放出来,更方便 预处理,用软件的方法过滤噪声和矫正输入的视觉 的为决策系统服务 信息.所以,该模块的另一个重要作用就是保证从视 根据动作的复杂程度,把动作层分为低层动作 觉系统传来的传感器信息的完整、准确」 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
由于 RoboCup比赛规则中明确规定机器人只 能用等效于人类某个感官的传感器来感知其环境 , 传感器位置也应与人类相近 ,特别要求不允许使用 发射型传感器 (向环境发射光、声、电磁波以测量发 射信号 ) ,所以比赛中的类人机器人只使用了视觉 传感器、前后方向与左右方向 2个倾角传感器. 视觉 传感器采用 CCD摄像头 ,用于采集比赛场地的图像 信息 ,倾角传感器主要用来实时监测机器人的姿态. 2 决策系统描述 决策系统是整个类人机器人系统的决定部分. 机器人决策系统的结构如图 1所示. 机器人通过视 觉系统获取现场信息 ,决策系统基于经转换处理过 的视觉信息以及倾角传感器信息 ,经分析计算后从 策略库中调用相应的比赛策略 ,给机器人下发相应 的动作 ,完成比赛任务. 图 1 机器人决策系统结构 Fig. 1 Robot decision2making system structure 类人足球机器人自主决策系统的输入是经处理 的视觉信息与倾角传感器信息 ,输出的是机器人的 动作信息. 实际上整个决策系统就是从传感器空间 到动作空间的一个映射 ,定义为 D:A →B. D表示决策过程; A = {OurRobots, RivalRobots, Ball,OurGoalmouth, RivalGoalmouth} ,为含有我方机 器人位姿、对方机器人位置、球位置和双方球门位置 信息的传感器信息空间 ; B 表示机器人的动作空 间 ,下文中将给出详细定义. 2. 1 动作层设计 类人足球机器人动作层设计属于机器人运动学 和动力学的范畴 ,该层抽象了足球机器人的动作 ,封 装了机器人的物理模型、运动学模型和动力学模型 , 完成了从机器人关节空间到动作空间的映射 ,从而 从机器人关节空间的细枝末节中解放出来 ,更方便 的为决策系统服务. 根据动作的复杂程度 ,把动作层分为低层动作 和高层动作. 低层动作是只需一个动作文件就可完 成的简单动作 ,高层动作是加入策略行为的需要多 个动作文件才可完成的复杂动作. 所有这些动作构 成了机器人可选动作的集合即动作空间 ,定义如下 : B = { b | b = TurnLeft, TurnRight, SidleLeft, SidleRi2 ght, ShootLeft, ShootRight, HeadLeft, HeadRight, Head2 Up, HeadDown, HeadReset, WalkForward, Ball2 PassLeft, BallPassRight, RevolveBallLeft, RevolveBall2 Right, RestandUp…}. 各个低层动作功能说明如下 : TurnLeft(TurnRight) :机器人身体向左 (右 )转 动 45°. SidleLeft(SidleRight) :机器人身体向左 (右 )侧 移一步. ShootLeft(ShootRight) :左脚 (右脚 )踢球 ,调整 力度参数可以选择合适的踢球力度. HeadLeft(HeadRight、HeadUp、HeadDown) :头以 指定的角度向左 (右、上、下 )转动一次. HeadReset:头部复位 ,即头部 2个自由度转到 无上下和左右偏转的初始态. 各个高层动作功能说明如下 : RestandUp:机器人摔倒后重新站立. 通过倾角传 感器信息得知机器人是向前摔倒还是向后摔倒 ,从而 决定机器人是前向重新站立还是后向重新站立. WalkForward:机器人径直向前走 ,该高层动作 通过调用起步、中步、止步 3个动作文件来实现. 调 整速度参数可以改变机器人行走的速度 ,选择中步 的循环次数可以实现机器人行走任意整步数. BallPassLeft(BallPassRight) :向左 (右 )方传球. 该高层动作通过机器人身体的左右转、左右侧移以 及左右脚踢球把球向左 (右 )传到适当的地方. RevolveBallLeft(RevolveBallRight) :机器人绕球 左 (右 )转 ,通过机器人身体的左右转、左右侧移实 现 ,一般用于球在脚下时找对方球门. 2. 2 信息预处理模块设计 输入是视觉信息 ,输出是密切关系机器人决策 的赛场信息 ,包括双方机器人、球和双方球门的位 置. 信息预处理模块首先要解决的就是从输入到输 出的信息转换. 在实际比赛过程中 ,由于场地的光照 条件往往不是很理想 ,再加上场地外围观众的干扰 , 视觉传感器采集的信息往往有很大的噪声. 在这种 情况下 ,必须通过信息预处理模块对视觉信息进行 预处理 ,用软件的方法过滤噪声和矫正输入的视觉 信息. 所以 ,该模块的另一个重要作用就是保证从视 觉系统传来的传感器信息的完整、准确. ·240· 智 能 系 统 学 报 第 3卷 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第3期 陈永利,等:类人足球机器人决策系统的设计 ·241 3基于F9M的进攻决策 态,%∈QF为M的终止状态集合,F被Q包含,任 给g∈Fg称为M的终止状态 针对类人机器人的决策,目前主要有反应式和 有限状态机工作原理可以解释为非空的有限状 规划式2种主要的方法.反应式决策方法环境适应 态集合中,当前活动的状态输入事件触发后,在一定 能力强,反应速度快,但完成复杂任务的能力较差 的映射规则下实现状态转移 规划式决策方法又可分为基于决策树的决策方式、 3.2进攻决策的具体设计 基于遗传算法的决策方式、基于神经网络的决策方 本模块的设计思想是,使用最少的状态数目,调 式、基于模糊逻辑的决策方式等等.这类方法要么基 用最少的动作集合,以最高的可靠性完成比赛,基于 于完整的环境信息,不适宜于高度的动态环境,要么 F9M的决策过程流程图如图2所示.该有限状态机 基于大量而长期的记忆,增加对系统硬件的要求,降 共设计了Find_Ball(找球)、Approach_Ball(接近 低了反映速度.更有些时候,由于传感器采集信息的 球)、Ball_Pass(传球)、Shoot(射门)和RestandUp 不准确性还可能导致机器人的错误决策, (重新站立)5个基本状态,具体定义如下: 基于有限状态机(F9M)的决策方法是一个很好 State={Find_Ball,Approach_Ball,Shoot,Ball 的选择」该方法既能简化控制流程,又能兼顾系 Pass,RestandUp. 统的规划能力和快速反应特性,具有较高的鲁棒性 根据各状态的不同情况,状态机的不同的行为 采用有限状态机的智能方式来对环境做快速的策略 将被触发.其中5个状态相对应的触发条件定义如 评估,机器足球员可以依据所获得的环境信息自行 下: 决定适和当时赛况的决策,并且能顺应不同的决策 Ball Far.机器人离球较远, 做出不同的配套动作 Find No Ball:找不到球; 3.1有限状态机工作原理 FalDown:机器人摔倒; 有限状态机(FSM)是一个五元组,定义为 Obstacle:有别的机器人阻挡; M=(但,∑,6,0,F W ithout FalDown:机器人没有摔倒; 式中:Q为非空的有限状态集合,廿g∈Q,g称为M Ball Near and No Obstacle:球距离机器人很近 并且没有别的机器人阻挡; 的一个状态:∑为输入字母表:δ为状态转移函数, Ball Near but Obstacle:球距离机器人很近但有 有时又叫作状态转换函数或者移动函数,δ:Q×∑ 别的机器人阻挡; 一Q:%为开始状态,也可叫作初始状态或启动状 Trans Unconditional无条件转移 Find No Ball Ball_Far Approach Ball Near but Ball Ball Near and Obstacle No Obstacle Obstacle Ball Pass Find Ball Shoot Without FallDown Without FallDown Trans Unconditional RestandUp FallDown FallDown 图2决策过程流程图 Fig 2 The decisionmaking process flwchart 3.21各状态下的策略 找球状态是全部状态中最基础的状态,其他每 自由状态机的各个状态分别对应不同的策略过 个状态都与它有直接的转换关系.采用头部搜索加 程,复杂程度及实现方法各不相同.这些策略的集合 身体右转的策略完成找球任务.头部完成一次找球 就构成了机器人进行自主进攻决策的策略库 任务的过程如图3所示,带箭头的虚线指明了搜索 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
3 基于 FSM的进攻决策 针对类人机器人的决策 ,目前主要有反应式和 规划式 2种主要的方法. 反应式决策方法环境适应 能力强 ,反应速度快 ,但完成复杂任务的能力较差. 规划式决策方法又可分为基于决策树的决策方式、 基于遗传算法的决策方式、基于神经网络的决策方 式、基于模糊逻辑的决策方式等等. 这类方法要么基 于完整的环境信息 ,不适宜于高度的动态环境 ,要么 基于大量而长期的记忆 ,增加对系统硬件的要求 ,降 低了反映速度. 更有些时候 ,由于传感器采集信息的 不准确性还可能导致机器人的错误决策. 基于有限状态机 (FSM)的决策方法是一个很好 的选择 [ 728 ] . 该方法既能简化控制流程 ,又能兼顾系 统的规划能力和快速反应特性 ,具有较高的鲁棒性. 采用有限状态机的智能方式来对环境做快速的策略 评估 ,机器足球员可以依据所获得的环境信息自行 决定适和当时赛况的决策 ,并且能顺应不同的决策 做出不同的配套动作. 3. 1 有限状态机工作原理 有限状态机 (FSM)是一个五元组 ,定义为 M = (Q, ∑,δ, q0 , F). 式中 : Q 为非空的有限状态集合 , Π q ∈Q, q称为 M 的一个状态; ∑为输入字母表;δ为状态转移函数 , 有时又叫作状态转换函数或者移动函数 ,δ: Q ×∑ →Q; q0 为开始状态 , 也可叫作初始状态或启动状 态 , q0 ∈Q. F为 M 的终止状态集合 , F被 Q包含 ,任 给 q ∈ F, q称为 M 的终止状态. 有限状态机工作原理可以解释为非空的有限状 态集合中 ,当前活动的状态输入事件触发后 ,在一定 的映射规则下实现状态转移. 3. 2 进攻决策的具体设计 本模块的设计思想是 ,使用最少的状态数目 ,调 用最少的动作集合 ,以最高的可靠性完成比赛. 基于 FSM的决策过程流程图如图 2所示. 该有限状态机 共设计了 Find _Ball (找球 )、App roach _Ball (接近 球 )、Ball_Pass (传球 )、Shoot (射门 )和 RestandUp (重新站立 ) 5个基本状态 ,具体定义如下 : State = {Find_Ball, App roach_Ball, Shoot, Ball_ Pass, RestandUp} . 根据各状态的不同情况 ,状态机的不同的行为 将被触发. 其中 5个状态相对应的触发条件定义如 下 : Ball_Far:机器人离球较远 ; Find_No_Ball:找不到球 ; FallDown:机器人摔倒 ; Obstacle:有别的机器人阻挡 ; W ithout_FallDown:机器人没有摔倒 ; Ball_Near and No_Obstacle:球距离机器人很近 并且没有别的机器人阻挡 ; Ball_Near but Obstacle:球距离机器人很近但有 别的机器人阻挡 ; Trans_Unconditional:无条件转移. 图 2 决策过程流程图 Fig. 2 The decision2making p rocess flowchart 3. 2. 1 各状态下的策略 自由状态机的各个状态分别对应不同的策略过 程 ,复杂程度及实现方法各不相同. 这些策略的集合 就构成了机器人进行自主进攻决策的策略库. 找球状态是全部状态中最基础的状态 ,其他每 个状态都与它有直接的转换关系. 采用头部搜索加 身体右转的策略完成找球任务. 头部完成一次找球 任务的过程如图 3所示 ,带箭头的虚线指明了搜索 第 3期 陈永利 ,等 :类人足球机器人决策系统的设计 ·241· © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
·242- 智能系统学报 第3卷 的顺序,nit和End分别表示搜索一次的起始点和 应该绕球左转,直到看到对方门球;如果没有看到或 结束点.机器人按照低头(3次)—左转(2 只是看到一方的角球柱,则让机器人右转一次后开 次)抬头(3次)右转(4次)低头(3 始新一轮的判断 次)一左转(2次)的顺序完成一次搜索,如果不 找到对方球门后,身体自动调整,使对方球门位 能发现球则执行头复位(HeadRese)的同时身体右 于机器人视野的中部,然后低头确定球还在脚底下 转(TumR ight)2次,重复以上搜索过程,直到发现球 如果球仍在脚底下,且无对方球员阻碍,则判断球在 为止.在这里根据实际情况设定HeadLeft、Head- 机器人视野的位置,进而确定用左脚还是用右脚射 R ight.HeadUp、HeadDown执行一次均为30:头部 门,最后作出射门动作 之所以采用先向下搜索的策略是因为在实际比赛时 拾头找门 发现,机器人在其正前方找到球的几率是最大的 Init 看到门否 头右转60度 对方球门否 N 对方球门 Y 头复位,再 左转60° N 对方球门 N 看到门否N 头复位 Y End 绕球右转 Y 直到看到 对方球门 图3头部找球策略 对方球门 头复位 绕球右转 N Fig 3 The strategy of head finding ball 直到看到 通过 对方球门 头复位 角球 绕球右转 直到看到 接近球状态首先是要通过视觉信息使机器人在 对方球 判断 头无左右偏转的情况下正对球,然后利用测距模块 得到的信息算出球与机器人的距离,进而得到机器 身体自动调整,直到对方球 人应该走的步数,最后迅速走到球跟前 门位于机器人视野的中部 射门状态较为复杂,为使状态机数目尽可能少 低头确定球在脚底, 把球在机器人脚下且无对方球员阻碍以后的所有策 判断哪只脚射门 略都集中在此状态.整个射门状态的决策过程如图 头复位,射门 4所示. 首先,机器人抬头找球门.如果头无左右转动且 图4射门状态决策流程图 看到的是我方球门,则证明此时背对对方球门,任意 Fig 4 Shoot state decisionmaking fow chart 选择绕球右转或左转,直到看到对方球门,这里选择 了绕球右转:如果双方球门都看不见,则头右转 传球状态是要在对方球员阻碍我方球员进攻 60°,此时如果看到对方球门,说明机器人绕球右转 时,根据赛场情况把球往有利于我方机器人进攻的 能够尽快看到对方球门:同理,右转60后如果看到 方向做一个小的传动 的是我方球门,为尽快看到对方球门,应该绕球左 重新站立状态是指当我方机器人在任何情况下 转;如果右转60还看不到双方球门,则头复位,并 摔倒后重新站立,然后无条件转移到找球状态 左转60°,然后做与头右转60类似的决策 322基于F9M的状态触发及转移 头左转60后仍看不到门,则需要通过角球柱 机器人进入比赛状态后首先要做的就是找球」 信息进一步判断机器人该如何绕球转动以尽快找到 所以设置找球状态为状态机的入口点.当机器人处 对方球门.如果头右转时看到了对方的角球柱,且左 于找球状态且无FalDowni触发条件时,头部搜索加 转时看到了己方的角球柱,则机器人应该绕球右转, 身体右转的行为被触发,机器人开始对球进行搜索 直到看到对方球门:同理,如果头右转时看到了己方 一旦发现球,测距模块被启动,以确定机器人与球的 的角球柱,且左转时看到了对方的角球柱,则机器人 位置信息.若Ball Near and No_Obstacle条件成立, 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net
的顺序 , Init和 End分别表示搜索一次的起始点和 结束 点. 机 器 人 按 照 低 头 ( 3 次 ) ———左 转 ( 2 次 ) ———抬头 ( 3 次 ) ———右转 ( 4 次 ) ———低头 ( 3 次 ) ———左转 (2次 )的顺序完成一次搜索 ,如果不 能发现球则执行头复位 (HeadReset)的同时身体右 转 (TurnRight) 2次 ,重复以上搜索过程 ,直到发现球 为止. 在这里根据实际情况设定 HeadLeft、Head2 Right、HeadUp、HeadDown执行一次均为 30°. 头部 之所以采用先向下搜索的策略是因为在实际比赛时 发现 ,机器人在其正前方找到球的几率是最大的. 图 3 头部找球策略 Fig. 3 The strategy of head finding ball 接近球状态首先是要通过视觉信息使机器人在 头无左右偏转的情况下正对球 ,然后利用测距模块 得到的信息算出球与机器人的距离 ,进而得到机器 人应该走的步数 ,最后迅速走到球跟前. 射门状态较为复杂 ,为使状态机数目尽可能少 , 把球在机器人脚下且无对方球员阻碍以后的所有策 略都集中在此状态. 整个射门状态的决策过程如图 4所示. 首先 ,机器人抬头找球门. 如果头无左右转动且 看到的是我方球门 ,则证明此时背对对方球门 ,任意 选择绕球右转或左转 ,直到看到对方球门 ,这里选择 了绕球右转 ; 如果双方球门都看不见 ,则头右转 60°,此时如果看到对方球门 ,说明机器人绕球右转 能够尽快看到对方球门 ;同理 ,右转 60°后如果看到 的是我方球门 ,为尽快看到对方球门 ,应该绕球左 转 ;如果右转 60°还看不到双方球门 ,则头复位 ,并 左转 60°,然后做与头右转 60°类似的决策. 头左转 60°后仍看不到门 ,则需要通过角球柱 信息进一步判断机器人该如何绕球转动以尽快找到 对方球门. 如果头右转时看到了对方的角球柱 ,且左 转时看到了己方的角球柱 ,则机器人应该绕球右转 , 直到看到对方球门 ;同理 ,如果头右转时看到了己方 的角球柱 ,且左转时看到了对方的角球柱 ,则机器人 应该绕球左转 ,直到看到对方门球 ;如果没有看到或 只是看到一方的角球柱 ,则让机器人右转一次后开 始新一轮的判断. 找到对方球门后 ,身体自动调整 ,使对方球门位 于机器人视野的中部 ,然后低头确定球还在脚底下. 如果球仍在脚底下 ,且无对方球员阻碍 ,则判断球在 机器人视野的位置 ,进而确定用左脚还是用右脚射 门 ,最后作出射门动作. 图 4 射门状态决策流程图 Fig. 4 Shoot state decision2making flow chart 传球状态是要在对方球员阻碍我方球员进攻 时 ,根据赛场情况把球往有利于我方机器人进攻的 方向做一个小的传动. 重新站立状态是指当我方机器人在任何情况下 摔倒后重新站立 ,然后无条件转移到找球状态. 3. 2. 2 基于 FSM的状态触发及转移 机器人进入比赛状态后首先要做的就是找球 , 所以设置找球状态为状态机的入口点. 当机器人处 于找球状态且无 FallDown触发条件时 ,头部搜索加 身体右转的行为被触发 ,机器人开始对球进行搜索. 一旦发现球 ,测距模块被启动 ,以确定机器人与球的 位置信息. 若 Ball_Near and No_Obstacle条件成立 , ·242· 智 能 系 统 学 报 第 3卷 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第3期 陈永利,等:类人足球机器人决策系统的设计 ·243· 则找球状态立刻终止,机器人转换为射门状态;同 break: 理,若Ball Near but Obstacle条件成立,则立即转换 case Approach_Ball: 为传球状态;若Ball Far条件成立,则立即转换为接 autoApproach Ball(); 近球状态;如果找球过程的任何时刻FalDown,则立 break; 即转移到重新站立状态.其他状态的触发及转移情 case Ball Pass 况依此类推」 autoBall Pass(); 3.3实验及结果分析 break: 图5为真实环境中对所设计的基于F9M的进 case Shoot 攻策略的一次实验.首先,处于任意位置的机器人开 autoShoot(); 始找球(如图5(a),找到球后经测距模块得知球 break; 距机器人较远,所以机器人正对球后向球走去(如 case RestandUp: 图5(b)),此时完成从找球到接近球的状态转换.当 autoRestandUp () 球位于机器人脚下时,机器人判断球门的位置以及 break: 前方有无障碍,当发现正前方即为球门并且无障碍 default 时,再次低头确定球还在脚底下(如图5(c)),最 break: 后,机器人判断球位于自己的左脚前,抬左脚并射门 如图5(d)).此时完成接近球到踢球的状态转换. 整个过程机器人的状态切换平稳、及时、准确,动作 5结束语 完成自然流畅 应用本文设计的类人足球机器人决策系统,曾 在2007年的全国机器人大赛中出色地完成了比赛 任务,并获三等奖.实验和比赛结果证明了该设计方 法是可行的.但是,动态环境下,面向更复杂任务的 规划、多行为协调、多机器人智能体协作等问题仍有 (a)找球 (b)接近球 待进一步的研究.随着硬件技术的提高,特别是多智 能体理论的成熟,开发出适应复杂环境变化的高效、 稳定、鲁棒性强的多机器人智能决策系统,把机器人 真正像人一样踢足球当成追求的目标,也是今后足 球机器人系统的发展趋势 (C)球在脚下 (d)射门 参考文献: 图5真实环境中的实验 [1 ]ASADA M,KITANO H The robocup challenge [J].Robotics Fig 5 Experments in true enviromment and Autonomous System s,1999,29:3-12 4进攻决策的C语言实现 [2]FDR NI P,SH LLER Z Motion planning in dynam ic envi- rorments using velocity obstacles [J ]Intemational Joumal 一旦进入比赛状态,等开球过后机器人就会不 of Robotics Research,1998,17(7):760-772 停的完成找球,接近球,射门的比赛任务.用C语言 [3钟碧良.机器人足球系统的研究与实现[D]广州:广东 实现如下,其中autoFind_Bal()、autoApproach 工业大学,2002 Ball()、autoBall Pass()、autoShoot()和autoRes- ZHONG Biliang Study and mplementation of robot soccer tandUp()为对应5个自由状态的执行函数 system [D].Guangzhou:Guangdong University of Technob- while (1) y,2002 [4高大志,张春晖,徐心和.机器人足球智能机器人的 { 新领域[J1机器人,1998,20(4):309-314 Switch State) GAO Dazhi,ZHANG Chunhui,XU Xinhe Robot soccer-the new field of intelligent robot[J]Robot 1998,20(4):309- case Find Ball 314 autoFind Ball() [5黄维芳,白振兴.RoboCup中Agnt理论与结构研究[J] 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net
则找球状态立刻终止 ,机器人转换为射门状态 ;同 理 ,若 Ball_Near but Obstacle条件成立 ,则立即转换 为传球状态 ;若 Ball_Far条件成立 ,则立即转换为接 近球状态 ;如果找球过程的任何时刻 FallDown,则立 即转移到重新站立状态. 其他状态的触发及转移情 况依此类推. 3. 3 实验及结果分析 图 5为真实环境中对所设计的基于 FSM 的进 攻策略的一次实验. 首先 ,处于任意位置的机器人开 始找球 (如图 5 ( a) ) ,找到球后经测距模块得知球 距机器人较远 ,所以机器人正对球后向球走去 (如 图 5 ( b) ) ,此时完成从找球到接近球的状态转换. 当 球位于机器人脚下时 ,机器人判断球门的位置以及 前方有无障碍 ,当发现正前方即为球门并且无障碍 时 ,再次低头确定球还在脚底下 (如图 5 ( c) ) ,最 后 ,机器人判断球位于自己的左脚前 ,抬左脚并射门 (如图 5 ( d) ). 此时完成接近球到踢球的状态转换. 整个过程机器人的状态切换平稳、及时、准确 ,动作 完成自然流畅. 图 5 真实环境中的实验 Fig. 5 Experiments in true environment 4 进攻决策的 C语言实现 一旦进入比赛状态 ,等开球过后机器人就会不 停的完成找球 ,接近球 ,射门的比赛任务. 用 C语言 实现如下 , 其中 autoFind _Ball ( )、autoApp roach _ Ball()、autoBall _Pass ( )、autoShoot ( ) 和 autoRes2 tandUp ()为对应 5个自由状态的执行函数. while (1) { Switch (State) { case Find_Ball: autoFind_Ball( ) ; break; case App roach_Ball: autoApp roach_Ball( ) ; break; case Ball_Pass: autoBall_Pass( ) ; break; case Shoot: autoShoot( ) ; break; case RestandUp: autoRestandUp ( ) ; break; default: break; } } 5 结束语 应用本文设计的类人足球机器人决策系统 ,曾 在 2007年的全国机器人大赛中出色地完成了比赛 任务 ,并获三等奖. 实验和比赛结果证明了该设计方 法是可行的. 但是 ,动态环境下 ,面向更复杂任务的 规划、多行为协调、多机器人智能体协作等问题仍有 待进一步的研究. 随着硬件技术的提高 ,特别是多智 能体理论的成熟 ,开发出适应复杂环境变化的高效、 稳定、鲁棒性强的多机器人智能决策系统 ,把机器人 真正像人一样踢足球当成追求的目标 ,也是今后足 球机器人系统的发展趋势. 参考文献 : [ 1 ]ASADA M, KITANO H. The robocup challenge[J ]. Robotics and Autonomous Systems, 1999, 29: 3212. [ 2 ] F IOR IN I P, SH ILLER Z. Motion p lanning in dynamic envi2 ronments using velocity obstacles[ J ]. International Journal of Robotics Research, 1998, 17 (7) : 7602772. [ 3 ]钟碧良. 机器人足球系统的研究与实现 [D ]. 广州 :广东 工业大学 , 2002. ZHONG Biliang. Study and imp lementation of robot soccer system [D ]. Guangzhou: Guangdong University of Technolo2 gy, 2002. [ 4 ]高大志 ,张春晖 ,徐心和. 机器人足球 ———智能机器人的 新领域 [J ]. 机器人 , 1998, 20 (4) : 3092314. GAO Dazhi, ZHANG Chunhui, XU Xinhe. Robot soccer2the new field of intelligent robot[J ]. Robot, 1998, 20 ( 4) : 3092 314. [ 5 ]黄维芳 ,白振兴. RoboCup中 Agent理论与结构研究 [J ]. 第 3期 陈永利 ,等 :类人足球机器人决策系统的设计 ·243· © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
·244· 智能系统学报 第3卷 现代电子技术,2006,29(2):6-8 作者简介: HUANG Weifang.BA I Zhenxing A study of theories and 陈永利,男,1982年生,硕士研究 structure of Agent in robocup [J].Modem Electronic Tech- 生,主要研究方向为自主移动机器人. nique,2006,29(2):6-8 [6杨善林,倪志伟.机器学习与智能决策支持系统[M].北 京:科学出版社,2004:4-19. [7贾建强,陈卫东,席裕庚.基于有限状态机的足球机器人 刘国栋,男,1950年生,教授,博士 行为设计与综合[J]高科技通信,2004,14(4):6165 生导师,主要研究方向为智能控制及机 J Jianqiang.CHEN Weidong,XI Yugeng Behavor design 器人系统,在国内外期刊发表论文20 and synthesis of autonomous soccer robot based on FSM [J]. 余篇 High Technobgy Letters,2004,14(4):61-65. [8蒋宗,姜守旭.形式语言与自动机理论M)北京:清 华大学出版社,2003:86-102 第3届智能计算及其应用国际会议(SCA2008) The 3rd Iternational Sym posium on Intelligence Com putation and Applica tions The 3rd Intemational Symposium on Intelligence Computation and Applications(IS CA 2008)will be held on December 19-21,2008 in Wuhan China Following the successful IS ICA 2005 and IS CA 2007 sponsored by the China University of Geosciences(CUG),one proceedings of ISCA 2007 published by Springer has been indexed by EI and ISTP,and the other proceedings of IS CA 2007 published by Press of China University of Geosciences has been indexed by ISTP Subm ission and Publication All papers should be in PDF omat,and subm itted electronically through the conference website The manu- scrpts should be written in English and ollw the LNCS omat provided by Springer (htp://www.springer de/ comp/Incs/authors hmI).Full papers are limited maxium 10 pages Two IS CA 2008 proceedings will be published One of IS A 2008 proceedings has been officially accepted by Springer to be published in Lecture Notes in Computer Science(LNCS).It would include high quality papers that contribute novel results and advance the state of the art of methods and foundations in computational intelli- gence The other IS CA 2008 proceedings would mainly collect innovative applications of computational intelli- gence It will be published by the Press of China University of Geosciences The emphasis of ISICA 2008 will be on the develpment of theories and methodobgies in the field of computa- tional intelligence and their applications It covers all top ics in intelligent computation,including,but not lm ited to: Evolutionary computation ·Neural networks ·Fuzzy systems .Ant colony optm ization ·A rtific ial life Bioinfomatics bioengineering Combinatorial numerical optm ization Evolutionary data m ining Evolutionary leaming systems Evolutionary multiobjective and dynam ic optm ization .Molecular quantum computing Representations operators Realworld applications Theory of intelligent computation W eb site:http://isica cug edu cn/ Ema il:isica2008@yahoo cn 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net
现代电子技术 , 2006, 29 (2) : 628. HUANG W eifang, BA I Zhenxing. A study of theories and structure of Agent in robocup [J ]. Modern Electronic Tech2 nique, 2006, 29 (2) : 628. [ 6 ]杨善林 ,倪志伟. 机器学习与智能决策支持系统 [M ]. 北 京 :科学出版社 , 2004: 4219. [ 7 ]贾建强 ,陈卫东 ,席裕庚. 基于有限状态机的足球机器人 行为设计与综合 [J ]. 高科技通信 , 2004, 14 (4) : 61265. J IA Jianqiang, CHEN W eidong, X I Yugeng. Behavior design and synthesis of autonomous soccer robot based on FSM [J ]. H igh Technology Letters, 2004, 14 (4) : 61265. [ 8 ]蒋 宗 ,姜守旭. 形式语言与自动机理论 [M ]. 北京 :清 华大学出版社 , 2003: 862102. 作者简介 : 陈永利 ,男 , 1982 年生 ,硕士研究 生 ,主要研究方向为自主移动机器人. 刘国栋 ,男 , 1950年生 ,教授 ,博士 生导师 ,主要研究方向为智能控制及机 器人系统 ,在国内外期刊发表论文 20 余篇. 第 3届智能计算及其应用国际会议 ( ISICA 2008) The 3rd In terna tiona l Sym posium on Intelligence Com puta tion and Applica tions The 3 rd International Symposium on Intelligence Computation and App lications ( ISICA 2008) will be held on December 19221, 2008 in W uhan China. Following the successful ISICA 2005 and ISICA 2007 sponsored by the China University of Geosciences (CUG) , one p roceedings of ISICA 2007 published by Sp ringer has been indexed by E I and ISTP, and the other p roceedings of ISICA 2007 published by Press of China University of Geosciences has been indexed by ISTP. Subm ission and Publica tion A ll papers should be in PDF format, and subm itted electronically through the conference website. The manu2 scrip ts should be written in English and follow the LNCS format p rovided by Sp ringer ( http: / /www. sp ringer. de / comp /lncs/ authors. htm l). Full papers are lim ited to maximum 10 pages. Two ISICA 2008 p roceedings will be published. One of ISICA 2008 p roceedings has been officially accep ted by Sp ringer to be published in Lecture Notes in Computer Science (LNCS). It would include high quality papers that contribute novel results and advance the state of the art of methods and foundations in computational intelli2 gence. The other ISICA 2008 p roceedings would mainly collect innovative app lications of computational intelli2 gence. It will be published by the Press of China University of Geosciences. The emphasis of ISICA 2008 will be on the development of theories and methodologies in the field of computa2 tional intelligence and their app lications. It covers all top ics in intelligent computation, including, but not limited to: · Evolutionary computation · Fuzzy system s ·A rtificial life ·Combinatorial & numerical op tim ization ·Evolutionary learning system s ·Molecular & quantum computing ·Real2world app lications ·Neural networks ·Ant colony op tim ization ·Bioinformatics & bioengineering ·Evolutionary data m ining ·Evolutionary multi2objective and dynam ic op tim ization · Rep resentations & operators ·Theory of intelligent computation W eb site: http: / /isica. cug. edu. cn / E2ma il: isica2008@yahoo. cn ·244· 智 能 系 统 学 报 第 3卷 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net