正在加载图片...
·136· 智能系统学报 第3卷 统的调节外,还受人工情感系统的控制.最近几年, of tolerance)等等.也可以产生一些生理参数,如:促 人们开始意识到生物调节机制对开发新的自主计算 进信号.这个促进信号在行为代数中可以产生中断 方法的启发意义.典型工作如:W.M.Shen等人模 行为 拟人工情感系统分布调节机制,提出了一个简单的 2基于人工情感的控制结构设计 分布式同步控制算法,并将该算法应用于变结构机 器人研究91:D.Canamero提出了一个简单的人工 2.1BIC控制结构 情感模型,并将该模型应用于机器人行为的控制研 BC控制结构如图2所示.在设计机器人时考 究4):OGATAT借鉴人工情感系统对人体内环境 虑2个环境:行为环境和进化环境.机器人从基于遗 的动态调节机制,提出了一种新的机器人行为控制传算法的进化环境中得到神经网络的初始记忆.神 策略5]等.本文受生物系统控制论的启发,采用神 经网络作为系统的一个主要组成部分,它从行为环 经、进化和人工情感系统去共同控制机器人的行为. 境中接收信息,并控制效应器的动作和人工情感评 鉴于此,本文提出并实现了一种新的机器人体系结 估系统的状态变化,人工情感系统在接收到相应的 (integrated biology inspired control,IBIC), 神经信号后,分泌相应的激素,这些激素通过激素回 BIC中包含有进化、神经网络和人工情感控制系 路而返回给神经网络,对神经网络起着重要的调节 统.借鉴人工情感系统的调节机制,提出了一种新 作用,进而影响机器人的行为决策,神经网络中保存 的机器人行为规划算法. 有机器人对行为环境的适应结果.即使环境是变化 的,机器人也可以通过在环境中学习来完成任务.行 1情感学习控制 为环境的状态通过机器人的学习得到体现.机器人 图1这个交叉自适应阵列结构(crossbar adap- 可以根据反应机器人在己知环境适应度的数据结 tive array architecture,CAA)既要计算出状态的评 构,通过改变相应路径上的蚂蚁留下的信息素可以 价(即情感值),也要计算出行为的评价.它由3个基 进化给下一代,这样新一代对于同样的行为环境更 本模块组成:交叉记忆存储器、状态评估器、行为选 具有适应性 择器.基本流程:I)CAA首先计算出当前所处状态 行为环境 的情感值,然后通过一个反馈环计算出下一次在同 感输入 样的状态再选择这个行为的概率,2)状态评价模块 状态识别 Agent 计算出智能体全部的情感值:然后通过神经·荷尔 感知输出 蒙信号传给交叉学习存储器(crossbar learning 选择的 memory);3)行为计算模块使用一些行为的代数式. 神经系统行为 行为决策 效应器 初始行为默认为一个好奇驱动(curiosity driven), 行为记忆 然后逐渐地被学习后的行为所取代。 人工情 感系统 状态 状态的情感评估 情感值 情感学月 交叉记忆 学习后 行为 行为 情感因子(激素) 存储器 的行为 选择 Agentf信息激素 状态 个性 进化环境 评估器 参数 情感值 图2基于人工情感的机器人行为规划系统的工作结构 图1CAA结构 Fig 2 Robot architecture based on artificial emotion regulation mechanism Fig 1 Crossbar adaptive array architecture 个性参数模块针对特殊的智能体设置的个性参 图2中的人工情感系统由2个模块所构成:情 数,例如:好奇心(curiosity)、忍耐的限度(threshold 感评估模块和情感学习模块.情感评估模块根据神 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net统的调节外 ,还受人工情感系统的控制. 最近几年 , 人们开始意识到生物调节机制对开发新的自主计算 方法的启发意义. 典型工作如 :W. M. Shen 等人模 拟人工情感系统分布调节机制 ,提出了一个简单的 分布式同步控制算法 , 并将该算法应用于变结构机 器人研究[9213 ] ;D. Canamero 提出了一个简单的人工 情感模型 ,并将该模型应用于机器人行为的控制研 究[14 ] ;O GA TA T 借鉴人工情感系统对人体内环境 的动态调节机制 ,提出了一种新的机器人行为控制 策略[ 15 ]等. 本文受生物系统控制论的启发 ,采用神 经、进化和人工情感系统去共同控制机器人的行为. 鉴于此 ,本文提出并实现了一种新的机器人体系结 构 (integrated biology inspired control , IBIC) , 在 IBIC 中包含有进化、神经网络和人工情感控制系 统. 借鉴人工情感系统的调节机制 , 提出了一种新 的机器人行为规划算法. 1 情感学习控制 图 1 这个交叉自适应阵列结构 (crossbar adap2 tive array architect ure ,CAA) 既要计算出状态的评 价(即情感值) ,也要计算出行为的评价. 它由 3 个基 本模块组成 :交叉记忆存储器、状态评估器、行为选 择器. 基本流程 :1) CAA 首先计算出当前所处状态 的情感值 ,然后通过一个反馈环计算出下一次在同 样的状态再选择这个行为的概率 ;2) 状态评价模块 计算出智能体全部的情感值 ;然后通过神经 - 荷尔 蒙信号传给交叉学 习存储 器 ( crossbar learning memory) ;3) 行为计算模块使用一些行为的代数式. 初始行为默认为一个好奇驱动 (curio sity driven) , 然后逐渐地被学习后的行为所取代. 图 1 CAA 结构 Fig11 Crossbar adaptive array architecture 个性参数模块针对特殊的智能体设置的个性参 数 ,例如 :好奇心(curiosity) 、忍耐的限度 (t hreshold of tolerance) 等等. 也可以产生一些生理参数 ,如 :促 进信号. 这个促进信号在行为代数中可以产生中断 行为. 2 基于人工情感的控制结构设计 211 IBIC 控制结构 IBIC 控制结构如图 2 所示. 在设计机器人时考 虑 2 个环境 :行为环境和进化环境. 机器人从基于遗 传算法的进化环境中得到神经网络的初始记忆. 神 经网络作为系统的一个主要组成部分 ,它从行为环 境中接收信息 ,并控制效应器的动作和人工情感评 估系统的状态变化 ,人工情感系统在接收到相应的 神经信号后 ,分泌相应的激素 ,这些激素通过激素回 路而返回给神经网络 ,对神经网络起着重要的调节 作用 ,进而影响机器人的行为决策 ,神经网络中保存 有机器人对行为环境的适应结果. 即使环境是变化 的 ,机器人也可以通过在环境中学习来完成任务. 行 为环境的状态通过机器人的学习得到体现. 机器人 可以根据反应机器人在已知环境适应度的数据结 构 ,通过改变相应路径上的蚂蚁留下的信息素可以 进化给下一代 ,这样新一代对于同样的行为环境更 具有适应性. 图 2 基于人工情感的机器人行为规划系统的工作结构 Fig12 Robot architecture based on artificial emotion regulation mechanism 图 2 中的人工情感系统由 2 个模块所构成 :情 感评估模块和情感学习模块. 情感评估模块根据神 ·136 · 智 能 系 统 学 报 第 3 卷 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有