高兴曰猿冤如果光强度是很高袁且障碍物距离是中袁则满意曰源冤如果光强度

正在加载图片...

·100 智能系统学报第10卷高兴： 2.4算法流程 3)如果光强度是很高，且障碍物距离是中，则移动机器人基于内发动机自主学习算法步骤为满意； 1)初始化行为选择和评价环节中各初始值，及 4)如果光强度是很高，且障碍物距离是近，则不各神经元连接权值：初始化机器人的各状态变量满意；并归一化： 5)如果光强度是很高，且障碍物距离是很近，则 2)根据环境状态量s(t),计算奖赏信号r(t)、忧伤： r(t); 6)如果光强度是高，且障碍物距离是很远，则 3)行为选择环节根据状态量s(t)计算动作高兴：量a(t): 7)如果光强度是高，且障碍物距离是远，则高兴： 4)评价环节根据状态量s(t)和动作量a(t)对 8)如果光强度是高，且障碍物距离是中，则满意；动作量评价，输出评价值V(t); 5)取向环节根据评价值V(t),计算取向信息，文中采用了重心模糊推理方法得出精确化后利用取向信息，调整动作量a(t+1)输出：的输出情感因子入，公式为 6)将动作量a(t+1)对环境实施操作，环境产生 ∑A 下一时刻的状态量s(t+1): 入= (1 ∑？m 7)返回2)，直到产生的各状态量满足智能体的期望性能指标，则执行8)： ?:是通过代数乘积方法得到的每一条规则真实值。 8)行为决策模块对动作量加权并对客体实施 2.3基于情感智能的机器人趋光仿生模型设计操作，客体产生下一时刻的状态量：依据感觉运动系统的内发动机机制2,1别)，设计了 9)结束。包含3个模块的机器人模型，如图5所示，分别是评价模块、行为选择模块、取向模块。评价环节根据输入状 3仿真实验态s(t)、奖惩信号r(t)和动作量a(t),对动作量a(t) 3.1趋光实验进行评价输出评价值V.(t),评价函数为为验证算法的有效性，采用MATLAB仿真软 V.(t)= =+.(+D) (2) 件，仿真环境中圆形表示光源位置，方形表示障碍物，环境中分布着有限个静态障碍物，以机器人的式中：y是折扣因子，表示近期和远期回报预测的重趋光学习为目标进行研究，光源位置和移动机器人要程度。奖赏信号r(t)包括2部分：环境给予的外起点位置可以任意设定，移动机器人运动起点位置部奖赏信号r(t)和情感智能给予的内部奖赏信号注明“S”,终点位置注明“G”,设定光源所在位置光 r.(t),情感模型输出的情感因子λ(0<λ<1)作为内强是1坎德拉(Candela),与光源越远的位置光强越部奖赏信号r.(t)。评价网络采用前馈神经网络构弱，按e指数规律减弱。机器人对环境是完全未知成，采用时间差分函数对评价函数进行逼近。取向的，可以自定位，采用在线学习方式。机器人匀速环节根据评价值V(t)生成取向信息，判定该动作移动，设定线速度v为0.5m/s,采样时间是T=1s。在以后出现时选择的概率。行为选择环节根据状移动机器人进行试探学习，每次学习步数不超过态量s(t)、评价值V(t)和取向信息输出动作量 1000步，每次学习移动机器人从起始位置出发，到 α(t)。行为选择环节采用前馈神经网络实现，应满达光源附近位置停止，学习结束，准备进行下一次足以较大概率从行为集合中选择具有最大行为值学习，如果学习步数超过1000步仍未到达光源附函数的元素。机器人对环境（或客体）实施操作，得件位置，则终止这次学习，进行下一次学习。趋光到奖惩信号r(t+1),环境并转变为新的状态，然后学习评价环节趋光输入域是x(t)=[o(t),0,(t), 重复感知到行动这一过程，最终完成机器人的自主 d,(t),d,(t),(t)]T,其中0(t)为机器人当前方向趋光学习。仿生模型见图5。与目标点的夹角。趋光学习行为选择环节输入域输人评价环节取向环节是s(t)=[o(t),o,(t),d(t),d,(t)]'。 s(D 感知行动图6是机器人在有障碍物的环境下趋光学习情状态 a(t) s(1) r() 况。图6(a)是学习初期试探结果，机器人从起始位行为选择环节置出发并不向光源方向运动，说明机器人原本不具备趋光能力。图6(b)是学习中期试探结果，机器人环境（客体）机器人起始位置出发到达接近光源附近位置停止，但并未图5基于情感智能的机器人趋光仿生模型始终按光源所在方向移动，说明通过学习并未完全 Fig.5 The robot phototaxis biomimetic model based on 掌握趋光能力。6(c)是机器人从起始位置出发到 emotion intelligence 达接近光源附近位置停止，始终按光源所在方向移高兴曰猿冤如果光强度是很高袁且障碍物距离是中袁则满意曰源冤如果光强度是很高袁且障碍物距离是近袁则不满意曰缘冤如果光强度是很高袁且障碍物距离是很近袁则忧伤曰远冤如果光强度是高袁且障碍物距离是很远袁则高兴曰苑冤如果光强度是高袁且障碍物距离是远袁则高兴曰愿冤如果光强度是高袁且障碍物距离是中袁则满意曰噎噎文中采用了重心模糊推理方法得出精确化后的输出情感因子姿袁公式为姿越移怨蚤越员浊蚤姿蚤移怨蚤越员浊蚤渊员冤浊蚤是通过代数乘积方法得到的每一条规则真实值遥圆援猿摇基于情感智能的机器人趋光仿生模型设计依据感觉运动系统的内发动机机制咱圆袁员怨鄄圆园暂袁设计了包含猿个模块的机器人模型袁如图缘所示袁分别是评价模块尧行为选择模块尧取向模块遥评价环节根据输入状态泽渊贼冤尧奖惩信号则渊贼冤和动作量葬渊贼冤袁对动作量葬渊贼冤进行评价输出评价值灾藻渊贼冤袁评价函数为灾藻( )贼越移 ∞ 躁越贼酌躁原贼则( )躁越则( )贼垣酌灾藻( ) 贼垣员渊圆冤式中院酌是折扣因子袁表示近期和远期回报预测的重要程度遥奖赏信号则渊贼冤包括圆部分院环境给予的外部奖赏信号则燥渊贼冤和情感智能给予的内部奖赏信号则藻渊贼冤袁情感模型输出的情感因子姿渊园约姿约员冤作为内部奖赏信号则藻渊贼冤遥评价网络采用前馈神经网络构成袁采用时间差分函数对评价函数进行逼近遥取向环节根据评价值灾藻渊贼冤生成取向信息袁判定该动作在以后出现时选择的概率遥行为选择环节根据状态量泽渊贼冤尧评价值灾藻渊贼冤和取向信息输出动作量葬渊贼冤遥行为选择环节采用前馈神经网络实现袁应满足以较大概率从行为集合中选择具有最大行为值函数的元素遥机器人对环境渊或客体冤实施操作袁得到奖惩信号则渊贼垣员冤袁环境并转变为新的状态袁然后重复感知到行动这一过程袁最终完成机器人的自主趋光学习遥仿生模型见图缘遥图缘摇基于情感智能的机器人趋光仿生模型云蚤早援缘摇栽澡藻则燥遭燥贼责澡燥贼燥贼葬曾蚤泽遭蚤燥皂蚤皂藻贼蚤糟皂燥凿藻造遭葬泽藻凿燥灶藻皂燥贼蚤燥灶蚤灶贼藻造造蚤早藻灶糟藻圆援源摇算法流程移动机器人基于内发动机自主学习算法步骤为员冤初始化行为选择和评价环节中各初始值袁及各神经元连接权值曰初始化机器人的各状态变量袁并归一化曰圆冤根据环境状态量泽渊贼冤袁计算奖赏信号则燥渊贼冤尧则藻渊贼冤曰猿冤行为选择环节根据状态量泽渊贼冤计算动作量葬渊贼冤曰源冤评价环节根据状态量泽渊贼冤和动作量葬渊贼冤对动作量评价袁输出评价值灾藻渊贼冤曰缘冤取向环节根据评价值灾藻渊贼冤袁计算取向信息袁利用取向信息袁调整动作量葬渊贼垣员冤输出曰远冤将动作量葬渊贼垣员冤对环境实施操作袁环境产生下一时刻的状态量泽渊贼垣员冤曰苑冤返回圆冤袁直到产生的各状态量满足智能体的期望性能指标袁则执行愿冤曰愿冤行为决策模块对动作量加权并对客体实施操作袁客体产生下一时刻的状态量曰怨冤结束遥猿摇仿真实验猿援员摇趋光实验为验证算法的有效性袁采用酝粤栽蕴粤月仿真软件袁仿真环境中圆形表示光源位置袁方形表示障碍物袁环境中分布着有限个静态障碍物袁以机器人的趋光学习为目标进行研究袁光源位置和移动机器人起点位置可以任意设定袁移动机器人运动起点位置注明野杂冶袁终点位置注明野郧冶袁设定光源所在位置光强是员坎德拉渊悦葬灶凿藻造葬冤袁与光源越远的位置光强越弱袁按藻指数规律减弱遥机器人对环境是完全未知的袁可以自定位袁采用在线学习方式遥机器人匀速移动袁设定线速度增为园援缘皂辕泽袁采样时间是栽越员泽遥移动机器人进行试探学习袁每次学习步数不超过员园园园步袁每次学习移动机器人从起始位置出发袁到达光源附近位置停止袁学习结束袁准备进行下一次学习袁如果学习步数超过员园园园步仍未到达光源附件位置袁则终止这次学习袁进行下一次学习遥趋光学习评价环节趋光输入域是曾渊贼冤越咱燥造渊贼冤袁燥则渊贼冤袁凿造渊贼冤袁凿则渊贼冤袁兹渊贼冤暂栽袁其中兹渊贼冤为机器人当前方向与目标点的夹角遥趋光学习行为选择环节输入域是泽渊贼冤越咱燥造渊贼冤袁燥则渊贼冤袁凿造渊贼冤袁凿则渊贼冤暂栽遥图远是机器人在有障碍物的环境下趋光学习情况遥图远渊葬冤是学习初期试探结果袁机器人从起始位置出发并不向光源方向运动袁说明机器人原本不具备趋光能力遥图远渊遭冤是学习中期试探结果袁机器人起始位置出发到达接近光源附近位置停止袁但并未始终按光源所在方向移动袁说明通过学习并未完全掌握趋光能力遥远渊糟冤是机器人从起始位置出发到达接近光源附近位置停止袁始终按光源所在方向移窑员园园窑智能系统学报摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第员园卷

<<向上翻页向下翻页>>

点击下载：智能系统：一种基于情感智能的机器人自主趋光行为研究