正在加载图片...
240 工程科学学报,第44卷,第2期 系统中的独特优势,逐渐被应用到无人车的运动 降法,因此需要计算偏导数或灵敏度函数.该方法 控制中,利用神经网络,可以动态调整MPC的预 存在学习速度慢和计算时间长等缺点,且难以用 瞄时间、补偿MPC的线性化误差,从而提高MPC 解析的方式证明学习过程的收敛性和稳定性.为 对无人车运动的控制精度 了解决这些问题,文献[54]提出了2型模糊神经 4.1优化PID控制算法参数 网络和基于滑模控制理论的学习算法.基于滑模 文献[51]针对无人驾驶铰接式运输车的运动 控制的学习算法不仅可以使整个系统具有更好的 控制问题,提出了基于强化学习的自适应PD控 鲁棒性,而且比传统的学习技术具有更快的收敛 制算法.强化学习不需要训练样本,可以根据外界 速度.采用比例-积分-微分控制器来控制车辆的 环境反馈和评价结果来确定下一次执行动作.使 纵向速度.在横向运动控制中,比例导数控制器 用强化学习方法对PD参数进行在线实时整定, 与2型模糊神经网络并行工作,有效解决了系统 使控制器可以自适应不同的路况.在建立铰接车 中各种不确定关系和外部干扰 模型的基础上,根据模型参考自适应控制器的原 4.2优化模型预测控制参数 理,设计了基于强化学习的自适应PD路径跟踪 常规MPC控制器的预瞄时间为0.4~1.2s之 控制器.参考模型规定了偏差收敛的趋势,以获得 间的一个恒定值.但无人车运动控制中的预瞄时 理想的收敛效果.回报函数计算当前参数效果的 间应当根据车速、路面情况、道路几何形状动态 评价,通过累计历史回报计算综合回报指标.神经 调整,以避免车辆过多地偏离目标路径.文献[55) 网络以横向位置偏差、航向角偏差、曲率偏差为 选用车速、横向偏差为神经网络控制器的输入,预 输入,以转角控制量为输出,对历史多次参数调整 瞄步长为神经网络的输出,利用仿真软件得到不 结果的优劣评价,再根据评价调整新的增益参数, 同工况下的训练样本.经过测试,采用预瞄时间动 并传递给PD控制器.仿真表明,基于强化学习的 态调整的控制方法,车辆在转弯处的跟踪精度虽 PD控制器能够较好地减小超调和震荡,实现参考 然略有降低,但是在直线处跟踪效果较好且车辆 路径的精确跟踪 行驶更加稳定,路径跟踪的总体精度得到提高 驾驶员单点预瞄模型可以通过车辆前方的道 MPC对车辆模型的线性化,可以减少控制过 路信息和汽车的行驶状况,根据汽车行驶轨迹与 程中的计算量,提高控制的实时性,但同时也降低 预瞄轨迹误差最小的原则,决定最优的横向加速 了控制精度,特别是在道路曲率复杂时.因此在保 度.文献[52]通过驾驶员单点预瞄模型与神经网 证控制实时性的前提下,如何动态补偿线性化误 络的结合,实现了车辆横向运动PID自适应控制. 差值得深入研究.文献56]利用径向基神经网络 该算法首先采用驾驶员单点预瞄模型计算车辆的 对MPC建模误差进行了动态补偿.神经网络以纵 最优横向加速度,然后利用神经网络的自学习能 向速度、横向速度、航偏角、航偏角速度、X坐 力,根据最优加速度的偏差在线计算PID控制参 标、Y坐标为输入,前轮补偿转角为输出.仿真表 数.在不同速度和车道曲率条件下的仿真表明,该 明,在路径曲率发生剧烈变化时,所设计控制器可 控制算法能够控制车辆沿预先给定的轨迹行驶, 以快速补偿误差,实现准确快速的路径跟踪 具有良好的轨迹跟踪和车道保持能力,对速度和 5总结及展望 车道曲率的变化具有较强的自适应性和鲁棒性 文献[53]利用神经网络对传统PID车辆纵向 本文概述了近年来神经网络在无人车运动控 控制器进行了改进;利用径向基神经网络学习速 制中的应用状况,并做出如下的总结和展望: 率快、可并行处理的特点,设计了径向基神经网络 (1)对于神经网络在无人车运动控制中的适 与PD相结合的纵向运动控制器,实现车辆控制 用性和鲁棒性的验证,目前多使用软件仿真和典 参数的在线自适应调整,解决了车辆纵向运动控 型路径测试,缺乏其在恶劣环境下的应用研究.恶 制的振荡和失稳等问题:针对模型初始化参数的 劣环境下的无人车运动具有更加强烈的时变性、 随机性,引入蚁群优化算法对径向基神经网络和 不确定性和非线性,同时涉及多运动变量的耦合, PID的初始化参数进行离线优化,有效地解决了由 如何设计强鲁棒性、低运算成本的控制器有待研究 于控制模型初始参数随机设置所引发的控制超 (2)当前无人车运动控制的主要控制量为车 调、调参耗时长等问题 辆前轮转角,若增加控制变量如横摆力矩,可以提 对于神经网络的训练,目前广泛使用梯度下 高车辆横向控制的响应速度和稳定裕度.但设计系统中的独特优势,逐渐被应用到无人车的运动 控制中. 利用神经网络,可以动态调整 MPC 的预 瞄时间、补偿 MPC 的线性化误差,从而提高 MPC 对无人车运动的控制精度. 4.1    优化 PID 控制算法参数 文献 [51] 针对无人驾驶铰接式运输车的运动 控制问题,提出了基于强化学习的自适应 PID 控 制算法. 强化学习不需要训练样本,可以根据外界 环境反馈和评价结果来确定下一次执行动作. 使 用强化学习方法对 PID 参数进行在线实时整定, 使控制器可以自适应不同的路况. 在建立铰接车 模型的基础上,根据模型参考自适应控制器的原 理,设计了基于强化学习的自适应 PID 路径跟踪 控制器. 参考模型规定了偏差收敛的趋势,以获得 理想的收敛效果. 回报函数计算当前参数效果的 评价,通过累计历史回报计算综合回报指标. 神经 网络以横向位置偏差、航向角偏差、曲率偏差为 输入,以转角控制量为输出,对历史多次参数调整 结果的优劣评价,再根据评价调整新的增益参数, 并传递给 PID 控制器. 仿真表明,基于强化学习的 PID 控制器能够较好地减小超调和震荡,实现参考 路径的精确跟踪. 驾驶员单点预瞄模型可以通过车辆前方的道 路信息和汽车的行驶状况,根据汽车行驶轨迹与 预瞄轨迹误差最小的原则,决定最优的横向加速 度. 文献 [52] 通过驾驶员单点预瞄模型与神经网 络的结合,实现了车辆横向运动 PID 自适应控制. 该算法首先采用驾驶员单点预瞄模型计算车辆的 最优横向加速度,然后利用神经网络的自学习能 力,根据最优加速度的偏差在线计算 PID 控制参 数. 在不同速度和车道曲率条件下的仿真表明,该 控制算法能够控制车辆沿预先给定的轨迹行驶, 具有良好的轨迹跟踪和车道保持能力,对速度和 车道曲率的变化具有较强的自适应性和鲁棒性. 文献 [53] 利用神经网络对传统 PID 车辆纵向 控制器进行了改进;利用径向基神经网络学习速 率快、可并行处理的特点,设计了径向基神经网络 与 PID 相结合的纵向运动控制器,实现车辆控制 参数的在线自适应调整,解决了车辆纵向运动控 制的振荡和失稳等问题;针对模型初始化参数的 随机性,引入蚁群优化算法对径向基神经网络和 PID 的初始化参数进行离线优化,有效地解决了由 于控制模型初始参数随机设置所引发的控制超 调、调参耗时长等问题. 对于神经网络的训练,目前广泛使用梯度下 降法,因此需要计算偏导数或灵敏度函数. 该方法 存在学习速度慢和计算时间长等缺点,且难以用 解析的方式证明学习过程的收敛性和稳定性. 为 了解决这些问题,文献 [54] 提出了 2 型模糊神经 网络和基于滑模控制理论的学习算法. 基于滑模 控制的学习算法不仅可以使整个系统具有更好的 鲁棒性,而且比传统的学习技术具有更快的收敛 速度. 采用比例−积分−微分控制器来控制车辆的 纵向速度. 在横向运动控制中,比例导数控制器 与 2 型模糊神经网络并行工作,有效解决了系统 中各种不确定关系和外部干扰. 4.2    优化模型预测控制参数 常规 MPC 控制器的预瞄时间为 0.4~1.2 s 之 间的一个恒定值. 但无人车运动控制中的预瞄时 间应当根据车速、路面情况、道路几何形状动态 调整,以避免车辆过多地偏离目标路径. 文献 [55] 选用车速、横向偏差为神经网络控制器的输入,预 瞄步长为神经网络的输出,利用仿真软件得到不 同工况下的训练样本. 经过测试,采用预瞄时间动 态调整的控制方法,车辆在转弯处的跟踪精度虽 然略有降低,但是在直线处跟踪效果较好且车辆 行驶更加稳定,路径跟踪的总体精度得到提高. MPC 对车辆模型的线性化,可以减少控制过 程中的计算量,提高控制的实时性,但同时也降低 了控制精度,特别是在道路曲率复杂时. 因此在保 证控制实时性的前提下,如何动态补偿线性化误 差值得深入研究. 文献 [56] 利用径向基神经网络 对 MPC 建模误差进行了动态补偿. 神经网络以纵 向速度、横向速度、航偏角、航偏角速度、 X 坐 标、Y 坐标为输入,前轮补偿转角为输出. 仿真表 明,在路径曲率发生剧烈变化时,所设计控制器可 以快速补偿误差,实现准确快速的路径跟踪. 5    总结及展望 本文概述了近年来神经网络在无人车运动控 制中的应用状况,并做出如下的总结和展望: (1)对于神经网络在无人车运动控制中的适 用性和鲁棒性的验证,目前多使用软件仿真和典 型路径测试,缺乏其在恶劣环境下的应用研究. 恶 劣环境下的无人车运动具有更加强烈的时变性、 不确定性和非线性,同时涉及多运动变量的耦合, 如何设计强鲁棒性、低运算成本的控制器有待研究. (2)当前无人车运动控制的主要控制量为车 辆前轮转角,若增加控制变量如横摆力矩,可以提 高车辆横向控制的响应速度和稳定裕度. 但设计 · 240 · 工程科学学报,第 44 卷,第 2 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有