Apollo自动驾驶入门课(7)——控制

时间:2024-05-22 08:02:58

控制实际上是无人驾驶汽车实现自动移动的方式。在控制中,通过转向、加速和制动来运行目标轨迹。PID控制是一种简单而强大的控制算法,线性二次调节器和模型预测控制是另外两种类型的控制器,它们更复杂,但也更强大、更准确。Apollo支持所有这三种控制器。

1. 控制

控制

控制是驱使车辆前行的策略。对于汽车而言,最基本的控制输入为转向、加速和制动。通常,控制器使用一系列路径点来接收轨迹。控制器的任务是使用控制输入让车辆通过这些路径点。

  • 首先,控制器必须准确,这意味着它应避免偏离目标轨迹。这对于安全来说,尤为重要。即使路面潮湿或者道路比较陡峭,控制器任需要准确地执行轨迹。
  • 其次,控制策略对汽车应该具备可行性。
  • 最后,需要考虑的是平稳度。舒适的驾驶非常重要,要使控制顺利进行,驱动必须是连续的,应避免突然转向、加速或制动。

总之,目标是使用可行的控制输入,最大限度地降低与目标轨迹的偏差、最大限度地提供乘客的舒适度。有三种可用于实现这些目标的控制策略:比例积分微分控制(或PID)、线性二次调节器(或LQR)、模型预测控制(或MPC)。

控制流程

控制器预计有两种输入:目标轨迹与车辆状态。

  • 目标轨迹来自规划模块,在每个轨迹点,规划模块指定一个位置和参考速度,在每个时间戳都对轨迹进行更新。
  • 车辆状态包括:通过本地化模块来计算的车辆位置、从车辆内部传感器获取的数据(如速度、转向和加速度)。
  • 通过使用这两个输入来计算目标轨迹与实际行进轨迹之间的偏差。

控制器的输出是控制输入(转向、加速和制动)的值。当偏离目标轨迹时,应该采取行动来纠正偏差。将使用方向盘控制行驶方向(即转向)、使用油门加速、使用刹车减速(即制动)这三个值传递给车辆,进行无人驾驶了。

2. PID控制

PID的优点在于它非常简单,只需要知道与目标轨迹有多大的偏离。

  • P代表“比例”(Proportional)。P控制器在车辆开始偏离时立即将其拉回目标轨迹。比例控制意味着,车辆偏离越远,控制器越难将其拉回目标轨迹。
  • D代表“微分”(Derivative)。D控制器致力于使运动处于稳定状态。实践中P控制器容易超出参考轨迹,当车辆越接近目标轨迹时,需要控制器更加稳定。PD控制器类似于增加了一个阻尼项的P控制器,可最大限度地减少控制器输出的变化速度。
  • I代表“积分”(Integral)。I控制器负责纠正车辆的任何系统性偏差。例如,转向可能失准,这可能造成恒定的转向偏移,这就需要稍微向一侧转向以保持直行。为解决这一问题,控制器会对系统的累积误差进行惩罚。
  • 将P、I和D组件结合构成PID控制器。
    Apollo自动驾驶入门课(7)——控制

PID控制器很简单,但它在很多情况下的效果很好。对于PID控制器,你只需要知道车辆与目标轨迹之间的偏差。
但是PID控制器只是一种线性算法,对于非常复杂的系统而言,这是不够的。例如,为控制具有多个关节的四轴飞行器或机器人,需要建立机器人的物理模型。对无人驾驶而言,需要应用不同的PID控制器来控制转向和加速,这意味着很难将横向和纵向控制结合起来。另一个问题在于PID控制器依赖于实时误差测量,这意味着受到测量延迟限制时可能会失效。

3.线性二次调节器LQR

线性二次调节器(Linear Quadratic Regulator 或LQR)是基于模型的控制器,它使用车辆的状态来使误差最小化。
Apollo使用LQR进行横向控制。横向控制包含四个组件:横向误差、横向误差的变化率、朝向误差和朝向误差的变化率。变化率与导数相同,用变量名上一个点代表。我们称这四个组件的集合为X,这个集合X捕获车辆的状态。除了状态之外,该车有三个控制输入:转向、加速和制动。我们将这个控制输入集合称为U。Apollo自动驾驶入门课(7)——控制

  • L: LQR处理线性控制,这种类型的模型可以用等式来表示(详见下图)。x(上方带点)=Ax+Bu,x(上方带点)向量是导数,或X向量的变化率。所以x点的每个分量只是x对应分量的导数。等式x点=Ax+Bu,该等式捕捉状态里的变化,即x点是如何受当前状态 x 和控制输入 u 的影响的。Apollo自动驾驶入门课(7)——控制
    这个等式是线性的,因为我们用∆x来改变x时,并用∆u来改变u。x点的变化也会让这个等式成立(见下图等式)。现在我们了解了LQR中的L。Apollo自动驾驶入门课(7)——控制
  • Q: 目标是为了让误差最小化,但尽可能少地使用控制输入。由于使用这些会有成本,例如:耗费气体或电力。为了尽量减少这些因素,保持误差的运行总和和控制输入的运行总和。当车往右转的特别厉害之际,添加到误差总和中。当控制输入将汽车往左侧转时,从控制输入总和中减去一点。然而,这种方法会导致问题,因为右侧的正误差只需将左侧的负误差消除即可。对控制输入来说也是如此。相反,让x和u与自身相乘,这样负值也会产生正平方,称这些为二次项。为这些项分配权重,并相加。Apollo自动驾驶入门课(7)——控制
    最优的u应该最小化二次项的和随时间的积分。在数学中我们将这个积分值称为成本函数(形式见下图)。我们经常以紧凑的矩阵形式表示加权二次项的总和。Apollo自动驾驶入门课(7)——控制
  • 这里的Q和R代表x和u的权重集合。xT和uT是转置矩阵,x乘以xT,u乘以uT,实质上是将每个矩阵乘以它自己。最小化成本函数是一个复杂的过程,但通常依靠数值计算器为我们找到解决方案。Apollo就提供了一个这样的求解方案。在LQR中,控制方法被描述为u=-Kx。其中,K代表一个复杂的skeme,代表如何从x计算出u。所以找到一个最优的u就是找到一个最优的K。许多工具都可以轻松地用来解决K,尤其是提供了模拟车辆物理特征的A、B,以及x和u的权重Q、R。

4. 模型预测控制MPC

模型预测控制(或MPC)是一种更复杂的控制器,依赖于数学优化,但基本上可以将MPC归结为三个步骤:

  1. 建立车辆模型。该模型近似于汽车的物理特性,该模型估计了假如将一组控制输入应用于车辆时会发生什么。接下来,决定MPC预测未来的能力,预测越深入,控制器就越精确,需要的时间也越长。所以需要在准确度与快速获取结果之间做出取舍。获取结果的速度越快,越能快速地将控制输入应用到实际车辆中。Apollo自动驾驶入门课(7)——控制
  2. 使用优化引擎计算有限时间范围内的控制输入。该优化引擎的工作原理是通过搜索密集数学空间来寻求最佳解决方案。为缩小搜索范围,优化引擎依赖于车辆模型的约束条件。优化引擎可间接评估控制输入,它通过使用以下方法对车辆轨迹进行建模:通过成本函数对轨迹进行评估。成本函数主要基于与目标轨迹的偏差;其次,基于其他因素,如加速度和提升旅客舒适度的措施。为使乘客感觉更舒适,对控制输入的调整应该很小。根据具体情况,可能需要考虑进一步的成本,并设计成本函数。模型、约束和成本函数合并在一起,并作为优化问题加以解决。在不同的优化引擎中,选择一种来寻找最佳解决方案。
  3. 执行第一组控制输入。MPC是一个重复过程,它着眼未来,计算一系列控制输入,并优化该序列。但控制器实际上只实现了序列中的第一组控制输入,然后控制器再次重复该循环。因为只采用了近似测量与计算,如果实现了整个控制输入序列,实际产生的车辆状态与我们的模型有很大差异,最好在每个时间步不断地重新评估控制输入的最优序列。

MPC考虑了车辆模型,因此比PID控制更精确;也适用于不同的成本函数,所以可以在不同情况下优化不同的成本。
MPC比PID相对更复杂、更缓慢、更难以实现。
在实践中,无人驾驶车的控制可扩展性的重要程度意味着值得为MPC投入实现成本,所以MPC是一个很重要的无人驾驶车控制器。