ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

卡尔曼滤波详解

2022-07-12 12:02:37  阅读:224  来源: 互联网

标签:状态 Sigma 卡尔曼滤波 矩阵 详解 hat 我们 高斯分布


  卡尔曼滤波是一个强大的工具,可以融合存在误差的信息,提取到更加精确的信息。

什么是卡尔曼滤波?
  我们可以在任何包含不确定信息的动态系统中使用卡尔曼滤波,对系统下一步的状态做出有根据的预测。即使信息的不确定性会干扰到预测,卡尔曼滤波也能够预测出接近真实的变化情况。
  在连续变化的系统中使用卡尔曼滤波是非常理想的,它具有占用内存小的优点(除了前一个状态量外,不需要保留其它历史数据),并且速度很快,很适合应用于实时问题和嵌入式系统。

卡尔曼滤波能够做什么?
  举例:你开发了一个可以在树林里到处跑的小机器人,而这个机器人需要知道它所在的确切位置才能导航。

  我们用\(\vec{x_k}\)表示机器人的状态,包括位置信息和速度信息:$$\vec{x_k}=\big(\vec{p}, \vec{v}\big)$$
  值得注意的是,这里所说的状态只是关于这个系统基本属性的一堆数字,它可以是任何其它的东西。在这个例子中是位置和速度,它也可以是一个容器中液体的总量,汽车发动机的温度,用户手指在触摸板上的位置,或者任何你需要跟踪的信息。
  这个机器人带有GPS,精度大约为10米,还算不错,但是,它需要将自己的位置精确到10米以内。树林里有很多沟壑和悬崖,如果机器人走错了一步,就有可能掉下悬崖,所以只有GPS是不够的。
  我们还可以知道一些机器人如何运动的信息:例如,机器人知道发送给电机的指令,知道自己是否在朝一个方向移动并且没有干预时,在下一个状态,机器人很可能朝着相同的方向移动。当然,机器人无法知道自己运动的全部情况:它可能受到风吹的影响,轮子方向偏了一点,或者遇到不平的地面而翻倒。所以,轮子转过的长度并不能精确表示机器人实际行走的距离,预测也不是完美的。
  GPS传感器告诉了我们一些状态信息,我们的预测告诉了我们机器人会怎样运动,但都只是间接的,并且伴随着一些不确定性和不准确性。但是,如果我们使用所有可用的信息,是否能够得到比使用单一信息直接估计更加精确的结果呢?答案是肯定的,这就是卡位曼滤波的用处所在。

卡尔曼滤波是如何看待问题的?
  下面我们继续以只有位置和速度这两个因素的简单状态作为例子进行解释。

\[{x}={p \choose v} \]

  我们并不知道实际的位置和速度,它们之间有很多种可能正确的组合,但其中一些组合正确的可能性要大于其它组合:

drawing

  卡尔曼滤波假设两个变量(位置和速度,在这个例子中)都是随机的,并且服从高斯分布。每个变量都有一个均值\(μ\),表示随机分布的中心(最可能的状态),以及方差\(\sigma^2\),表示不确定性。

drawing

  在上图中,位置和速度是不相关的,这意味着由其中一个变量的状态无法推测出另一个变量可能的值。
  下面的例子更有趣:位置和速度是相关的,观测特定位置的可能性取决于对应的速度:

drawing

  这种情况是客观存在的,例如,我们基于旧的位置来估计新位置,如果速度过高,我们可能已经移动很远了。如果缓慢移动,则距离不会很远。跟踪这种关系是非常重要的,因为它带给我们更多的信息:其中一个测量值告诉了我们其它变量可能的值,这就是卡尔曼滤波的目的,尽可能地在不确定性的测量数据中提取更多信息。
  这种相关性用协方差矩阵来表示,简而言之,矩阵中的每个元素\(\Sigma_{ij}\)表示第\(i\)个和第\(j\)个状态变量之间的相关度。(协方差矩阵是一个对称矩阵,这意味着可以任意交换\(i\)和\(j\))。协方差矩阵通常用“\(\Sigma\)”来表示,其中的元素则表示为“\(\Sigma_{ij}\) ”。

drawing

使用矩阵来描述问题
  我们基于高斯分布来建模状态变量,所以在时刻\(k\)需要两个信息:最佳估计\(\hat{x}_k\)(即均值,其它地方常用\(μ\)表示),以及协方差矩阵\(P_k\) 。

\[{\hat{x}_k}={position \choose velocity}, {P_k}={{\Sigma_{pp} \quad \Sigma_{pv}} \choose {\Sigma_{vp} \quad \Sigma_{vv}}}\tag{1}\]

(当然,在这里我们只用到了位置和速度,实际上这个状态可以包含多个变量,代表任何你想表示的信息)。

  接下来,我们需要根据当前状态(k-1 时刻)来预测下一状态(k 时刻)。我们并不知道对下一状态的所有预测中哪个是“真实”的,但我们的预测函数并不在乎。它对所有的可能性进行预测,并给出新的高斯分布。

drawing

  我们可以用矩阵\(F_k\)来表示这个预测过程:

drawing

  它将我们原始估计中的每个点都移动到了一个新的预测位置,如果原始估计是正确的话,这个新的预测位置就是系统下一步会移动到的位置。那我们又如何用矩阵来预测下一个时刻的位置和速度呢?下面用一个基本的运动学公式来表示:

\[p_k=p_{k-1}+\Delta tv_{k-1}, v_k= \qquad v_{k-1} \]

  即,

\[\hat{x}_k={{1 \ \Delta t} \choose {0 \ \ \ 1}}\hat{x}_{k-1} \tag{2} \]

\[=F_k\hat{x}_{k-1} \tag{3} \]

  至此,我们有了一个预测矩阵来表示下一时刻的状态,但是,我们仍然不知道怎么更新协方差矩阵。此时,我们需要引入另一个公式,如果我们将分布中的每个点都乘以矩阵 A,那么它的协方差矩阵\(\Sigma\)会怎样变化呢?很简单,下面给出公式:

\[Conv(x)=\Sigma \atop Conv(Ax)=A\Sigma A^T \tag{4} \]

结合方程(3)和(4)可得:

\[P_k=F_kP_{k-1}F_k^T \tag{5} \]

外部控制量
  我们无法捕捉到一切信息,可能存在外部因素会对系统进行控制,带来一些与系统自身状态没有相关性的改变。
  以火车的运动状态模型为例,火车司机可能会操纵油门,让火车加速。相同地,在我们机器人这个例子中,导航软件可能会发出一个指令让轮子转向或者停止。如果知道这些额外的信息,我们可以用一个向量\(\vec{u_k}\)来表示,将它加到我们的预测方程中做修正。
  假设由于油门的设置或控制命令,我们知道了期望的加速度\(a\),根据基本的运动学方程可以得到:

\[p_k=p_{k-1}+\Delta tv_{k-1}+{{1} \over {2}}a\Delta t^2, v_k=v_{k-1}+a\Delta t \]

表示成矩阵的形式:

\[\hat{x}_k=F_k\hat{x}_{k-1}+{{\Delta t^2 \over 2} \choose \Delta}a \]

\[=F_k\hat{x}_{k-1}+B_k\vec{u_k} \tag{6} \]

\(B_k\)称为控制矩阵,\(\vec{u_k}\)称为控制向量(对于没有外部控制的简单系统来说,这部分可以忽略)。让我们再思考一下,如果我们的预测并不是100%准确的,该怎么办呢?

外部干扰量
  如果这些状态量是基于系统自身的属性或者已知的外部控制作用来变化的,则不会出现什么问题。但是,如果存在未知的干扰呢?例如,假设我们跟踪一个四旋翼飞行器,它可能会受到风的干扰,如果我们跟踪一个轮式机器人,轮子可能会打滑,或者路面上的小坡会让它减速。这样的话我们就不能继续对这些状态进行跟踪,如果没有把这些外部干扰考虑在内,我们的预测就会出现偏差。
  在每次预测之后,我们可以添加一些新的不确定性来建立这种与“外界”(即我们没有跟踪的干扰)之间的不确定性模型:

drawing

  原始估计中的每个状态变量更新到新的状态后,仍然服从高斯分布。我们可以说\(\hat x_{k-1}\)的每个状态变量移动到了一个新的服从高斯分布的区域,协方差为\(Q_k\)。换句话说就是,我们将这些没有被跟踪的干扰当作协方差为\(Q_k\)的噪声来处理。

drawing

  这产生了具有不同协方差(但是具有相同的均值)的新的高斯分布。

drawing

  我们通过简单地添加\(Q_k\)得到扩展的协方差,下面给出预测步骤的完整表达式:

\[\hat x_k=F_k\hat{x}_{k-1}+B_k\vec{u_k} \atop P_k=F_kP_{k-1}F_k^T+Q_k \tag{7} \]

由上式可知,新的最优估计是根据上一最优估计预测得到的,并加上已知外部控制量的修正。而新的不确定性上一不确定性预测得到,并加上外部干扰量

  如此,我们对系统可能的动向有了一个模糊的估计,用\(\hat x_k\)和\(P_k\)来表示。如果再结合传感器的数据会怎样呢?

使用测量值修正估计值
  我们可能会有多个传感器来测量系统当前的状态,哪个传感器具体测量的是哪个状态变量并不重要,也许一个是测量位置,一个是测量速度,每个传感器间接地告诉了我们一些状态信息——换句话说,传感器在一个状态下运行并产生一组读数

drawing

  需要注意的是,传感器读取的数据的单位和尺度有可能与我们要跟踪的状态的单位和尺度不一样。我们用矩阵\(H_k\)来表示传感器的数据。

drawing

  我们可以计算出传感器读数的分布,用之前的表示方法如下式所示:

\[\vec{\mu}_{expected}=H_k\hat x_k \atop \Sigma _{expected}=H_kP_kH_k^T \tag{8} \]

  卡尔曼滤波的一大优点就是能处理传感器噪声,换句话说,我们的传感器或多或少都有点不可靠,并且原始估计中的每个状态可以和一定范围内的传感器读数对应起来。

drawing

  从测量到的传感器数据中,我们大致能猜到系统当前处于什么状态。但是由于不确定性的存在,某些状态比其他状态有更高的可能性得到当前我们所看到传感器读数:

drawing

  我们将这种不确定性(例如:传感器噪声)用协方差\(R_k\)表示,该分布的均值就是我们读取到的传感器数据,称之为\(\vec{z_k}\)。现在我们有了两个高斯分布,一个是在预测值附近,一个是在传感器读数附近。

drawing

  我们必须在预测值(粉红色)和传感器测量值(绿色)之间找到最优解。

  那么,我们最有可能的新状态是什么呢?对于任意一组可能的新状态\((z_1,z_2)\),我们得到了两个相关的概率:
    1. 我们传感器的读数\(\vec{z_k}\)来自于对状态\((z_1,z_2)\)进行测量的概率;
    2. 我们的预测结果认为状态\((z_1,z_2)\)是我们应该看到的状态数据的概率;
如果我们有两个概率并且我们想知道两者都满足的概率,我们只需将它们相乘。因此,我们将两个高斯分布相乘:

drawing

  我们剩下的是重叠部分,两个高斯分布都有可能的区域。它比我们之前的任何一个单一估计都要精确得多。这个分布的平均值是两个估计均最有可能的状态,因此是利用我们拥有的所有信息而得出的真实状态的最佳估计

  这个重叠的区域看起来像另一个高斯分布。

drawing

  如图所示,把两个具有不同均值和方差的高斯分布相乘,你会得到一个新的具有独立均值和方差的高斯分布。

组合高斯分布
  以一维高斯分布来分析,具有方差\(\sigma ^2\)和均值\(\mu\)的高斯曲线用公式(9)表示:

\[N(x,\mu,\sigma)={1 \over {\sigma \sqrt {2\pi}}}e^{-{(x-\mu)^2 \over 2\sigma ^2}} \tag{9} \]

  我们想知道当你将两条高斯曲线相乘时会发生什么。下面的蓝色曲线表示两个高斯曲线总体的(未归一化)交集:

drawing

\[N(x,\mu_0,\sigma_0) \cdot N(x,\mu_1,\sigma_1)=N(x,\mu',\sigma') \tag{10} \]

将式(9)代入到式(10)中(注意重新归一化,使总概率为1)可以得到:

将式(11)中的两个式子相同的部分用 k 表示:

下面进一步将式(12)和(13)写成矩阵的形式,如果\(\Sigma\)表示高斯分布的协方差,\(\vec\mu\)表示每个维度的均值,则:

矩阵\(K\)称为卡尔曼增益,下面将会用到。

整合所有的公式
  我们有两个高斯分布,预测部分\((\mu_0,\Sigma_0)=(H_k\hat x_k,H_kP_kH_k^T)\),和测量部分\((\mu_1,\Sigma_1)=(\vec{z_k}, R_k)\),将它们放到式(15)中算出它们之间的重叠部分:

由式(14)可得卡尔曼增益为:

将式(16)和式(17)的两边同时左乘矩阵$$H_k的逆(注意\(K\)里面包含了 \(H_k\))将其约掉,再将式(16)的第二个等式两边同时右乘矩阵\(H_k^T\)的逆得到以下等式:

上式给出了完整的更新步骤方程,其中\(\hat x_k'\)就是新的最优估计,我们可以将它和\(P_k'\)放到下一个预测和更新方程中不断迭代。

  以上所有公式中,你只需要用到式(7)、(18)、(19)。(如果忘了的话,你可以根据式(4)和(15)重新推导一下)
  我们可以用这些公式对任何线性系统建立精确的模型,对于非线性系统来说,我们使用扩展卡尔曼滤波(extended Kalman filter),区别在于EKF多了一个把预测和测量部分进行线性化的过程。

参考文献:http://www.bzarg.com/p/how-a-kalman-filter-works-in-pictures/

标签:状态,Sigma,卡尔曼滤波,矩阵,详解,hat,我们,高斯分布
来源: https://www.cnblogs.com/pandaLiu666/p/16469589.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有