Visual SLAM

视觉SLAM只采用camera作为传感器。常见的传感器有单目，双目与RGB-D相机。

算法分类

关于算法分类。根据优化算法的不同可以分为滤波与图优化，更多滤波算法与图优化算法的内容可参见前两篇文章。另外，根据跟踪算法的不同，还可以分为直接法与间接法。

传送门：SLAM概率模型与EKF

Graph-based SLAM

滤波与图优化

视觉SLAM同样可以分为滤波与图优化两类。如采用EKF的MonoSLAM，采用基于Keyframe的图优化的PTAM等。由于学者们逐步认识到图优化信息矩阵的稀疏性以及KeyFrame方法的介入，Keyframe-based的图优化算法成为了主流。论文[3]比较了滤波和基于Keyframe的图优化算法。下文主要介绍基于KeyFrame的图优化算法。

直接法与间接法

视觉SLAM算法还可以分为直接算法(direct method)与间接(indirect/Feature-Based method)算法。

计算机视觉大型攻略 —— SLAM(3) Visual SLAM

直接法(Direct Method/Apperance Method)

Direct Method直接使用像素光强去求解相机运动。可以是稠密的，半稠密的，稀疏的。

直接法不需要显式的求关键点的匹配对应关系，他优化的是投影误差。这种方法与求解稠密光流或深度图的方法类似。

直接法运行慢，不容易去外点，而且需要一个好的初始化。但是这种方法在估计地图或者重建的效果很好，结合GPU的使用，也可以大大提高效率。采用这种方法的算法有DTAM，LSD SLAM，DSO等。

间接法(Indirect/Feature-based Method)

间接方法首先将像素转换到特征空间(feature space)，如SIFT, SURF, BRIEF等，提取关键点，通过匹配关键点，计算相机运动。

很明显，基于特征点的算法计算量小，运算速度快，可以方便的去外点。很多经典的VO（视觉里程计）算法采用了这种方法，如libviso2。

更多关于特征点匹配的文章可移步我的专栏：特征匹配专栏。

传送门：视觉里程计综述简要的介绍了视觉里程计算法。

libviso2 详细解析了一个基于特征的视觉里程计算法。

下面以Feature-based Method为例，详细说明一下视觉SLAM的组成部分。

基于特征的图优化算法

基于特征的视觉SLAM的算法通常为以下几个模块。

特征点检测匹配
相机位姿R, t与地图的估计。
关键帧(Key-Frame)。
重定位和回环(Loop closing)。

特征点检测与匹配

计算机视觉大型攻略 —— SLAM(3) Visual SLAM

输入图像，首先要做特征点的检测与匹配。常用的算法有SURF, SIFT, ORB等。更多关于特征点与特征匹配的内容可移步我的专栏。

传送门：特征与匹配

位姿与地图估计

基于特征的SLAM算法通常创建和使用特征地图。特征地图使用稀疏特征点作为路标，而地图由路标组成。更多地图分类可阅读这篇文章：SLAM与概率模型。

数学模型

首先说一下数学模型。

计算机视觉大型攻略 —— SLAM(3) Visual SLAM

如上图，计算机视觉大型攻略 —— SLAM(3) Visual SLAM 是特征点在相机坐标系下的3D坐标，即路标(LandMark)。是相机到的刚体变换。与VO不同，SLAM同时估计位姿与地图，这两个向量组成了系统状态向量。

计算机视觉大型攻略 —— SLAM(3) Visual SLAM 为观测向量。

计算机视觉大型攻略 —— SLAM(3) Visual SLAM

误差项定义为投影误差计算机视觉大型攻略 —— SLAM(3) Visual SLAM ，即路标在相机的预测位置的投影与观测的差。为投影函数。

计算机视觉大型攻略 —— SLAM(3) Visual SLAM

计算机视觉大型攻略 —— SLAM(3) Visual SLAM 为相机的位姿由旋转和平移矩阵构成。经过旋转平移，转换成, 即在相机坐标系下的3d坐标。再通过投影函数，求出在相机下的图像坐标（预测过程）。与观测到的坐标相减，得到投影误差计算机视觉大型攻略 —— SLAM(3) Visual SLAM 。