论文阅读之《Past, Present, and Future of SLAM》


本篇文章记录SLAM综述性文章《Past, Present, and Future of Simultaneous Localization And Mapping: Towards the Robust-Perception Age》,只对重点部分作详细翻译,其余为本人根据自己的理解对内容概括性的总结。

概述

一、介绍SLAM现行制定的标准

二、总结相关工作(包括一系列关于长时间建图中的鲁棒性和可扩展性用于建图的度量和语义表示、理论上的性能保证、主动SLAM和探索、以及其他的前沿技术)

三、介绍开放的挑战和新的研究问题

四、作者对两个问题的看法,即机器人需要SLAM吗?SLAM问题解决了嘛?

Introduciton

SLAM包括同时的机器人状态估计和环境模型(地图)重建,机器人配置片上传感器,重建的环境是由机器人传感器感知到的。简单的情况下,机器人的状态使用其位姿(位置和方向/姿态)表示,当然机器人的状态还会包含其他的量,如机器人速度、传感器偏差、校准参数。地图是用于描述机器人所处环境的我们感兴趣部分(如路标点位置、障碍物)的表示。

需要构建环境地图的原因包括两方面。首先,地图经常被用于支撑其他任务;例如,一个地图可以通知路径规划或者提供可供用户操作的直观的可视化。其次地图能够限制机器人状态估计中积累的误差。没有地图时轨迹估计很快就会发生漂移;如果由地图,机器人就可以通过再次访问已访问的区域对位置错误进行重置,即所谓的回环检测。SLAM适用于所有没有先验经验需要创建地图的场景应用。

一些机器人的应用中环境地图是作为已知的先验经验。

SLAM问题的普及源于移动机器人的室内应用的出现。室内的操作就要排除GPS的使用,GPS是可以用于限制位置偏差的。SLAM为用户构建的地图提供了一个吸引人的替代方案,显示出在没有专门的本地化基础架构的情况下,机器人操作是可能的。

古典时代(1986-2004)(the classical age):对SLAM的主要概率公式进行了介绍,包括基于扩展卡尔曼滤波器的方法、RaoBlackwellised粒子滤波器和最大似然估计;而且还描绘了与效率和强大数据关联相关的基本挑战。[14、94、299、298]

算法分析时代(2004-2015)(the algorithmic-analysis age):研究了SLAM的基本性质,包括可观测性、收敛性和一致性。该时期对稀疏性对于高效SLAM求解器的关键作用有了理解,并发展出主要的开源SLAM库。[89]

  • 底层SLAM(前端)涵盖了其他的研究领域,如机器视觉和信号处理;

  • 在高层的后端,SLAM是几何学、图论、优化和概率的组合。而且,对于一个SLAM专家必须处理实际的从传感器建模到系统集成等各个方面的问题。

Do autonomous robots really need SLAM?

本文对SLAM的现状进行了广泛的概述,并提供了部分社区对SLAM研究的开放性问题和未来发展方向的看法。其他关于SLAM的综述性文章:

Year Topic Reference
2006 Probabilistic approaches and data association Durrant-Whyte and Bailey [14, 94]
2008 Filtering approaches Aulinas et al. [12]
2008 Visual SLAM Neira et al. (special issue) [220]
2011 SLAM back-end Grisetti et al. [129]
2011 Observability, consistency and convergence Dissanayake et al. [89]
2012 Visual odometry Scaramuzza and Fraundofer [115, 274]
2016 Multi robot SLAM Saeedi et al. [271]
2016 Visual place recognition Lowry et al. [198]

Do autonomous robots really need SLAM?

回答这个问题需要理解SLAM特殊在哪。SLAM旨在利用自身运动的测量和回环检测建立场景的全局一致的表示。关键点在于回环检测:如果忽略了回环检测,SLAM退化为里程计。在早期的应用中,里程计是通过整合在车轮上的编码器获取到的,通过车轮里程计获取到的位姿检测很快就会发生漂移,使得估计在运动数米后就不可用。这也是推动SLAM发展的主要原因之一:外界场景路标点的观测对于消除轨迹漂移是有帮助的,能够尽可能的矫正轨迹。然而,目前更多的里程计算法都是基于视觉和惯性信息,具有很少的漂移(<轨迹长度的0.5%)。这种情况下是否需要SLAM呢?分三方面回答。

  • 过去十年中完成的SLAM研究工作是产生目前代表现有技术状态的视觉-惯性里程计算法;在这个意义上,视觉惯性导航(VIN)就是SLAM:VIN可以看作是忽略掉回环检测或者位置识别模块的简化SLAM系统。更一般意义上,SLAM导致在比其他知识领域(例如,航天工程中的惯性导航)更早地考虑到的更具挑战性配置(即,没有GPS,低质量传感器)下研究传感器融合。
  • 关于回环检测。忽略回环检测执行里程计的情况下,机器人会把世界解释成一个没有尽头的走廊,机器人在里面一直无限地对新的区域进行探测。回环检测事件能够告诉机器人该走廊是保持相交的。这样回环检测的好处就清楚了:通过回环检测,机器人能够理解环境真实的拓扑结构,并且能够找到位置间的快捷/最短路径。因此,如果得到正确的环境拓扑结构是SLAM的优点之一,为什么不简单地忽略度量信息,只是做位置识别/回环检测呢?答案是:度量信息使得位置识别更简单、更健壮;度量重建使得机器人有闭环检测的机会,并允许丢弃虚假闭环。因此,SLAM在原则上是多余的(一个oracle位置识别模块就足以进行拓扑映射),SLAM为错误的数据关联和感知别名提供了一个自然的防御,与环境中的不同位置相对应的相似的场景会欺骗位置识别模块。SLAM地图提供了一种预测并验证未来的测量的机制:该机制对于健壮性测量是关键的。
  • 由于许多应用隐式或显式地需要全局一致的地图,因此需要使用SLAM。例如在很多军事和民用应用中,机器人的目标是探测环境,并提供一个可供用户操作的地图。另一个例子是,机器人必须执行结构检测(例如建筑、桥梁等);还有需要进行全局一致的3D重建时。

因此,机器人研究者需要设计一个SLAM系统时,他将面对多种设计选择。例如,一个拓扑地图能够用于分析给定地点的可达性,但是并不适合于路径规划和底层的控制;一个局部一致的度量地图非常适合用于避障以及局部与环境的交互作用,但牺牲了精确性;一个全局一致的度量地图允许机器人执行全局的路径规划,但是计算和维护地图又是高计算复杂度性的。一个更通用的选择更合适的SLAM系统的方法是将SLAM看作是一种机制,完成足够的统计计算来总结机器人的所有已观测到的数据,在这种情况下,在这个压缩表示中保留哪些信息是非常依赖于任务本身的。

Is SLAM solved?

这是机器人社区经常被问到的问题。回答该问题的难度在于问题本身:SLAM是一个非常开放的话题,这个问题只适用于给定的机器人/环境/性能组合。尤其是,一旦下面几方面内容明确了,我们就可以评估SLAM问题的成熟度:

  • 机器人(robot):运动的类型(例如动态、最大速度)、可用传感器(例如分辨率、采样率)、可用的计算资源;
  • 场景/环境environment):平面或三维空间、自然或人造路标点的存在、动态元素的数量、对称性的量和感知混叠的风险。请注意,这些中的许多方面实际上取决于传感器-环境对:例如,对于2D激光扫描仪,两个房间可能看起来相同(感知别名),而相机可能会根据外观线索辨别;
  • 性能要求performance requirements):机器人状态估计中的精确性要求、环境表示的精确性和类型(例如基于路标点的或稠密的)、成功率(满足精度范围的测试的百分比)、估计延迟、最大可操作时间、建图区域的最大尺寸范围。

例如,在保证足够的精确性(<10cm)以及足够的健壮性(即低错误率)的前提下,使用一个装有车轮编码器和激光扫描器的机器人构建2D室内场景的地图,可以认为是基本可以解决的(一个工业系统执行SLAM的例子是the Kuka Navigation Solution)。同样地,基于缓慢移动的机器人的视觉SLAM和视觉-惯性测量法都可以认为是成熟的研究领域。另一方面,其他的机器人/环境/性能组合仍需要大量的基础性研究。在机器人移动或者环境极具挑战性时(例如快速机器人动态、高度动态的环境),目前的SLAM算法很容易就会失败。同时,SLAM算法经常无法应对严格的性能要求,例如,快速闭环控制的高速率估计。本文将提供这些公开问题的综合概述,等等。

我们在这一节最后对SLAM的未来进行更广泛的考虑。我们认为,SLAM正在进入第三个时代,即鲁棒感知时代the robust-perception age),其特点是具有以下关键要求:

  • 性能强劲robust performance):SLAM系统能够在广泛的环境中以较低的故障率长时间运行;系统具备故障安全机制和自我调整功能,这样能够做出适应不同场景的系统参数的选择;
  • 高层次的理解力high-level understanding):SLAM系统超越基础的几何重建,能够获取到对环境的一个更高层次的理解,例如语义、可用性、高级几何、物理;
  • 资源意识resource awareness):SLAM系统可以针对可用的传感和计算资源量身定制,并可以提供根据可用资源调整计算负载的方法;
  • 任务驱动推理task-driven inference):SLAM系统产生自适应地图表示,其复杂性可以根据机器人必须执行的任务而改变。

论文组织结构

SectionII:SLAM标准的制定和体系结构

Section III:解决终身(长时间)SLAM中的鲁棒性

Section IV:处理可扩展性

Section V:讨论如何表示环境的几何形状

Section VI:将环境表征的问题扩展到语义信息的建模。

Section VII:提供了关于SLAM的理论方面的当前成就的概述

Section VIII:扩大了讨论范围,并回顾了使用决策来改善SLAM结果质量的活动SLAM问题

Section IX:概述了SLAM的最新趋势,包括非常规传感器的使用

Section X:提供最后的评论

尽管SLAM有其独特的特性,但它是与计算机视觉、计算几何、控制理论中有关问题相关的,这些领域的交叉使用是实现快速发展的必要条件。

III. LONG-TERM AUTONOMY I: ROBUSTNESS

影响SLAM系统鲁棒性因素:算法层面、硬件层面、软件层面。

算法层面

现有SLAM算法的限制,如无法处理动态环境、极端场景。

数据关联(data association)与感知混淆

涉及的一个重要原因就是数据关联错误。如基于特征的vSLAM需要关联每一个视觉特征点到确定的路标点,感知混淆(Perceptual aliasing)(即对于不同的传感器输入引起相同的传感器信号)会使得问题解决变得困难,导致产生错误测量状态匹配(外点、错误匹配等),进一步影响后端优化;另外,数据关联如果错误地将测量数据判断为错误测量,就只能以估算的精度为代价,使用较少的测量值进行估算了。

short-term数据关联

传感器采样速率相对于机器人运动变化足够大,直观上可以认为传感器视角不会发生剧烈的变化,因此可以完成诸如特征匹配或光流法,从而避免错误的数据关联。

long-term数据关联

更具挑战性,涉及到闭合回环检测及验证。
蛮力的方法处理回环检测是不切实际的。基于视觉特征的Bag-of-words方法[282]通过引入分层的词汇树、量化特征空间,使得搜索更加高效。但是不能处理严重的照明变化。因此提出了一些新的方式,如匹配序列[213],将不同的视觉外观聚集成统一的表示[69],或使用空间和外观信息[140],关于此类的综述见[198]。
闭合回环验证使用几何验证的方法确定闭合回环的质量。基于视觉的应用中,RANSAC[274]用于几何验证和异常值剔除。基于激光的方法可以通过检测当前scan与已有的地图的匹配度验证闭合回环,例如残差
当然,错误的闭合回环也是无法避免的。

动态场景

挑战一:SLAM系统必须要检测、剔除、追踪环境的变化,主流的方法就是剔除场景的动态变化部分,一些方法将动态元素一同建模。
挑战二:SLAM系统必须对永久性或半永久性变化进行建模,并理解如何、何时更新地图。

硬件层面

传感器本身、执行器退化引起。如何检测降级的传感器操作? 如何调整传感器噪声统计数据(协方差,偏见)?

软件层面

集成和测试是SLAM和机器人技术的关键方面,它们同样会引起误差。

V. REPRESENTATION I: METRIC REASONING

介绍SLAM中的模型几何,即度量表达方法。2D情况有基于路标的地图表达和占用网格地图表达。

  • 基于路标的稀疏表达方式。可以是环境中可分辨特征相关联的3D路标点,例如线、角。前提是路标是可区分的,例如描述子。目前大部分的研究关注点特征的估计,也扩展到线、线段、圆弧[200]。

  • 低层次的原始稠密表达。可以提供3D物体的高分辨率模型,适用于机器人研究中的避障和路径规划或者可视化、渲染。原始表达使用点云或多边形、面元地图(surfels maps)描述3D几何物体。这种方式比较笨重,因为需要存储大量的数据信息。

  • 边界和空间划分密集表示。明确地表示surfaces (or boundaries) and volumes。空间划分表示方法最具代表性的是spatial-occupancy enumeration,该方法将三维空间划分为相同的立方体(体素)并排列在规则的3D网格中。其他方法还包括octree(应用于3D)、Polygonal Map octree和Binary Space-Partitioning tree等。

    vSLAM中关于稀疏(基于特征的)表达方式与稠密表达方式、直接法的比较。

    • 基于特征的方法取决于特征的类型。
    • 稠密、直接表达方式更适用于低纹理、散焦和运动模糊的场景,但需要高计算能力和实时性能。

    • 半稠密方法克服了稠密法高计算需求的缺点。

    • 半直接法一定程度上同时使用了稀疏特征和直接法(被证明更高效,SVO[113]),允许结构和运动同时估计。
  • 高层次的基于物体的表达。
    SLAM++。

    VI. REPRESENTATION II: SEMANTIC REASONING

基于视觉的拓扑地图SLAM系统综述[198]。

SLAM help Semantics

比较早的关于分割度量地图的方法[215],offline的方法,使用2D激光扫描器构建几何地图。
online语义地图构建系统[257、258],将传感、分类、位置识别组合,使用激光和相机构建环境的语义地图。
[41]使用了运动优化,将粗略的语义分割与不同的对象检测器互。
[249]使用单目SLAM系统提高视频中对象识别任务的性能。

Semantics helps SLAM

既然可以在SLAM构建的地图中识别物体,那也可以使用关于物体的几何先验知识去优化地图的估计。这方面的研究:
[63、71]基于稀疏特征的单目SLAM系统,应用于小尺度环境中。
[84]稠密的地图表达。
[272]使用RGB-D传感器提出一个SLAM系统,该系统是基于对环境中的已知物体的检测。

Joint SLAM and Semantics inference

将单目SLAM和地图分割联合。

online系统[106]构建模型,使用曼哈顿世界假设,针对室内环境分割主要平面部分的地图。

[16]提出使用场景的几何和语义属性估计相机参数和场景点、物体标签,offline。

[136、184、275]offline、[310]online。

研究点思考

首先,对于SLAM问题,我们需要考虑的四个方面:

  • 机器人
  • 环境
  • 传感器-环境组合
  • 性能需求

因此可以考虑不同的机器人/环境/性能组合进行基础性研究的可能性。同时,在机器人移动或者环境极具挑战性时(例如快速机器人动态、高度动态的环境),目前的SLAM算法很容易失败。此外,SLAM算法经常无法应对严格的性能要求,例如,快速闭环控制的高速率估计。
目前,针对SLAM系统的研究可以从下面几个方面中开展:

  • 鲁棒性性能研究:故障安全机制和自我调整功能,这样能够做出适应不同场景的系统参数的选择
  • 高层次的提升研究:超越基础的几何重建,能够获取到对环境的一个更高层次的理解,例如语义、可用性、高级几何、物理;
  • 资源利用研究:针对可用的传感和计算资源量身定制,并可以提供根据可用资源调整计算负载的方法;
  • 任务驱动方向研究:自适应地图表示,其复杂性可以根据机器人必须执行的任务而改变。

具体的研究点思考如下。

鲁棒性研究

动态环境下的处理,如何检测、提出、追踪变化,可以将变化剔除[221]、考虑到模型[266, 312, 313]
如何应对白天和晚上剧烈的光照变化、季节的变化、环境结构的变化(新建筑物->旧建筑物)白天、夜晚回环检测的应对方法[69, 213、223]
对于数据异常情况(外点的出现)的处理,目前SLAM系统不具备提前感知即将面临的失败的能力、无法提供恢复机制应对已经发生的失败情况
硬件环境、传感器异常情况的处理?如何检测?如何调整?
极端环境下的研究,例如水下[20, 100, 102, 166]
非刚性物体的应对方法,非刚性地图的研究[245, 246] 、[36] and [304]、[4, 5, 128]、[225]

可扩展性研究

因子图优化复杂性降低方法
地图的存储[201、172]
多机器人[271]
多机器人回环检测的研究,机器人之间可能无法共享同一个参考图像帧,机器人传感器探测视角也有所不同[151]
地图中哪些信息需要丢弃、更新、保存,该以怎样的频率更新地图信息???
在面对严格的带宽限制和通信中断时,保证多机器人团队的可靠运行??? [70]

度量表达研究

基于路标的地图
占用网格地图,地图标准[147]
高层次的表达方式,机器人不能识别出自己所处的环境类型,例如room vs. corridor,当然可以使用更复杂的模型(如parameterized primitive instancing)解决这种问题。
更紧凑的表达方法可以降低大尺度环境的地图大小。
最佳的(可选择性的)表示,简单的室内环境使用参数化的原语、负责的室外环境选择mesh模型,如何比较不同的表达方式、如何选择最有的表达方式???[262、285]
自动的自适应的表达方式,希望机器人可以根据人物和环境的复杂性自主地选择更复杂或更简单的表达方式。这将对长时间的导航带来很大的帮助。

语义表达

不仅仅是分类。

引用文献

14
299
298
89
94
12
220
129
115
274
271
198
282

本文标题:论文阅读之《Past, Present, and Future of SLAM》

文章作者:阿翔

发布时间:2018年10月17日 - 22:10

最后更新:2019年05月28日 - 21:05

原始链接:http://ttshun.com/2018/10/17/论文阅读之《Past, Present, and Future of SLAM》/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

点击给我一些鼓励叭!
-------------本文结束感谢您的阅读-------------
0%