SLAM +机器学习迎来了“感知时代”

2024.04.27 振工链

机器和深度学习的最新进展已改进了SLAM技术，从而导致地图的丰富性增加，语义场景理解提高了定位，地图质量和坚固性。

    最近的危机使人们越来越关注将自动机器人用于实际利益。我们已经看到机器人，运送食物和药品，甚至对患者进行评估。这些都是惊人的用例，它们清楚地说明了从现在起机器人将在我们的生活中发挥更大作用的方式。
    然而，尽管具有所有优点，但是机器人自动绘制周围环境并成功定位自身的能力仍然十分有限。机器人在计划一致的环境中擅长做特定事情的能力越来越强。但是动态，未经训练的情况仍然是一个挑战。
    我兴奋的是下一代SLAM（同步定位和地图绘制），它将使机器人设计人员能够创造出在各种情况下具有更强的自主操作能力的机器人。它正在开发中，并吸引了整个行业的投资和兴趣。
    我们称其为“感知时代”，它将机器和深度学习的最新进展结合起来以增强SLAM。通过语义场景理解来增加地图的丰富度，可以改善定位，地图质量和坚固性。
    简化地图
    目前，大多数SLAM解决方案都从传感器获取原始数据，并使用概率算法来计算机器人的位置和地图。LIDAR是最常用的，但成本越来越低的相机为增强的地图提供了丰富的数据流。无论使用哪种传感器，数据都会创建由数百万个3维参考点组成的地图。这些使机器人可以计算其位置。
    问题在于这些3D点云没有意义－它们只是机器人计算其位置的空间参考。不断处理所有这些数百万个点也是机器人处理器和内存的沉重负担。通过将机器学习插入到处理“流水线”中，我们既可以提高这些地图的实用性，又可以简化它们。
    全景分割
    技术使用机器学习将来自摄像机供稿的像素集合分类为可识别的“对象”。例如，代表墙壁的数百万个像素可以归类为单个对象。此外，我们可以使用机器学习来预测3D世界中这些像素的几何形状和形状。因此，代表一堵墙的数百万个3D点可以全部汇总到一个平面中。
    数以百万计的代表椅子的3D点都可以汇总到带有少量参数的形状模型中。将场景分解为2D和3D的不同对象可以降低处理器和内存的开销。
    令我兴奋的是下一代SLAM，它将使机器人设计人员能够创造出在各种情况下能够自主运行的机器人。它正在开发中，并吸引了整个行业的投资和兴趣。
    增加理解
    以及简化地图，此方法为进一步了解机器人的传感器捕获的场景提供了基础。通过机器学习，我们能够对场景中的单个对象进行分类，然后编写代码来确定应如何处理它们。
    这种新兴功能的首要目标是能够从地图上移除包括人在内的移动物体。为了有效导航，机器人需要引用场景的静态元素。不会移动的东西，因此可以用作可靠的定位点。机器学习可用于教导自主机器人场景中哪些元素用于定位，哪些元素不作为地图的一部分或将其分类为要避免的障碍。将场景中的对象的全景分割与基础地图和位置数据相结合，将很快大大提高机器人SLAM的准确性和功能。
    感知对象
    下一个激动人心的步骤将是基于此分类，以增加对单个对象的理解水平。机器学习作为SLAM系统的一部分，将使机器人能够学习将房间的墙壁和地板与家具和房间内的其他物体区分开。将这些元素存储为单独的对象意味着添加或删除椅子无需完全重绘地图。
    这些优势的结合是自主机器人功能取得巨大进步的关键。机器人在未经训练的情况下不能很好地推广。变化，尤其是快速移动会破坏地图并增加大量计算量。机器学习创建了一层抽象，可以提高地图的稳定性。它在处理数据方面的更高效率产生了开销，以增加更多的传感器和更多的数据，从而增加了粒度和可包含在地图中的信息，更多信息尽。
    机器学习可用于教导自主机器人场景中哪些元素用于定位，哪些元素不作为地图的一部分或将其分类为要避免的障碍。
    自然互动
    将位置，地图和感知链接在一起，使机器人可以更多地了解其周围环境并以更有用的方式进行操作。例如，可以感知大厅和厨房之间差异的机器人可以执行更复杂的指令集。能够识别和分类椅子，书桌，橱柜等物体将进一步改善这一点。指示机器人去特定的房间去获取特定的东西将变得更加简单。
    当机器人开始以更自然的方式与人进行更多互动时，机器人技术的真正革命将来临。可以从多种情况中学习并将这些知识组合到模型中的机器人，这些机器人可以使它们根据存储在内存中的地图和对象执行未经训练的新任务。创建这些模型和抽象需要将SLAM的所有三层完全集成。由于在这些领域处于领先地位的人们的努力，我相信感知时代即将来临，更多信息尽在振工链。