L5自动驾驶遥不可及?自动驾驶的“另类”研究

探索科技TechSugar

    只有拥有大量的训练数据,才能达到无需人工干涉的完全自动驾驶水平。由于目前的自动驾驶系统对其环境缺乏更广泛的了解,安全性仍有一些灰色地带,尚未成熟的技术与人类驾驶者相比,在理解意外事件方面依然逊色不少。
    文︱立厷
    图︱网络
    如何让自动驾驶汽车能像人类一样?在人工智能时代,自动驾驶汽车能不能像人一样自主学习并掌握驾驶技能?现在看,还远远不能。
    目前,主流自动驾驶技术主要采用各种传感器加神经网络系统和机器学习的模式,需要极大数量的数据来训练车辆系统。就是这样,进展也就是L2+。一些有志之士也在另辟蹊径,进行一些“另类”研究,试图让自动驾驶汽车能模仿人类。
    L5自动驾驶为什么遥不可及?
    2018年,谷歌旗下Waymo称,利用神经网络技术自动驾驶汽车能够像人脑一样思考,母公司Alphabet和谷歌技术将神经网络系统和机器学习法等人工智能技术引入自动驾驶汽车,将大大降低自动驾驶的出错率。
    2019年,特斯拉要求用户上传静止和移动物体的图像,还针对汽车行驶过程中发生的一些情景进行测试,以训练网络能够正确识别这些情景,帮助其车辆预测道路上的未来活动。在进行路径规划时,特斯拉也采取了同样方式,观测人类驾驶者在各种道路情况下所选择的路径,汇总特定情况下典型人类行动。
    本来,特斯拉的马斯克曾说2020年底完成L5级别自动驾驶功能,后来又改口称,要到2021年底,现在2021过半,大家可能又要失望了。此前踌躇满志的很多自动驾驶公司前赴后继,不断烧钱向L5疯狂挺进,但大多已杳无音信。
    特斯拉的观点得到了绝大多数从事自动驾驶研究人士的认同:只有拥有大量的训练数据,才能达到无需人工干涉的完全自动驾驶水平。由于目前的自动驾驶系统对其环境缺乏更广泛的了解,安全性仍有一些灰色地带,尚未成熟的技术与人类驾驶者相比,在理解意外事件方面依然逊色不少。
    美国加州汽车管理局(CDMV)指出,人类驾驶者在理解意外事件方面表现出色,他们通常可以采取必要的预防措施来避免事故的发生。然而,由于目前的自动驾驶系统对其所处环境缺乏更广泛的了解,很难采取类似的预防措施,问题的关键是能否开发出一种能够在遇到意外事件时降低风险的系统。
    7月的2021世界人工智能大会上,华为智能驾驶产品线总裁、首席架构师苏箐语出惊人:“L5级别自动驾驶是一个牵引目标,永远不可能达到。”他说:“因为从定义来看,L5是要在任何时间、任何地点、任何天气都能够覆盖所有的情况和场景,世界上没有一个人类驾驶者能够做到这点。”
    人类驾驶者不能做到的事情,自动驾驶技术能不能做到呢?没有答案。还是看看人们的努力吧。
    模仿他人训练自己
    自动驾驶汽车由机器学习算法驱动,需要大量的驾驶数据才能安全运行,数据为王,但它也是一个瓶颈。目前,自动驾驶汽车是跟着已有的驾驶数据来学习如何安全驾驶,学习需要很长时间;出于竞争目的,全球头部汽车公司和大型科技企业都将大量数据据为己有,不可能拿出来与他人分享。
    那么,如果自动驾驶汽车能够像婴儿通过观察和模仿周围的人来学习走路那样学习驾驶,所需要的驾驶数据就少得多了。基于这一想法,波士顿大学的工程师Eshed Ohn-Bar正在开发出一种全新的方式,让自主汽车通过观察道路上的其他汽车来学习安全驾驶技术,预测其自己如何对环境做出反应,并利用这些信息来做出自己的驾驶决策。
    Ohn Bar是波士顿大学工程学院电气和计算机工程助理教授,也是教职研究员。他最近在2021年计算机视觉与模式识别会议上介绍了他们的研究成果。他们提出的训练模式的想法出于加强该领域研究人员之间数据共享和合作的愿望。
    他说:“每家公司都要经历同样的过程,包括开车、安装传感器、付钱让驾驶者开车、收集数据以及教汽车如何驾驶。”他认为,分享驾驶数据可以帮助公司更快地制造安全的自动驾驶汽车,让社会上的每个人都能从合作中受益。Ohn Bar说,人工智能驾驶系统需要如此多的数据才能正常工作,以至于没有一家公司能够独自解决这个问题。
    “数十亿英里(在路上收集的数据)只是现实世界事件和多样性海洋中的一小部分,”Ohn Bar说,然而,丢失数据样本可能会导致不安全行为和潜在的崩溃。”
    他提出的机器学习算法是通过估计附近其他汽车的视点和盲点来创建周围环境的鸟瞰图。这些地图有助于自动驾驶汽车像其他汽车或行人一样检测障碍物,并了解其他汽车如何转弯、通过路口和让路而不会撞到任何东西。
    通过这种方法,自动驾驶汽车通过将周围车辆的动作转化为自己的参考框架来学习,并融入机器学习算法和神经网络。学习的对象车辆可能是没有任何传感器的人驾驶的车辆,或其他公司的自动驾驶车辆。由于对场景中所有周围车辆的观察是算法训练的核心,这种“观察和学习”模式鼓励数据共享,从而提高自动驾驶车辆的安全性。
    Ohn Bar和同事测试了他们的“观察和学习”算法,让算法“驾驶”的自动驾驶汽车在两个虚拟城镇中行驶,一个是与其训练环境类似的直截了当的转弯和障碍,另一个是意外的转弯,如五路交叉口。在这两种情况下,研究人员发现他们的自动驾驶神经网络很少发生事故。只有一小时的驾驶数据来训练机器学习算法,自动驾驶车辆在92%的时间安全到达了目的地。
    Ohn Bar说:“虽然以前最好的方法需要几个小时,但我们惊讶地发现,我们的方法只需要10分钟的驾驶数据就能学会安全驾驶。”
    他说,这些结果是有希望的,但在处理复杂的城市环境方面仍然存在一些明显的挑战。”他说:“还很难对被监视车辆、传感器测量中的噪音和遮挡以及各种驾驶者的视角进行解释。”
    展望未来,该团队表示,他们教授自动驾驶汽车自动驾驶的方法也可以用于其他方面。运送机器人甚至无人机都可以通过观察环境中的其他人工智能系统来学习充实自己。
    狭路相逢的“会车”算法
    在美国宾夕法尼亚州匹兹堡,车辆经常要在拥挤的街道上会车,同时在某一地点交错通过。在拥挤狭窄的街道上开车的人都很熟悉这种情况:两边都是停着的车,没有足够的空间让双向行驶的车辆相向通过。一辆车必须躲进停着的车的空隙中,或者减速并尽可能地靠边停车,让另一辆车挤过去。
    卡内基梅隆大学的研究人员试图使自主车辆能够驾驭这种情况,让自动驾驶车辆的行为更像人类,在高冲突驾驶场景中稳健地协商双向车道使用权。人类驾驶者解决问题的方法并不是靠双方的密切联系。编程自主汽车(AV)遇到这种情况也不知道对方车辆会做什么,这是卡内基梅隆大学的ARGO AI中心自主车辆研究研究人员面对的一个独特挑战。
    计算机科学机器人研究所的访问学者,现在是慕尼黑工业大学自主空中系统实验室一员的Christoph Killing说:“这是道路上不成文的规则,这正是我们正在处理的问题。这有点难。车辆必须学会在不知道另一辆车是要停还是要走的情况下协商这种情况。”
    Killing与研究科学家John Dolan博士和学生Adam Villaflor合作试图解决这个问题。在机器人技术和自动化国际会议上,该团队介绍了他们的研究成果:“学会在高冲突驾驶场景中稳健地协商双向车道使用”。
    该团队认为,他们的研究是第一次进入这种特定的驾驶场景。它要求驾驶者在不知道对方在想什么的情况下,通过人与人之间的合作,安全地行驶过去。驾驶者必须平衡“斗气”与合作。一个过于激进的驾驶者,一个不顾其他车辆的驾驶者,可能会把自己和其他人置于危险之中。一个过于合作的驾驶者,一个总是在迎面而来的车辆面前靠边停车的驾驶者,可能永远也无法在上路行驶。自动驾驶车辆也是这样。问题是怎么能让自动驾驶车辆更像经验老到的人?
    Dolan说:“我一直觉得在匹兹堡开车时,这是一个有趣的方面,有时也是一个困难的方面。”
    自动驾驶汽车被认为是解决交付和运输最后一英里挑战的潜在解决方案。但是,要让AV将比萨饼、包裹或人送到目的地,它们必须能够在狭小的空间和未知的驾驶者意图中导航。
    该团队开发了一种方法来模拟不同类型驾驶者的合作性,即一名驾驶者靠边让另一名驾驶者通过的可能性,并使用这些模型来训练一种算法,该算法可以帮助自动驾驶车辆安全有效地在这种情况下实现导航。目前该算法仅用于仿真,未用于实际车辆,但结果令人满意。研究小组发现,他们的算法比目前的模型表现得更好。
    驾驶充满了这样复杂的场景。在自主驾驶研究人员解决这些问题的过程中,他们正在寻找方法,以使为一种场景开发的算法和模型(如在高速公路上并线)适用于其他场景,如在十字路口变道或左转。
    Dolan说:“广泛的测试揭示了最后百分之十的案例。我们不断发现这些极端情况,并不断想出处理这些情况的办法。”
    老道的短距离安全跟车
    Robbin van Hoek是埃因霍温科技大学机械工程系动力学与控制小组的研究员,他为自动化车辆设计了一个新平台,集成了合作型车辆和自动车辆的优点。该框架是实现自动驾驶汽车的重要一步,让自动驾驶汽车能够在较小的车间距离内安全驾驶,同时防止在高速公路上常见的人类驾驶车辆的“口琴效应”。
    近年来,车辆自动化已成为一个重要课题。其目的是缓解驾驶者引发的交通事故,提高现有基础设施的道路通行能力,同时降低燃油消耗。自动化车辆可以区分为两大类。
    第一类是合作型车辆,它使用车对车通信或车对基础设施(V2I)通信来交换运动数据,从而可以在很短的距离内跟随前面的车辆,同时防止口琴效应,而口琴效应通常会导致交通堵塞。然而,这种类型的车辆通常只能执行单个任务,因此其应用仅限于在公路上跟随前面的车辆。
    第二类是自动驾驶车辆。这类车辆使用车载传感器,如雷达、激光雷达和计算机视觉系统,以识别道路、其他交通参与者和其他相关特征或障碍物。这些车辆上的控制算法利用轨迹预测的显式规划。通过规划各种轨迹,车辆可以根据当前情况选择最合适的轨迹类型。与合作型车辆相比,它能够处理更广泛的交通场景。
    Robbin van Hoek的研究(NWO资助的i-CAVE项目的一部分)旨在将这两类自动化车辆集成到一个平台中。这种新型车辆得益于来自其他车辆的通信运动数据,可以在非常近的距离内跟踪车辆,同时防止交通堵塞,同时保持了自动驾驶车辆的多功能性。例如,不仅可以跟随前面的车辆,还可以自动决定超车,以防主车辆行驶速度过慢。
    除了数学方法的开发,该框架在两辆雷诺Twizy中实现,能够实现自动驾驶。通过开发的合作轨迹规划方法,Van Hoek能够以0.3秒安全跟踪前面的车辆。这是个什么概念?0.3秒的速度距离相当于在80km/h的速度下车辆间距保持在7米。别小看这0.3秒,这已经是目前领先的数据了。
    这项研究是实现自动驾驶汽车的重要一步,自动驾驶汽车能够在较小的车间距离内安全驾驶,同时防止在高速公路上常见的人驾驶车辆的口琴效应有助于提高交通的流动能力和安全性。