视觉算法会是自动驾驶的未来？

2024.04.15 汽车新纪元

    导语：从技术层面看，让机器学会和人类一样深度思考，来代替人类驾驶车辆的视觉算法无疑是非常先进与智能的。但在目前的条件之下，加入激光雷达，也明显是更具安全保障的方案。
    何想｜文
    即使在5年之前，很多人都或许还觉得自动驾驶是一项距离我们生活很远的高精尖技术。不过，科技的发展日新月异，现在自动驾驶技术作为“人工智能”最快落地的领域和场景之一，已经没有人再去质疑它的可能性。毕竟像L2级的自动驾驶，都已经大面积的应用到了10万级的新车上了。那家车企现在如果推出的新车不带L2级的自动驾驶，恐怕都不好意思拿出手。而更高阶的L3、L4、L5级的自动驾驶技术，也不遥远，比如在2020年，奥迪、广汽、长安等厂家，纷纷推出自己的“首款L3”量产车，威马汽车联手百度落地了号称L4级别自动驾驶车型，特斯拉创始人马斯克也表示，有信心完成L5级自动驾驶基本功能。
    在业内人士看来，2020年是汽车主机厂从L2级别自动驾驶进阶到L3级别自动驾驶的一年，而今年，则是真正意义上的的自动驾驶元年。这是因为，L2、L3级别的自动驾驶技术，仍需要驾驶员监控驾驶环境而随时接管操作车辆，以便随时应对可能出现的人工智能应对不了的情况。而L4和L5级别的自动驾驶技术则可以称为完全自动驾驶技术，这两者的区别就是一个是特定场景，一个是所有场景。
    自动驾驶注定是一个对人们生活产生重大影响，且会在未来改变世界的技术。不过在这个技术蓬勃发展的当下，却有两个旗帜鲜明的技术流派：一派坚决反对激光雷达，认为视觉算法足以实现L4、L5级自动驾驶；另一派则认为视觉算法安全冗余不够，完全可靠的自动驾驶，必须加上激光雷达。前者的代表企业是特斯拉，后者的代表则是谷歌Waymo、Uber、小鹏汽车、蔚来等众多厂家。
    那么这两种技术流派，谁会是未来的自动驾驶的发展方向？
    首先我们先来看下特斯拉主张的视觉算法技术。视觉算法自动驾驶的整体构想其实很简单，就是模拟人的行为。他们认为，既然人可以靠一双眼睛开车，那么车应该也可以像人一样，通过摄像头来看清周围环境，实现自动驾驶。人能识别交通情况，驾驶汽车，是通过学习达到的，那么特斯拉也可以通过算法，开发出智能的“大脑”来学习。
    特斯拉的自动驾驶大脑系统是如何学习的？它会先通过特斯拉上的摄像头，给周围的交通参与者建立模型，同时把相片数据添加到神经网络的训练集里，让人工告诉它这是什么。这样，形成一定规模之后，“大脑”就会有自己判断的能力，比如什么车、什么是自行车、什么是人，它们距离我有多远，运动的方向和速度是多少……这种学习，不仅限于特斯拉自己的内部测试，还有其大量的车主在实际驾驶场景中的数据积累。
    特斯拉全球有上百万车主，这些车主在驾驶过程中，如果遇到车辆无法自动处理的情况时，会主动进行干预，介入驾驶过程，而此时就会触发一次快照，这是一段由多个摄像头、毫米波雷达、GPS等多个传感器组合得到的视频剪辑，和相关的后台数据。特斯拉的人员会对此进行复核，看看特斯拉的做法和人类的做法有什么区别，找出差距，然后让系统自动改进，也就是标注的工作。
    但是在特斯拉看来，人工标注的速度太慢了，他们要做的是，让机器来干这个事。需要训练防加塞功能？只要预测cut－in（加塞）的运动轨迹，再和真实数据进行比对就好了。需要训练行人碰撞预警？只要预测行人的运动轨迹，再和真实数据进行比对就好了。即使机器错了，也不怕，只有不断的试错，“大脑”才会知道什么是正确的行为。
    通过全球海量的特斯拉车主驾驶数据，进行神经网络计算机训练，从而不断覆盖更多的工况与场景，让特斯拉的驾驶能力高于人类，正是特斯拉视觉算法的核心竞争力。
    但是如同人的眼睛有误判的情况一样，视觉算法也有其显著的弊端，那就是从2D平面图像推断精确的3D立体实景，是非常困难的。比如特斯拉汽车曾把白色的大货车识别成云朵，直接撞上去；把二维的人体投影，当成真人，主动刹车；把广告牌上的STOP标志，当车路标，主动刹车等等。所以近年来，国内有关特斯拉自动驾驶导致的交通事故屡见报端。在国外也同样如此，2020年1月份，美国国家公路交通安全管理局（NHTSA）收到一份请愿书，其中包含127起特斯拉车辆“意外加速”事故的投诉，涉及123辆车和110起撞车事故，52人受伤。后来连特斯拉自己也对自动驾驶的表述，从“自动驾驶”更迭到“辅助驾驶”再到“自动辅助驾驶”。
    正是看到了视觉算法的弊端，越来越多的汽车厂商选择了视觉算法＋激光雷达的方案。在他们看来，有了激光雷达的加入，自动驾驶的安全冗余将会大幅提高。激光雷达工作时，会主动向四周散射激光，随后根据激光返回的飞行时间来判断周边是否有障碍物，以及障碍物的位置甚至体积并生成点云图。这项技术在探测物体方面非常精确，甚至可以达到毫米。有了激光雷达的帮助，自动驾驶的汽车将避免大量的数据运算，很多看不到的障碍物以及情况不明时，激光雷达一碰，就能掌握情况。这不仅比普通视觉算法反应更快，而且即使在极端恶劣天气下，也还会运行自如。

     所以理论上来说，视觉技术与激光雷达相互结合才是完美的方案，因为视觉方案中的图像传感器能以高帧率、高分辨率获取周围复杂的环境信息，且价格便宜，而激光雷达是一种主动式传感器，通过发射脉冲激光并探测目标的散射光特性获取目标的深度信息，具有精度高、范围大、抗干扰能力强的特性。业内公司也普遍认为，完全自动的驾驶技术，应该是激光雷达、雷达、摄像头、超声波、热成像等传感器一个都不能少。
    但是对于采用激光雷达的自动驾驶，特斯拉一直持强烈的反对态度，马斯克更是屡次诋毁，比如：“激光雷达很差劲，他们会抛弃激光雷达，记住我的话，这是我的预测”“激光雷达昂贵、丑陋、没有必要”“用激光雷达是愚蠢的…… 任何依赖激光雷达的人都注定要失败”“激光雷达就像人身上长了一堆阑尾，阑尾本身的存在基本是无意义的，如果长了一堆的话，那就太可笑了。任何依赖激光雷达的公司都可能无疾而终”。
    马斯克一直是位不走寻常路的企业家，而且凭借总能干成人们认为的不可思议之事，令其在全球拥有大批“信众”。所以马斯克对激光雷达的反对，也在市场上引来了一批对激光雷达的批驳者。
    事实上，这一点确实不够客观。激光雷达的好处是显而易见的。而特斯拉之所以反对激光雷达，在业内人士看来，其实是出于成本方面的考虑。
    根据扫描模块是否会运动，激光雷达通常可分为机械式激光雷达、混合固态雷达和纯固态激光雷达。机械式激光雷达技术研发早、相对成熟，但机械旋转部件行车环境不稳定，符合车规级的量产难度极高，而且价格极高。我们看到的头顶一个大陀螺式的自动驾驶汽车，通常采用就是机械式激光雷达。一套可以实现L4级驾驶的机械式激光雷达，其价格动辄以数万美元计算。混合固态雷达的微镜振动幅度小、成本低，更适合大规模应用，但因其视野有限、无法实现360度水平扫描，需要搭载多个，换算下来整车成本也并不低。纯固态雷达在技术上有绝对优势，扫描速度快、精度高、可控性好、体积小，被公认为是未来激光雷达的发展趋势，但目前纯固态激光雷达的方案并不成熟。
    所以不管采用哪种激光雷达，可预见的是，成本都不低。这对一心要把电动车造得越来越便宜的特斯拉而言，显然不是一个很好的选择。另外，特斯拉造车的理念就是越简单越好，比如其大幅减少了车辆的线束长度、大幅减少车身零部件数量、大幅压缩生产制造工序……越简单成本越低售价也就越便宜，而价格便宜，用户才会多。但加入激光雷达势必会带来电气系统的复杂以及计算系统本身的运算复杂外加价格上升，这明显也不符合特斯拉的造车理念。
    但是激光雷达行业发展，也非常快。去年11月广州车展前，华为方面透露其计划生产的激光雷达体积非常小，最重要的是价格非常低，目标成本是做到200美元甚至100美元（约合人民币1300元、650元）。据说华为激光雷达已经成为了主机厂抢购的爆品。北汽新能源副总经理、ARCFOX BU总裁于立国去年末就表示，其与华为联合打造的ARCFOX极狐最新款产品HBT，搭载了3颗96线华为激光雷达。蔚来1月9日发布的旗下首款轿车ET7，也配备了激光雷达，供应商为蔚来和蔚来资本投资的Innovusion公司。小鹏汽车也宣布，其与大疆孵化的Livox览沃科技达成合作，将在2021年推出的全新量产车型上使用其生产的小鹏定制版车规级激光雷达。丰田2021年的旗舰车型“LEGEND”，据悉也将使用5颗激光雷达……种种迹象表明，过去天价的激光雷达将在今年迎来大规模的列装。
    当然强人马斯克对此似乎并不在意，前几个月马斯克宣布，全部重写FSD（全自动驾驶）代码，按照他的描述，这是质的飞跃，并且会很快实现全自动驾驶。
    视觉算法和激光雷达，谁会成为自动驾驶技术的未来？从技术层面看，让机器学会和人类一样深度思考，来代替人类驾驶车辆的视觉算法无疑是非常先进与智能的。但在目前的条件之下，加入激光雷达，也明显是更具安全保障的方案。未来是激光雷达凭借安全优势赢得市场，还是视觉算法凭借更低的成本优势，赢得市场，目前尚难定论。不过随着汽车电动化、智能化、网联化的高速发展，两种技术路线的优劣也会在未来几年分出高下。
    参考及引用资料
    《激光雷达VS视觉算法究竟哪个是自动驾驶的未来？》来源：电动车公社
    《马斯克弃用、李斌小鹏追捧，激光雷达如何收割资本市场？》作者：刘皖媛