人形机器人的未来,藏在人工智能的历史里

锦缎

本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。
    自去年8月发布《你看好人形机器人吗》这份报告以来,我们始终密切关注人形机器人赛道动态。去年的一波热潮过后,今年6月以来,人形机器人概念再度爆发,多次出现集体涨停。横空出世的ChatGPT,不仅打破了沉寂许久的AI圈,也让更多人开始期待AI与人形机器人结合产生的1+1>2的效果。
    今年5月份特斯拉股东大会上,马斯克对人形机器人提出雄心勃勃的目标,其推测人形机器人远期需求将达100亿台,远远超过汽车需求。即使最终只达到预期的十分之一,产业空间也是一个极其诱人的数字。
    而硬币的另一面,“人形机器人只存在于科幻电影”、“人形机器人落地难”、“人形机器人只适合在工厂”等质疑声从未间断。毕竟,在举世瞩目的2023世界人工智能大会上,特斯拉Optimus人形机器人并不能动,成了名副其实的镇馆展品。
    很多人也开始怀疑自己是否在追逐白日梦,而这个白日梦是他们从《终结者》、《机器人管家》等科幻电影中激发出来的。
    如果你是一个长期关注机器人领域的人,自然会有一个疑问,为什么人形机器人经历了数次风口还是不能落地,难道那些做人形机器人的公司都是为梦想窒息吗,人形机器人的炒作何时休?
    其本质是,技术的发展不是线性的,虽然长期来看呈现波动向上的趋势,但中间过程是起起落落,甚至是高开低走。
    在最喧嚣的时候,我们需要不断打破线性预期。透过AI的发展历史,或可更加冷静看待人形机器人的成长轨迹。
    
    01
    从过去的AI看现在的人形机器人
    1、AI是怎么发展到这一步的
    “机器能思考吗?”1950年,计算机先驱艾伦·图灵在他的传奇文章《计算机机械与智能》中提出了这个问题。
    在1956年美国的达特茅斯会议上,约翰·麦卡锡等一众世界顶尖科学家首次提出了“人工智能”一词,标志着人工智能的正式诞生。
    之后人工智能领域展现出一路高歌的趋势,科学家们对人工智能做出了大量乐观的畅想和预测,致力于尽快开发出能够通过“图灵测试”的人工智能。
    可惜好景不长,在20世纪70至80年代,由于技术不足,然而许多人工智能程序更像是“玩具”,没有实际应用前景。人工智能的发展第一次陷入沉寂。
    在这之后的数十年,科学家们一直没有停止追求真正的人工智能。但事实上,所谓的人工智能却常常被调侃为“伪智能”,只能按照程序设定执行特定指令。
    直到2016年,也就是人工智能诞生60年后,谷歌的AlphaGO击败围棋世界冠军李世石。AlphaGO用4比1的战绩告诉世人思考和创造力不再是人类独有的技能。
    一朝成名天下知,AlphaGO的胜利给人们带来了无限遐想,“人工智能”这个概念的热度一下子达到了前所未有的高度。
    AlphaGo的突破在于:它可以自行深度学习进行走棋和预测,不需要人来设计算法“找特征”。表面上看AlphaGo比世界冠军更会下棋,背后是其不再使用蛮力算法,而是通过算法层面的创新及大规模深度学习训练后的人工神经网络,从错误中不断学习,最终展现出超人水准。
    这场人机大战在当时无疑是人工智能发展史上的一个高峰,市场颇为一致地相信人工智能产业奇点将近,或将催化下一轮产业革命。IBM等科技巨擘均重金投资人工智能。
    在国内,人工智能同样掀起了一轮技术创新的浪潮。国内商汤科技、云从科技、格灵深瞳等众多人工智能初创公司受到投资界的普遍追捧。一切都预示着:人工智能的时代已经到来。
    
    然而,在高点过后,被寄予远大前景的人工智能并没有大范围成功,相反,却很快失去了光环,迎来“人工智能的寒冬”。伴随着人工智能再次沉寂,市场一度出现了AI泡沫破灭的悲观论调。
    直到ChatGPT上线,AI再次从低谷冲上高峰。似乎一夜之间,AI进化成超级聪明的聊天伙伴,变成了能够完成个性化任务的办公助手。就像当年的AlphaGO一样,ChatGPT再次改变人类对AI的认知。
    如今,图灵等计算机先驱们在二战后就梦想的AI技术正在一步步走向现实:AI能够识别图片和人,能够回答复杂的逻辑性问题,能够自己编写创造性的文本,甚至创造曲谱等。
    从全球商业化应用上看,AI在金融、教育、医疗、安防、自动驾驶等领域已经星火燎原。
    2、相比AI,今天人形机器人走到哪一步了?
    2021年8月,马斯克在特斯拉AI日上发布人形机器人的概念图,将人形机器人再一次带入了大众视线。同时期,亚马逊、三星、谷歌等科技巨头纷纷加大对人形机器人领域的投入力度,使得机器人赛道热度骤然升温。
    时隔一年,2022年10月,马斯克带来特斯拉人形机器人,站在马斯克旁边的特斯拉Optimus,成为科技界的新宠。
    今年7月的2023世界人工智能大会上,特斯拉Optimus变身“流量明星”引来大量人群围观,拍照、合影、直播。
    特斯拉Optimus身高172cm,体重56.6kg,就是一个正常成年人的身形。其全身拥有28个自由度,手部有11个自由度,就如同人体的关节,可以实现灵活地抓握,且力大无比,可以单手举起一台钢琴。
    对人机器人而言,特斯拉Optimus的出现更像是当年的AlphaGo面世,正给世人描绘更大的应用前景。
    因为马斯克的号召力,市场对人形机器人的看多情绪被彻底引爆。毕竟马斯克把很多不可能的事情做成了,大家都愿意跟随他。也因为马斯克,正在让更多人深入地研究人形机器人。
    
    02
    人形机器人将再次沉寂,然后再次爆发
    事实上,特斯拉目前没有成熟的执行器供应商可以用于Optimus,而是需要自己定制,执行器作为人形机器人的核心部件,集成了电机、控制器、传感器等,每一种器件都是单独定制的,设计并不容易。
    正如一句老话所说:“对于人类来说很难的事情,对机器来说很简单。”反之亦然。
    以抓取场景为例,对于人来说,抓取触碰是一件再普通不过的事,但对机器的驱动系统就提出了很大挑战,一个机械关节想要触碰鸡蛋而不碎,背后需要非常精准的电机扭矩控制,而且中间需要大量软硬件结合的调试和学习。
    目前,特斯拉仅制造了10台Optimus人形机器人,所以拿个模型放在人工智能大会上也不足为奇了。
    根据公司在二季度业绩电话会上的透露细节,特斯拉Optimus人形机器人将在11月左右进行更多的行走和任务执行测试,在明年某个时候,将从特斯拉工厂开始尝试,让Optimus投入真正的生产活动中。在让人形机器人变得更聪明以前,特斯拉要先考虑的是如何让人形机器人在工厂工作时变得更熟练。
    换句话说,Optimus人形机器人在工厂的应用还处在试验阶段,其他应用场景也只能排在更加后面。短期来看,这显然要让把养老的希望寄托在人形机器人身上的人群失望了。
    特斯拉将Optimus定位为一款功能强大的机器人,可以执行不同任务的能力,在生产和生活中都可以扮演非常重要的角色,未来在全球各地帮助数以百万计的人。
    但是马斯克能否复制特斯拉电动车的成功,依然要打上一个问号,而它最大的挑战是如何用极致的成本实现足够发性能。毕竟马斯克也不止一次跳票了。
    比如电动皮卡Cybertruck,虽然马斯克称其是特斯拉的一张王牌,但这款车因电池供应等问题多次被推迟交付,从2021年底推迟到2022年底,再又推迟到2023年中期。直到今年的股东大会上,马斯克终于承诺将在年内交付。
    所以,如果马斯克这儿的商业化不及预期,人形机器人很有可能会再次掉入起落曲线中的又一个低谷,沉寂在所难免。
    类似的,AI未来可能一样还会再次遇到沉寂期。以ChatGPT为例,未来会遇到一些瓶颈,而这个瓶颈之一就是数据要素。一旦人类产生的数据被ChatGPT挖掘的差不多了,没有新的数据投喂,ChatGPT如何迭代升级?
    不管是人工智能还是人形机器人都曾经历了多个周期,历过低谷和高峰,在起起落落中向上发展。然后,人们对它的期望越大,失望越大。
    人形机器人上一次的高点是2016年前后,当时国内涌入了一大批新玩家,面对又一个新的技术浪潮,万众期待。但事后证明,当时的人形机器人更像是大号玩具,当初想象的情景并未在各行各业广泛落地。最后活下来的所谓人形机器人公司也是寥寥无几。
    不过,人形机器人还会再次突破,未来达到一个新的高点。
    从性能角度,还是以特斯拉为例,在他们看来,人形机器人等于没有轮子的自动驾驶汽车。特斯拉电动车的自动驾驶能系统和视觉神经网络系统在Dojo超级计算机的加持下,可以利用动作捕捉来“学习”人类,让人形机器人的性能变强大。
    从成本角度,目前市场的人形机器人动辄百万元,而且性能还达不到人们的预期。但是如果成本降到50万,甚至20万区间呢,这就相当于一辆中高端电动车的售价,如果性能达到一定程度,意味着大量普及的可能性。
    比如在工厂中,用工业机器人加AGV,以及自动化的设备,替代大量人工,降低制造成本。但是工业机器人还无法代替精细活的关键岗位。假如人形机器人能够胜任,人形机器人大军将会越来越庞大。
    更乐观一点,未来特斯拉人形机器人真如以低于2万美元的价格销售。那么能够打扫地板和清洁窗户的人形机器人会让我们的生活更轻松,就像家里的洗衣机和洗碗机一样。
    当年特斯拉最开始的一款纯电车型总销量还不到现在一个月的销售,如今Model 3已经成了街车。背后是成本下降和性能提升的叠加效果。
    值得一提的是,ChatGPT的出现为人形机器人提供了新思路——将大语言模型与人形机器人结合,通过图像、文字、视频等数据联合训练,并引入多模态输入,增强模型对现实中对象的理解,帮助人形机器人处理具身推理任务。浓缩成一句话就是以AI为人形机器人注入灵魂。
    如果从长远来看,投资回报率才是影响全球对机器人态度的关键。以亚马孙的无人超市为例。当亚马逊在市中心设立无人售货的小商店时,相机、传感器和射频识别芯片组成的系统会自动计算购物车里商品的总价。虽然亚马逊需要在自动化货架和收银系统上额外投资数百万美元,但在人工成本上节省了,于是它在之后的某个阶段就可以收回成本。
    类似的,如果一家养老院的职工能用人形机器人替代,那么这时人形机器人所带来的回报就不是以美元计算了,这时候的衡量标准变成了社会效率的提升。
    总之,一旦人形机器人的性能和价格符合预期,将触发新技术进入正反馈闭环循环。那时人形机器人的发展就势不可挡了。
    03
    为什么还要强调持续关注?
    未来人形机器人还会再次沉寂,也会再次起来,离商业化渐行渐近。那为什么我们要持续保持关注呢?不同点在于,本轮人形机器人浪潮,中国队不再是旁观者而是深度参与者,甚至有望成为引领者。
    过去十多年来,苹果链、电动车产业链、家电产业链的成熟,催生了一大批标准化、规模化的零部件公司。历经产业洗礼的他们具备一定的规模化生产和定制化开发能力。同样地,我国机器人产业链完整框架已初具雏形。比如三花、拓普、双环、恒立、汇川、绿的、埃斯顿等,有机会更快切入人形机器人的供应链。
    依托中国成熟的供应链,在看到特斯拉大规模量产前,我们会看到各种国产的人形机器人。比如达闼双足机器人、傅里叶机器人。中国企业不再是处在微笑曲线的底部。就像和AI赛道一样,不再只有谷歌等硅谷大公司,而有百度、阿里、科大讯飞等科技大厂。
    未来机器人很有可能会成为科技博弈的一个焦点,以中美两国主导的人形机器人“军备竞赛”已经拉开序幕。如今的市场上不断涌现出人形机器人技术的突破,并且更多的突破正在酝酿中。