为了让算法落地,人工智能公司如何绞尽脑汁?

数智前线

    商汤的一款下棋机器人再次让人们的目光聚焦在AI公司做硬件这件事上。过去几年,软硬一体成了AI落地的主要路径之一,但无论是之前普遍做的算法盒子、摄像头、硬件模组等toB赛道,还是现在尝试的toC赛道,硬件对于AI公司而言都不是容易的事。
    文|游勇
    编|王飞飞
    01
    令人意外的新品
    为了让算法落地,人工智能公司也是绞尽脑汁。
    8月,国内头部的AI公司商汤科技发布了一款令人颇感意外的硬件新品——元萝卜机器人。这是一款售价1999元的AI下象棋机器人,如它的名字一样,只能用于下象棋,不过模拟了人的动作,植入了AI算法,可以设置不同的难度。
    这个产品的设计看起来更像是小米的风格。它有一个小型的机械臂和两个鞋盒大小的白色机身,额头上有一块屏幕,头上一根摄像头。据知情人士对数智前线透露,商汤选择做AI下棋机器人,确实受到了公司内部有小米背景的人士影响。至于为何做象棋而不做围棋机器人,上述人士透露,主要是围棋的棋盘和摆子比象棋复杂了很多,不容易识别。
    即便如此,商汤科技创新工程院院长沈徽透露,元萝卜机器人也经历了20个月研发,迭代了9个产品。
    
    但商汤这款产品让不少业内人士表示看不懂,有人认为,尽管商汤在外界的印象中一直是一家大而全的AI公司,但直接做一款toC的消费级产品还是出人意料。还有人认为,即便做toC硬件,也应找到“爆品”,而下象棋机器人是一个颇为冷门的硬件品类,潜力不大,在天猫上,也只有一款同类型产品。
    “我觉得商汤是赔钱在卖。”在一位业内人士看来,商汤这个机器人,结构设计上比较复杂,而且商汤又没什么C端渠道优势,加上各种营销成本,很难赚到钱。商汤甚至还邀请了郭晶晶代言。
    在他看来,一块彩色屏幕和一个机械臂的成本都不低,虽然用了磁吸的方式,而不是模拟人手去抓棋子,后者的成本会更高。
    不过,更多的质疑来自于商汤是否有必要做这么一款产品:
    “头部视觉公司做这个,还不如下载个QQ游戏!”
    “建议产品经理做产品的时候多一些人性的思考,老头出去下棋,本质上是为了出去。现在被机器人拖在家里,出门放风的机会都没了。”
    商汤CEO徐立解释了这款产品的初衷,把大型的产业界的AI能力带入千家万户,到真实场景中进行体验交互,“科技可以给传统文化一个未来”。正如徐立所言,他的父亲也是一个棋迷,但年纪大了之后,除了在网上下棋外,没有其他的下棋的伙伴,而且网上下棋也伤眼睛,年纪越大也看不清楚,所以很少下。
    这似乎有想让视觉人工智能产品能影响更多普通人的意图,但如果分析当年语音人工智能老前辈科大讯飞下场做toC硬件,他们目标明确:一是找爆品市场,科大讯飞负责toC硬件的胡郁称,当年选择耳机,是因为几年前,耳机品类已经达到1亿出货量的市场规模;二是跑通产业链,比如选择教育类产品,背后考虑到了内容组织和供应。
    但商汤目前选择的场景并不被很多人所看好。AI从业者张斌泉告诉数智前线,只能下象棋,功能过于单一,他曾给孩子买过很多机器人和机器狗,20多项功能三天就玩完了,很快就失去了新鲜感。消费者要的是丰富性、可玩性、趣味性,“一个单一功能的东西,玩一天就不玩了”。
    有人认为,即便做类似字节跳动推出的带有“管孩子”和“孩子互动”的台灯,都是更好的选择。甚至与视觉算法更契合的扫地机器人也是一个更刚需和庞大的赛道。
    一位教育硬件从业者告诉数智前线,包括学习机、点读笔、单词卡等内置了AI能力的产品,这些年都卖得非常好。“单词卡卖得很便宜,量也很大,动不动就是10万量级的产品。”
    虽然教培公司这两年遭遇了双减冲击,但一个很明显的趋势是,硬件是在线教育公司为数不多还在努力的方向。显然,教育硬件是很多家长的刚需,它最终目的是提高学生成绩,但相比之下,下象棋或者下围棋的需求会明显小很多。
    另外,商汤之前也做过教育编程的车,尽管是商汤与学校合作的toB产品,但商汤也可以另辟蹊径,像大疆、乐高一样推广带视觉功能的toC教育硬件,也不失为一个选择。
    商汤科技的元萝卜机器人开始预售一周后,在天猫的销量才过百单,而且需要在两个月后才能发货。这对于一款toC的硬件产品而言,从发布到发货间隔这么久,并不是非常合理的做法。
    ToC产品与这些AI公司的ToB业务也存在很大差异,前者更考验供应链能力和销售渠道,商汤并没有建立完整的toC产品的渠道。一位业内人士告诉数智前线,商汤的元萝卜机器人或许会把ToB作为渠道之一,比如将这些产品卖给棋院,就像科大讯飞将翻译机卖给政府一样。事实上,商汤这款产品也与中国象棋协会进行了深度合作。

    02
    AI公司热衷硬件的背后
    虽然AI视觉公司里,很少像商汤一样直接做一款toC硬件,但行业的一个共识是,纯技术公司很难赚到钱,技术必须与具体场景相结合。
    这些年,做硬件或者软硬一体,一直是AI小龙们所努力的方向。他们做一些搭载了AI算法的盒子或者是摄像头和刷脸的面板机。
    AI视觉公司里,最早在硬件上布局的是旷视科技。2015年,旷视就推出了首款AI摄像头,“抱着试一下的心态。”旷视科技联合创始人杨沐说。当时旷视试水各种硬件,寻找适合算法的载体,一开始大家的认知是算法载体是服务器。但服务器太贵,而且功耗大,用户得建设机房。当时一些小区、园区的门禁就有将算法放在终端摄像头上的需求。
    2017年,商汤也发布了首款自研智能硬件产品SenseID人证核验机,被用于机场等场景下的人脸通行。2018年3月,云从发布了一款AI摄像机,开始软硬一体。2019年5月,依图通过收购的方式推出首款芯片“求索”,并将其搭载在智能服务器、智能边缘计算设备中。
    在各大AI公司向软硬一体转变的背后,是早期光靠算法的商业模式很难再往下走。
    极视角联合创始人刘若水告诉数智前线,市场早期不缺钱,大量风险投资涌入,使得AI公司一向不太重视成本管控,大家都在高薪招人埋头搞算法,潜意识里认为,把算法搞好就会有市场。
    但到了现在这个阶段,外界更关注算法本身能否落地,商业模式是否行得通。而且相比于可以不断复制的软件产品,算法还有大量定制化的需求,这也使得成本未必能降下来。
    云从科技联合创始人姚志强对数智前线表示,应用层面的单一模块化及单点技术革新,难以满足日益错综复杂的细分场景需求,AI企业亟需增强提供完整解决方案的能力。
    另外一个原因是,有技术能力的大客户,算法公司越能做到偏底层的对接,但对于中小公司而言,往往需要提供更完整的东西。“你拿一个算法给他,对他来讲很难去接入的。”杨沐说。
    “SDK其实是一个很高效的合作模式。”杨沐说,前提是合作伙伴很清楚自己需要什么,像人脸解锁和刷脸支付等,手机厂商和支付公司自身有很强的能力和明确的需求,算法公司只需要提供SDK的接口。
    但问题在于,很多智能化场景,往往是AI算法的公司先看到机会,不得不自己先去试水和市场培育。在这种背景下,软硬一体的优势就凸显出来。
    刘若水告诉数智前线,极视角绝大部分收入来自于软件算法,硬件由大客户自己集采。“每个算法都找一个特别合适的硬件去做适配,这件事情的投入产出不是特别高。”
    但中小客户对硬件完全不了解,而且场景比较单一,直接提供软硬一体的产品,反而能快速部署和出货。比如明厨亮灶、智慧工地和智慧安监等,都是视觉算法比较成熟的场景。“算法比较固定,一个场景里需要识别多少路的摄像头也比较固定。”
    “纯做AI算法或者是AI软件,不往用户侧去搞数据搞应用的,或者不往下搞芯片搞硬件的,我认为长期来看会死掉。”张斌泉说。早期硬件成本的占比比较低,算法能卖上价,一路人脸识别能卖好几万。
    但现在一路AI人脸检测的价格才几十块钱,云端也才小几百块钱,在这种情况下硬件的占比就极大的凸显。
    从资本的视角来看,纯算法的收入也无法支撑起庞大的估值。“想要去冲一下这个营收,因为纯软的收入可能不够。”一位AI算法公司的员工说,算法虽然毛利高,但整体盘子并不大,不利于在资本市场讲故事。“纯粹卖算法,一年一两个亿已经很多了。”但一两个亿的营收显然支撑不了AI公司数百亿的市值。
    而且,随着算法的门槛越来越低,价格也不再昂贵。一个算法卖5万块钱,但如果加上服务器可能能卖到15万,相当于把营收放大了三倍。
    03
    “变硬”并不容易
    但做软件和做硬件,背后需要的是完全不一样的能力。
    “算法需要更高级的人才,懂业务落地的算法工程师,而硬件需要渠道和供应链的优势。”姚志强说。
    “做硬件几乎都在抠成本,但做软件,一个算法大牛可以顶千军万马。”一位经常与供应链打交道的AI行业人士对数智前线说,硬件的坑密密麻麻,“供应链是个重灾区”。
    她现在还对这些教训记忆犹新,曾经深圳工厂的老板都是拍着胸脯,义正言辞跟她保证绝对没问题,“被骗了好多回之后才学乖的,他们说的话你听听就行了”。比如到期交不了货、偷工减料等,即便事后追究工厂责任,但错失了销售时机,对企业而言是个沉重打击。
    她曾遇到一位客户,对方做的是一款内置4G存储卡的玩具,还专门向芯片设计厂商购买了IP授权,但没想到组装工厂给他用的是二手物料,导致经常卡顿。结果卖出去的东西面临着大量的售后,没卖出去的也需要返厂重做。
    2018年以前,旷视也一直在寻找更合适的硬件载体。当时买了一堆市面上与视觉相关的硬件,研究能不能把算法方案放上去。“主要的工作就是在各种硬件和芯片的选型上,市面上成熟芯片都用过”。
    但学费没有少交,做了很多产品但没卖不出去。而且硬件研发周期长,管理比较琐碎,涉及库存、供应链把控、选厂等等,“这都是需要花时间积累的行业know how。”杨沐说。
    比如买了一堆芯片,怎么去保管,放在仓库会不会氧化。而产品定义时,哪怕少了一个接口或者通信协议,板子可能就得重新设计。
    “传感器是做前照式还是背照式,要不要把HDR功能加进去,都需要取舍,一旦取舍错了,不是说造出来没用,而是你的定价跟市场需求不匹配。”杨沐说。
    市场早期为了验证可行性,旷视找的是外部团队,掏钱合作也相对比较容易。但随着规模化部署,集成难易度、交付难易度和成本变得更为关键,“一旦关心起成本,硬件的设计就变得至关重要。”
    硬件的设计决定了整个产品是否能成功的最关键点。2018年之后,旷视的硬件研发团队开始逐渐形成规模。当时有一个背景是,硬件分工已经非常明确,做硬件不需要从造芯片开始,更需要做的是围绕具体场景,兼顾产品的通用性和交付难易度。
    比如,门禁通行的场景里,接入不同线路的摄像头,意味着需要不同的内存。之前像英伟达服务器,往往是一个标准产品,价格贵。但如果在硬件设计之初,把多少算法需要多少内存算清楚,最终的硬件产品会有很好的成本优势。
    这也是旷视提倡的算法定义硬件理念,先吃透场景需求,然后再根据算法的需要去设计一款有价格优势的硬件产品。比如2015年前后,大家普遍认为算法的最佳载体是服务器。但其实服务器价格贵,功耗大,需要建设机房,没办法在各地部署。所以,旷视那段时间做了面板机、网络摄像机。
    而且,单纯抠硬件制造成本不一定效果最优,适当放宽硬件制造成本,但大幅度降低软件成本,反而总成本会更优。
    还有产品研发周期。大华资深人士告诉数智前线,海康和大华都在拼速度,产品上市快,一个产品在指标上的领先和控标周期只能做到6个月。
    除了这些,硬件的销售渠道对AI公司也是个不小的挑战。比如科大讯飞建立了“CBG”的渠道体系,海康威视和大华等传统硬件厂商已经下沉到城乡,旷视也提出与运营商合作,毕竟运营商有中国最大的销售和运营网络。
    在张斌泉看来,深度学习技术尤其是视觉的深度学习,到了一个瓶颈期,能落地的场景挖掘得差不多了,真正商业化的点不多,“大家都觉得是一个新的人工智能浪潮,但没掀几段浪。”另外,硬件同质化越来越高,这也意味着,竞争最终会来到渠道和价格的比拼。
    商汤在toC硬件方向的首次尝试,尽管提供了一种新的思路,但目前看并没有太大的销量和声量。
    姚志强认为,人工智能目前更适合做专业级市场,因为它还不是一个完全通用化的产品。消费级产品要求性价比,而人工智能没有完全通用化,很难把价格降低到很低的程度。
    在软硬一体成为行业趋势的当下,头部的几家AI视觉公司已经走上不同的道路。商汤搞大模型、大装置,几乎什么业务都在尝试;旷视则以AIoT为主攻方向,选择了消费、城市和供应链场景中的几个重点品类;云从则倾向于人机协同操作系统,自研部分硬件主要是为了树立标杆案例,目的还是吸引合作伙伴。无论哪一条路,目前来看,都还在路上。