科大讯飞加入汽车生态战局,「飞鱼 OS」有多少机会?

GeekCar

    
    不去中心化,还谈什么未来?
    十几年专攻语音方向,科大讯飞在语音交互上的技术成果也成了他们在车机操作系统上的优势。最近他们在做什么呢?
    GeekCar 和科大讯飞智能汽车事业部总经理刘俊峰、科大讯飞智能汽车事业部高级产品经理汪华锋聊了一下,发现他们正忙于飞鱼 OS 的商业化落地、多模态交互方式的研发和更新,以及建立一个去中心化的生态系统……
    在建立服务生态智能体系上面,他们向行业开放自己的 AI 能力、硬件平台接口、飞鱼 OS 运营组件,已经和 40 多家合作伙伴进行了深度合作。
    产品战略布局:软硬分离
    先了解一下科大讯飞的汽车业务。去年起,他们把产品阵列凝聚成为下面三个:
    1)飞鱼的智能语音套件系统, 它在车上更多表现为是一个语音助理;
    2)飞鱼的智能车机系统, 现在搭载它并实现量产的有六个车厂的近 10 款车型;
    3)小飞鱼, 这是科大讯飞基于同样的操作系统、同样的平台面向后装做的智能硬件。
    
    刘俊峰透露,现在在营收上,科大讯飞的前装产品和服务占比达到 90%,后装约占 10%。「这一定程度上也因为我们的后装产品上市较晚,去年 8 月发布的。」他说。
    按照他的预计,在智能语音系统的量产规模上,今年年底科大讯飞将达到 1500 万台前装的装配量,今年整体的出货量将超过 400 万台。
    飞鱼 OS 是什么? 它是科大讯飞今年 5 月在深圳发布的语音操作系统架构,最近科大讯飞将这个系统架构和汽车的使用场景结合,和他们相应的汽车后台服务整合成了一个新的 iflyos AUTO 版本。
    汪华锋告诉我们,为了满足不同客户的需求,科大讯飞将飞鱼 OS 拆分为两个层级:LITE 版和 PLUS 版。PLUS 版比 LITE 版在整个系统里面做得更深入,更深度地定制系统的 framework 层,甚至一些 hal,kernel 层的部分模块。
    同时,科大讯飞在系统底层也做了参考设计和优化,为行业带来架构多元的能力:每一家车厂都有它自己的「云」,在这种情况下科大讯飞通过他们云端的开放将更多的「云」融合。具体来说,目前飞鱼 OS 接入了高德导航、QQ 音乐以及美团的一些生活服务,把这些多种生态平台里的服务聚合起来,给用户提供更多元的服务。
    这种「双层级+多生态」的模式让飞鱼 OS 本身建立起了「软硬分离」的能力。这也是他们提出的一种方案,计划将实行。
    
    「软硬分离」方案指的是,客户可以不使用科大讯飞的硬件,而只买他们的软件服务。其实这种灵活性服务,一定程度上也让软件技术优势明显的科大讯飞,在硬件产品较为成熟的市场里有了更多生存和发展空间。
    反之,客户买科大讯飞的硬件服务,用别人的软件应该也可以……
    怎么构建软件服务的差异性?
    刘俊峰讲了一下他所了解的车厂遇到过的问题:
    有的车厂在向智能化转型的路上,一开始软件开发是找外包,之后再自己做的,这时他们往往难以真正从软件服务的角度出发让自己的产品在这方面形成能支撑品牌的亮点;
    更可怜的是现在很多互联网厂商在投入汽车智能化生态过程之中,因为前述问题往往不得不配置一些定制性的、差异化的,必须要满足工程交付标准的割裂的版本。
    因此,他提出了给行业的三点建议:
    1)车型平台化之后需要接口的平台化。「因为这个决定着我们跟汽车怎么样的打招呼,决定着这种语言是不是通的。」
    2)硬件平台的设计标准化。 这对操作系统是一个考验,平台设计的标准化决定了生态合作伙伴能否把自己最好、最新的服务迭代在硬件上。
    3)构建真正有差异化的汽车品牌的生态和服务系统。 这个生态和服务系统里不光是吃喝玩乐、娱购游,还包括服务、汽车 4S 店的维修、保养提醒、保险提醒、配件、电商体系。
    「每个环节都应该是一个车厂最重要的个性,而所有这一切都需要内部管理体系来支撑。如果没有能够因时而变的项目管理体系,我认为在软件这方面,产品的验证体系和产品的评审周期是很难建立的。」刘俊峰说。
    另外,在语音交互同质化不可避免的当下,刘俊峰指出这方面的差异化则应该体现在服务的用户不同上。
    「唤醒词的差异化不是核心差异化,真正的差异化是语音交互的有情感的表达。例如一个小型 SUV 和一个偏商用化的中大型 SUV,它们的交互应该是差异化的,这种差异也该符合车厂对用户群的定义。」他表示。
    聚焦于人:多模态交互
    科大讯飞在汽车方面一直走在一个垂直方向,他们以前和现在最聚焦和关注的一点是如何「理解人」,这里的人指的是汽车上的服务主体,他有可能是司机,也可能是乘客。
    刘俊峰介绍称,最新版的飞鱼 OS 更关注交互的质量,关注核心技术,能够给人的体验的变化,关注它的服务链条,关注虚拟助理是不是有情感,关注传感器,关注算法融合。
    科大讯飞主要对飞鱼 OS 做了三点更新:
    1)多模态交互
    这种交互方式行业内已经提出了很长时间,但是应用效果却并不算好,这其中主要原因之一是当各种技术在整合为多模态交互功能时,没有形成标准化。
    现在科大讯飞把自己的语音、图像技术以及他们合作伙伴的能力相结合,整合入飞鱼 OS。现在飞鱼 OS 包含语音合成、声源定位、窄带波束、声纹识别、智能打断、语音唤醒、语音识别、自然语言理解、听歌识曲等组合核心技术,让机器做到更像人的交互方式。
    2)多乘客交互(多音区交互方案)
    这是科大讯飞在行业内首次提出的交互方式,他们也是最早把这种技术落地量产车上的。
    多乘客交互也叫做多音区方案,它主要考虑的是随着汽车智能化和自动驾驶技术的发展,车内将有更大空间,并且车内的娱乐服务需求会增加,因此满足解放了双手的驾驶员、各个位置的乘客的需求都将是车内服务的关键。
    
    实际上科大讯飞的这个多音区方案已经在蔚来汽车里已经实现了第一步:它能将车内空间里的不同乘客进行区分,知道你坐在后排的左边还是右边。
    「未来还可以做得更好,比如说在同一个时间几个人同时说出不同的指令,机器仍然可以分辨出来去执行相应的动作,每个动作互不影响。同时结合这样的能力我们还可以为不同乘客量身定制更多的专属服务。」刘俊峰说。
    可以试想,以后无论你坐在车上哪个位置,都可以用「打开车窗」四个字,让汽车自动打开你身边的那个车窗。
    3)情感化交互
    蔚来 ES8 上搭载的 NOMI 就是结合了科大讯飞的人工智能技术打造的智能助理,它的拟人交互表现几乎引爆了整个行业的关注。
    刘俊峰指出,NOMI 其实就是从人的需求角度出发设计的产品,未来人机交互也一定会更加类人,更加情感化。「我们也希望通过我们的技术和产品,为每一个人都提供属于他自己的这样一个 AI 虚拟助理。」
    
    从技术角度看,科大讯飞为了让汽车能听会说、察言观色,增强了汽车听、说、看三个维度的能力。听的部分在声纹识别和降噪模块的基础上增加了多音区能力;说的部分,在技能平台、AIUI 的基础上,增加了 XTTS 和音效;看的部分,在 360 的基础上,他们增加了人脸识别和疲劳识别能力。
    去中心化的生态系统
    服务车主早已不单单指满足车内用户的需求了,现在无论是供应商、车厂、各种汽车服务平台也都在延展、布局和汽车相关的整个生态。科大讯飞也不例外,他们表示要建立一个去中心化的生态系统。
    什么叫去中心化?
    在一个生态系统里,语音的交互和车内的智能体验少不了和各种生态伙伴的合作。过去很多车厂一直都是采取单边合作——一个车厂找一个 Tier 1 供应商解决所有问题,但是这种情况已经开始变化,并且现在的趋势是一个车厂找多个供应商去一起解决一个问题。这就是去中心化。
    他表示,大概十年前,如果一个你想和车厂沟通新技术的更新等问题,中间的硬件集成商往往非常不开心,因为这个过程里他们很难及时地应对新技术融合、集成、量产、上市。现在这个过程翻篇了,在多边合作里,不管是软件企业、硬件企业还是互联网生态厂商都可以充分和主机厂沟通。
    在未来的生态里,一方面软件的迭代速度比硬件更快,另一方面软件的整个性能要求可能会决定硬件的架构,以及整个系统架构的模式,因此刘俊峰还提出了一个有趣的观点:
    未来类似 BBA 的厂商在和各供应商沟通时,顺序可能是反向的
    「他们可能先来确定软件的表现模式、交互效果,然后再找它的算力平台、它的芯片,最后再找那个 Tier1 的厂商。」他说。
    多边合作也多少解决了新技术难以及时落地的问题。「这是一个讨论怎么构建新产品,有竞争力的产品,有差异化产品的时代。这样的一个生态不仅是科大讯飞要考虑的,也是每一个主机厂,每一个生态的合作伙伴要考虑的。」
    科大讯飞说要构建去中心化的生态系统,它的定义很宽泛,不单指在网上的吃喝玩乐、娱购游,这其中也包括了汽车电子,汽车的传感器,汽车其他的一些外扩的智能方面。在生态中,刘俊峰希望科大达到以下三个目的:
    1)在汽车智能化的路上,通过试错和验证,来探索用户真正想要的场景、服务、技术
    2)通过生态聚合和生态深度融合,创造多个所想象的未来场景的展示平台和 demo, 让大家选择时可以充分考虑展示出的效果和性能;
    3)融合供应链, 让大家能从这个过程直接输入到一个主机厂的前装车型,从而减少在前装上选择供应链的时间,以及在选择之后工程化开发的时间。
    开放生态智能架构
    目前,科大讯飞在飞鱼 OS 系统里做到了「去 APP 化」,进行应用整合。他们希望把 IOT 生态随时、及时地在飞鱼 OS 上线,把各种功能融入整个系统平台内,做更加灵活的场景推送。
    「所以我们还要更开放一些,让我们的开发者联盟伙伴都可以在飞鱼平台上对接自己的典型应用和特色服务。」刘俊峰说。
    在开放飞鱼 OS 的整个生态智能架构上,可以将科大讯飞的「开放」分为三方面:
    1)开放汽车 AI 技能定制平台。 这个平台可以支撑开发者或客户的技能 1 秒上线,还可以帮助科大讯飞的客户或开发者有效地收集用户数据。
    2)开放硬件平台。 科大讯飞硬件平台开放后,可以接入车机硬件、座舱硬件、后装设备,包括第三方智能驾驶、辅助驾驶接口,让客户和合作伙伴可以快速集成和使用。
    3)开放运营组件。 科大讯飞开发了场景模型和各种生态接入接口,为合作伙伴提供相关运营组件通道,让服务智能找人、直达用户。
    目前,科大讯飞和美团是战略合作伙伴,他们的系统已经做到了和美团的送餐服务、猫眼电影票服务实现闭环,未来还会增加更多场景。
    「虽然我们和美团的关系非常好,但是美团所覆盖的众多业务并非都适合汽车场景,我们会和他们产品部商量最适合的场景融合进系统。」汪华锋这样告诉 GeekCar。
    实际上目前,美团体系外的高德地图、携程旅行、QQ 音乐、酷我音乐、喜马拉雅、京东、新浪微博、今日头条等服务也已经对接了飞鱼 OS。和科大讯飞进行深度合作的合作伙伴达到 40 多家。
    比起 BAT 等背后有自己生态的企业来说,科大讯飞在构建生态服务系统上必定有弱势,但是这个弱势可能也正好能成为优点,让飞鱼 OS 对其他体系的排他性减弱了。
    最后我们看到,在汽车领域,科大讯飞从单纯的语音技术提供商,做起了车载系统,直到要布局汽车生态系统,业务越来越广。但一个有意思的消息是,他们在员工量上没有增加的计划,反而准备减人。
    目前,科大讯飞智能汽车事业部有 400 多人,明年他们的目标是将人数降到 400 人以下。「我们想用合作的力量去解决外部的对核心技术要求不高的工作,自己的人还是专注技术,这样也能提高人效。」他说。
    很明确地,科大讯飞在决定要做平台的同时,并没有考虑过放弃什么已有优势。这家合肥公司里还是一帮技术宅。