亚马逊牵头组建语音助手联盟
在其年度秋季硬件发布会的前一天,亚马逊宣布了一项重要的合作关系声明:它创建了“语音互操作性计划”(Voice Interoperability Initiative),这是30多家公司的联合意向声明,将努力确保设备可以同时兼容多个数字助理。例如,用户只需说出适当的唤醒词,即可与同一台智能音箱上的Alexa或Cortana对话。
亚马逊设备和服务高级副总裁Dave Limp表示:“我们不愿意看到只有一个语音助手来统治所有设备。这不是体育赛事,不会仅有一个赢家。”Limp认为,如果会存在多个语音助手,那么它们应该更好地协作。
大批为语音助手构建软件和硬件的公司已加入该计划,亚马逊的声明如下:
“30多家公司正在支持这项工作,包括亚马逊、百度、宝马、Bose、Cerence、ecobee、Harman、罗技、微软、Salesforce、Sonos、Sound United、索尼、Spotify和腾讯等全球品牌;Free、Orange、SFR和Verizon等电信运营商;硬件解决方案提供商,例如Amlogic、InnoMedia、英特尔、MediaTek、恩智浦、高通、Inc.、SGW Global和Tonly;以及CommScope、DiscVision、Libre、Linkplay、MyBox、Sagemcom、StreamUnlimited和Sugr等系统集成商。”
这是一个非常长的列表,但其中却缺少了三个非常杰出的公司:谷歌、苹果和三星。
而那些支持这一计划的公司却表示很高兴。英特尔表示,其第10代芯片将于今年兼容“多个助手”,而高通则表示,其芯片组已经能够支持多个唤醒词汇。
如果仔细阅读微软Cortana副总裁Andrew Shuman的声明,你可能会发现这是对谷歌和苹果不支持第三方助手最为温和的表态:“我们希望这一计划能够帮助我们将这一愿景扩展到更多公司,并建立一个平衡的生态系统,使各大公司能够在所有平台上创建和提供助手。”
更有趣的是,其他公司似乎也渴望在Echo设备上安装自己的语音助手。Salesforce首席执行官Marc Benioff写道:“我们期待与亚马逊和其他行业领导者合作,使世界领先的CRM助手Einstein Voice能够在任何设备上获得访问。”Spotify研发主管表示:“我们很高兴加入语音互操作性计划,该计划将使我们的听众在他们选择的任何语音助手上都能获得更加无缝的体验。”
百度的参与也很引人注目。其DuerOS语音助手拥有超过4亿用户,虽然比Alexa多,但比Google Assistant少。据研究公司Canalys称,百度仅次于亚马逊,成为第二大智能音箱制造商,尽管仅服务于中国市场,但最近已超过谷歌。
这些公司设想的理想情况是将有两种助手。一种将具有广泛的知识和能力(例如Alexa、Siri和Google Assistant),而另一种则更为专业和深入,并针对特定知识领域。当然,最终的目的就是,无需精通高深的技巧,就能在智能音箱上直接与其中一个助手对话。
这是已经在PC电脑上发挥作用的策略。亚马逊的语音助手已经更紧密地集成到了Windows 10中,当有人从房间的一边喊“Alexa”时,特定的PC电脑就可以响应一般查询。微软的Cortana也在重新调整重心,关注与该公司软件和服务的交互。
Limp将他对语音助手的愿景比作浏览器:你可以使用所需的任何浏览器访问所需的网站,那么为什么不使用所需的音箱与所需的助手对话呢?“我们是一家Web 1.0公司,”Limp说。“而我现在能够坐在这座大楼中的原因就在于网络的互操作性。”
这是一个崇高的理想,但在战略上也可能很精明。亚马逊已经在拥有Alexa的家庭中占据了有利位置,因此让其他助手使用Echo音箱进行工作似乎并不是一个大问题。需要明确的是,亚马逊致力于允许这种情况发生。该公司此前宣布,法国的Orange用户将能够购买支持Alexa和Orange助理Djingo的Echo音箱。
但是,尽管曾多次尝试与Android制造商和耳机制造商建立合作伙伴关系,但Alexa在手机上并没有取得太大的成功。除智能手机中最有影响力的三家公司外,每家公司都参与的整个行业计划似乎是被故意设计的,旨在向这些公司施加压力。(这也可能帮助亚马逊证明它不是垄断性的,因为它非常愿意与他人合作,并向竞争对手开放其语音平台。)
无论你将其视为利他主义还是战略性的策略,该计划至少会对谷歌造成一定压力。该公司一直以来对允许Google Assistant与其他软件配合使用,表现的非常谨慎——尽管这更可能是出于与隐私相关的原因,而不是与市场动态有关。
当被问及有关谷歌、苹果和三星的具体细节时,Limp说:“我们很乐意让这三家公司参与这项计划。”这样的表态听起来很像是这三家公司拒绝了邀请,但是Limp拒绝对此进行详细说明。
他说,尽管一直以来他都在与其他公司讨论这个想法,但直到最近的“六周”,它才逐渐成型。考虑到像谷歌和三星这样的公司移动的速度之快,六周似乎并不是很长的时间。从技术上讲,Harman是三星的子公司,而三星手机也已经同时支持Bixby和Google Assistant,因此尚不清楚该公司为什么不参与这项计划。而至于苹果,我们并不清楚它是否愿意加入。
谷歌向媒体发布了一则声明,指出它只是在上周末才听说这项计划:“我们刚刚听说过这项计划,需要对其细节进行审查,但总的来说,我们始终对参与能够得到生态系统广泛支持并坚持严格隐私和安全措施的计划感兴趣。”
三星和苹果尚未回复置评请求。
需要明确的是,Limp否认这项计划会给这些公司施加压力:“如果他们不想这样做,那我们是不会尝试改变他们的想法的。”
从技术角度来看,关于实施、软件、隐私等各种问题,我们还尚无法回答。语音互操作性计划既不是标准组织,也不是对其成员如何应对一台音箱同时支持多名助理这一复杂问题的规定。
亚马逊目前正在免费提供其“唤醒引擎”,以便其他想要建立自己助手的公司可以利用亚马逊的研究来开始开发。但是这项联盟中的公司可以自由地使用他们喜欢的任何技术。
迄今为止,还没有很多设备可以“支持多个同时唤醒词汇”。比如,Sonos One等更出色的设备,让用户在Alexa或Google Assistant之间进行选择。
但是实际上并不存在真正的技术限制。Sonos软件副总裁Antoine Leblond演示了一个Sonos One音箱。它在听到“Alexa”和“Hey Google”唤醒词之后运行得非常好,包括Sonos的“连续性”功能,该功能使用户可以使用一个助手开始音乐,然后用另一个助手进行控制。
考虑到亚马逊一再表示很高兴让Alexa与其他助手共存,那么Sonos One不采用这样的模式是不是因为谷歌不允许这样做?Leblond表示了否认,但他确实提出了一个事实,即一个音箱上存在两个活跃助手可能会出错。例如:如果你通过一个助手设置了闹铃,但闹钟响起时却不在身边,你的家人该告诉哪位助手停止呢?
从技术角度弄清楚如何部署多个助手甚至不是最困难的问题。如果过去一年有什么能够教导我们的事情,那就是很少有人意识到语音助手正在收集我们的全部数据。让人工审核者检查转录音质的做法,已经让亚马逊、谷歌和苹果遭受了舆论打击。三家公司为此都改变了研发方向,增加了透明度,让退出、删除数据或两者都更容易。
一个由25家公司组成的联盟想要让多个助手轻松共存,这听起来也不是保护隐私的好方法。但是Limp强调,他想仔细研究这些系统的结构。
例如,他认为应该有严格的规定,绝不允许一个助手“窃听”用户与另一个助手的对话。这看起来很简单,但是还有更棘手的问题。聆听不同唤醒词所涉及的大部分工作应该由硬件还是软件来处理呢?当Limp表示他设想“语音助手有朝一日可以私人名义代表客户,以保留上下文和连续性的方式在云中进行协作”时,如何确保隐私性呢?
而且它变得更加棘手:在过去的一年中,一个常见的疑问是,这些助手在出人意料地录音的同时,却没有听到唤醒词。因此,如果一台音箱中可能准备好两个或十几个不同助手时,那些意外的录音会怎样?
这些问题尚无明确答案,而且在六周关于组建该计划的讨论后,气氛开始变得严肃起来。我问Sonos是否还会后续会议、合同甚至应酬时,答案都是“不,不,不”。看来,一切都还很早。
亚马逊,尤其是Alexa,因迅速行动以扩展其生态系统而闻名,有时也以牺牲清晰度或软件质量为代价。但是,至少这次,亚马逊似乎并不着急。
“我们研究这个事情已经五年了,”Limp说。当他仔细研究技术和隐私问题时,他认为“这是一个棘手的问题,而且规模相当的大,将需要很多很多年才能够解决。”