语音定制功能实测:AI让我们更“离不开”百度地图
曾响铃你可能已经习惯了“前方路口左转”这样的地图语音由一个标准的女声,或者某明星的声音发出。
但是,百度地图最近推出的一个功能“语音定制”可能要颠覆你的认知了:指挥路痴的你怎么走,或者与你进行日常交互,或者告诉你景点信息、好吃好玩的声音,可能是你自己的或者是你想要的某种声音!
过去几年,百度地图陆续推出以AI为依托的杀手级应用功能,例如能够识别复杂语音需求的“全语音操控”,用户只需要随心所欲用嘴说出自己要去哪、干什么,地图就能够自动甄选目的地并导航。
现在,每个人都可以有属于自己的地图定制化语音包,AI再一次让百度地图惊艳。而作为行业观察者,响铃和身边的同事、家人、朋友要以用户的身份,去看看这个百度内部代号为“百雀灵”的语音定制项目落地后究竟能带给我们什么样的体验和感受。
语音定制后,百度地图这下把“个性化”玩到了底
由于有了全语音操控能力,在进入“语音定制”功能这件事上,百度地图也充分利用了语音技术的优势,除了通过手动点击地图首页的“出行助手”后进入“语音定制”,我们在打开APP后,只需要唤醒“小度小度”后说出“录制我的语音”也能进入功能界面。
(喊“小度小度”开启语音包录制)
语音合成技术是一套复杂的技术体系,这里不多谈。仅从我们普通用户的使用而言,简单来说,我们能接触到的主要有三个阶段:提供语音素材、等待后台合成、最终上手使用,每一个阶段都关乎体验是否足够良好。
过去地图界也有类似的语音合成技术,但由于技术并不足够成熟,仅限于商用级别的明星、KOL个案声音录制,毕竟,每一个声音都需要花费大量时间到专用的录音棚采集声音素材,长时间的合成运算也需要等上很长的时间(往往以月为单位)。
如果给我们普通用户的个性化语音定制也是这么一套流程,定制也就失去了用户体验的意义。
现在,实际体验下来,百度地图的语音定制已经解决这个商用技术走向“民用”的问题。
先看声音素材采集阶段。
实测只要找一个相对安静的环境,不管是较少人声的办公室还是无人的会议室,跟着百度地图的指引念出20句不超过15字的素材,采集就能顺利完成。这个过程中,用户还可以选择不同的风格的引导语句跟读,例如卡通素材、影视台词等。
百度地图原本让所有人用一套句子应当也可以,但它没有这么做,可见即便素材采集已经足够简单,用户体验的细节还是不放过。
(公司同事纷纷录制属于自己的声音)
录制完成后,进入等待期。百度地图官方宣布用户大约需要等待20分钟,来进行云端的个性化语音合成。这个速度相对于过去以月为单位的合成速度,已经呈现了几何级提升。
但是,实际APP体验时,用户的等待时间往往只有15分钟:
(实测等待时间普遍为15分钟)
15分钟后,经过简单的设置,选择自己的语音包作为APP默认语音包,百度地图各类导航、交互、资讯介绍全部变成用户自己的声音,以后甚至借助百度地图的景区播报功能,可以自己当自己的导游!
为了当场测验语音效果,响铃设置了离办公室不远的星巴克作为目的地,驾车由百度地图进行导航,
(个人导航语音包实测中)
实话实说,最终的个性化语音包与真人的拟合程度并没有达到100%、一模一样的水平,但直观上,八到九成的相似度肯定有,随机邀请写字楼的朋友去“喝咖啡”,这位朋友被惊讶到,“怎么会是你的声音”,冲击感十分强烈。
这样的拟合程度,仅从技术角度看,在简便的素材采集和极短的合成时间下已经非常高。
总体而言,自己和身边的百度地图用户体验下来,最大的感受是“个性化”做到了极致。
过去我们老谈APP产品的个性化,但说实话这种个性化都是“一群一群”的,地图APP给我们划定了一个个明星包,大家“选择”自己喜欢的,个性化程度比过去的一成不变要好很多。
但是,随着我们用户的个性化需求越来越强,这种“聚类”型的个性化已经难以满足需要。从语音包到语音定制,AI语音合成让个性化真正变成字面意义,每一个人都开始拥有真正属于自己的“一个一个”的个性化体验和服务。
你的APP体验,只有你才会有,这才是把个性化玩到了底。
AI+地图玩到这个程度,大家终于不再有选择困难症了
选择困难症是移动互联网信息爆炸、产品爆炸、功能爆炸时代每一个手机前的用户常常犯的毛病,不知道用谁,有时候这个APP好,有时候又觉得那个产品不错,结果手机里装塞满了各种舍不得卸载又不怎么用的APP,常常报警提醒我们要清理手机了。
语音定制功能的推出,是百度地图AI+地图玩法的深入,彻底的个性化后,不讲其他行业大道理,起码用户的选择困难症可能不会再犯了。
实际体验下来,理由有三:
1、彻底的个性化就是用户粘度的最好来源
用户之所以会选择困难,原因无非在于产品或功能的同质化,或者即便有差异化的地方,也不足以支撑用户足够忠诚于某款产品。
一个显而易见的事实是,不少用户手机里往往装了好几个地图APP,在过去,使用哪个产是没有偏好或者说偏好不强的,有时候用这个有时候用那个。
但是,语音定制可能改变这一状况。直观的使用感受就是,当语音包的声音变成自己的声音时,对APP的心态会发生变化,不再纠结选择谁,而是自然而然去打开那个“有只属于自己声音”的APP,这并不是猎奇或尝鲜,而是某种归属感所带动。
我们常常谈论的用户粘度,不就是需要这样的与用户心智上的连接么?
2、外部情感的依从,推动了对APP的使用习惯
此次百度地图推出语音定制,不仅仅有成年人录制声音的模式,还专门针对童声发音不清晰、不流畅等情况进行了优化,如果我们愿意,可以让孩子的声音为日常地图交互增添色彩。
发布会现场,百度地图事业部总经理李莹表示一上线就给其女儿录制了专属语音包,并设置为默认。可以说,此时的李莹既是百度地图的主要负责人,也可以代表一个有孩子的普通用户。
(百度地图事业部总经理李莹)
而响铃的同事黄女士,以普通用户的身份也第一时间录制了其4岁可爱女儿的声音,并设置为默认语音包,按她的话说,“(对这个新功能的)第一感觉是感动”。
(黄女士正在引导女儿跟读语音采集素材句子)
把现代人最重视的孩子纳入到产品体验当中来,许多APP产品未必想不到,但是,通过AI能力的巧妙应用,这种体验就顺势变成了我们用户的某种情感依从。
不只是孩子,还有现任女朋友、男朋友(如果你想的话,前任也不是不可以)、暗恋的人……地图APP里有那些你珍视的人的声音,你还会犯选择困难症吗?
某种程度上,借助AI技术优质,百度地图成功把用户的外部情感依从,转化到了产品内部的使用粘性。
3、技术,永远让产品更丰富、更有趣、更能突破旧有限制
实测随着此次语音定制一同上线的,还有一套带有某种社交属性和内容平台属性的分享系统,我们认为虽然官方的宣传着墨不多,但这套系统更值得玩味。
一方面,我们用户录制的个人语音包可以直接分享给亲朋好友,在熟人社交环境下可以相互分享“声音”——异地的恋人怕是要感动不已。
另一方面,百度地图上某些“人气”的语音包,还有可能获得官方推荐,成为地图产品里的“好声音”,而这已经超出地图产品的范畴,带有某种内容创作式的平台属性——虽然百度地图未必这么想,但从用户角度看,客观上就是如此。
一个声线优美的女生,或者声音温暖磁性的男生,某一天或都有了仅通过声音质量创作内容、表现自己的可能,或者,也来个语音包界的“网红”?
轻互动、轻社交、轻内容……相信更多人不会再纠结日常要使用哪个地图APP了。
更好的AI,理应让更多人分享
能够给到我们普通用户美好体验的技术,背后一定是经过了长久的磨砺。用户看到的永远只是技术冰山露出来的一角,底下是无数时间和实践的积累。
语音定制同样如此,它背后是百度独创的“说话人”韵律迁移技术Meitron,按百度语音首席架构师贾磊的说法,能够实现“发音人音色转换,多情感朗读和韵律风格迁移”,简而言之,即从各个方面完全学习发音人说话,做到合成后的语音与真人语音在各个方向贴近,让人分不出。
(百度语音首席架构师贾磊)
事实上,早前央视公益节目《等着我》与百度合作,利用有限的素材合成已经过世老排长声音发出的句子,让苦寻他多年的老战士现场感动落泪,就是Meitron所实现。
更进一步看,Meitron背后还有百度语音方面的一系列体系化AI能力,它作为语音合成的一个分支,本身也是百度语音的重要技术成果之一。
从百度AI,到百度语音,到Meitron,到语音定制,一环扣一环,最终个性化的语音合成定制门槛大大降低,普通用户更加直接地触摸到AI、感知到AI。
我们不必再把AI视为高高在上的存在,它就是我们身边的技术。百度地图的语音定制内部代号是“百雀灵”,这样来看是希望所有用户都定制出自己的语音包,个性化语音合成的定制门槛大大降低,每一个人,都可以做一只拥有专属声音的“雀”。
这样的语音定制可以、也应当应用到更多需要语音交互的产品上,让那些非地图场景下的用户也能有类似的美好体验,共同触摸AI。百度地图是第一个带来美好技术体验的产品,相信后面还会有更多百度系的产品用上这样的个性化语音定制。拭目以待吧。