讯飞输入法上线十年:技术派跑赢了马拉松
Alter聊IT站在人工智能时代的起点上,曾经革新了移动互联网交互方式的输入法,还将对世界产生什么样的影响?
撰文 / Alter
编辑 / 胖爷
对于我们这代人来说,输入法注定是被定格的记忆。
习惯了将老式诺基亚藏在课桌抽屉里盲发信息的畅快,即使到了全触屏的智能手机时代,照旧对九宫格念念不忘。以至于当习惯全键盘输入的00后们走上互联网舞台后,在江湖上掀起了一场输入法的流派之争。
作为移动互联网时代的史诗级产品,输入法见证了商业更迭的市场规律,承载了用户行为的变迁轨迹,自身也在技术浪潮的推动下完成了一次次的跃迁:搜狗将输入法从单机时代带进了互联网时代,讯飞又为输入法打开了人工智能的大门。
借着讯飞输入法上线10周年的契机,似乎有必要盘点下输入法在上一个10年的历程:站在人工智能时代的起点上,曾经革新了移动互联网交互方式的输入法,还将对世界产生什么样的影响?
01
“宣战”自带输入法
2010年是必须被载入智能手机史册的一年。
乔布斯老爷子在这一年推出了配得上“改变世界”称号的iPhone 4,沉寂许久的手机行业开始暗流涌动。无数创业者陆续开始了智能手机的征程,原本独立于硬件之外的野蛮人也纷纷加入战场。
时间证明了这群聪明人赌对了风口,2010年被视为智能手机普及的元年,塞班战线彻底被击垮,一大批踩准了时间节点的安卓厂商成了最终的赢家。
其实在智能手机的正面战场之外,还存在一条隐蔽的战线:智能手机的出现改变了原有的产品形态,传统的物理键盘彻底消失,虚拟输入法逐渐成为一种刚需,如何提升用户的输入效率,成了多方力量角逐的赛点。
在PC时代杀出一条血路的搜狗输入法,随即开始向手机市场倾斜,原本适用于PC的产品逻辑被复制到手机上;汲取了PC市场经验的手机厂商也开始行动,谷歌将自家的输入法作为系统的默认选项,主张封闭生态的苹果牢牢掌控着输入法的控制权,直到2014年才开放了第三方输入法的 API。
同样是2010年,科大讯飞的一群工程师们也加入了手机输入法的角逐赛,不过他们并没有沿袭功能机时代的输入理念,而是主打语音技术,在既有输入键盘上增加一个麦克风图标,用户点击后就能语音输入。
讯飞输入法的工程师们算了这样一笔账:普通人一分钟打字的速度在60个左右,但一分钟可以说180个以上,倘若可以用语音输入替代手动打字,输入效率将提升300%。何况彼时智能手机的屏幕尺寸还只有3.5寸上下,手指需要在狭小的屏幕上“做文章”,用户体验可想而知。
于是一群从用户体验视角出发的工程师们,向手机厂商和输入法市场的老玩家们发起了挑战,试图重塑输入法的产品形态。
时间同样验证了讯飞输入法的前瞻性,到了2012年的时候,搜狗输入法和百度输入法先后推出了语音输入,2013年讯飞输入法的激活用户量正式破亿……语音输入逐渐衍生成为新的流派。
按照赛诺发布的《2019中国手机输入法年终报告》显示,讯飞、百度、搜狗占据了96.1%的市场份额,第三方输入法将客场变成了主场。
02
为工具产品正名
第三方输入法的崛起似乎并不让人意外。
智能手机时代的降临,催生的不只有造机潮,还有工具产品的爆发:早期的原生操作系统体验并不完善,桌面类、美颜类等工具类产品悄然崛起,第三方输入法或多或少享受了特殊的红利周期。
正如猎豹经历了谷歌大面积下架的风波后,傅盛在接受媒体采访时说的这样一段话:“我知道工具会退潮,从2015年就知道。但我们从来没有想到,变化会是断崖式的。”工具类产品在2015年达到鼎盛,久邦、猎豹等企业先后上市。但在2016年就开始出现转折,随着原生操作系统的完善、人口红利的衰减,大多数工具类产品未能及时转型,在浑浑噩噩中走向了慢性死亡。
为何讯飞输入法等玩家可以逃脱工具类产品的宿命?或许可以从2016年锤子手机M1的发布会上找到答案。
老罗在发布会现场用很快的语速说了相当长的一段话,讯飞输入法无时差同步输出了文字版本,结果几乎没有任何偏差,发布会现场随即一片欢呼。发布会结束的第二天,讯飞输入法霸占了多家应用商店的下载榜单。
讯飞输入法的高光时刻至今仍时常被提及,外界忽略的是背后的技术深耕。
讯飞输入法刚刚上线的2010年,行业内还没有中文语音识别的概念。讯飞输入法团队首创了语音输入的功能,一开始的识别准确率还只有70%作用,团队使用大数据训练和深度学习技术后,语音识别的准确率在2013年达到了92%,然后在2014年快速跨越到业内领先的95%,在一定程度上超出了人耳。
其实讯飞输入法的语音识别准确率达到97%后,用户规模已经在不到两年时间内已经翻了一番,罗永浩的示范不过是点燃引线的小火星。
相比于那些与用户需求和行业生态脱节的工具类产品,讯飞输入法为工具类产品正名的策略并不复杂,即通过技术的持续创新将工具类产品服务化,向用户提供的不是工具,而是一种服务。
除了语音技术上的深耕,可以验证的还有细节上的功力。比如在讯飞输入法上,用户想要从键盘切换打破手写,无须点开特定的按钮,可以直接在屏幕上写字……工具的弱点是用户粘性低、可替代性强,但讯飞输入法用技术创新和产品服务巧妙地让短板变成了长板。
03
进击的“全能选手”
技术上的创新彻底改变了输入法的进化路径。
从商业逻辑上看,输入法避免了大多数工具类产品的覆辙,在工具产品退潮的时候,照旧坐拥了数亿用户规模;从产品策略上看,输入法给出了超出预期的体验,并且围绕用户需求进化成了“全能选手”。
工具类产品之所以被诟病,本质上还是产品价值的矮化,一旦在体验上输给了原生系统,用户需求也就无从谈及,用户的离开可以说是注定的结果。讯飞输入法的特殊之处在于,一开始就选中了语音输入的赛道,最终凭借在横向和纵向的技术与业务布局,一次次拓宽了输入法的想象空间。
红杉资本的传奇缔造者迈克尔·莫里茨曾言:“一个公司的基因早在它最初的18个月就被决定了,此后公司不可能再有什么大的改变,如果DNA是对的,他就是一块金子,如果不对,那基本就完了。”这样的观点一直存在不小的争议,却是解锁讯飞输入法产品进化方向的一把钥匙。
因为对语音输入的执着,讯飞输入法团队在2011年遇到了一个难题,中国有太多人说的是方言,如果无法准确进行方言的识别,语音输入终将沦为鸡肋。
一番用户调查和数据分析后,讯飞输入法选择需求排名最高的粤语、四川话和河南话入手,2012年的一次版本更新后上线了粤语语音输入,成为首款支持粤语语音输入的输入法,紧接着上线了四川话和河南话的语音输入。截止到目前,讯飞输入法的粤语语音识别准确率已经超过95%,陆续上线了23种方言的语音识别。
因为对用户输入习惯的洞察,讯飞输入法在2013年上线了英文语音输入;2015年讯飞输入法在语音输入的基础上首创了语音翻译功能 “随声译”,目前已经支持英日韩俄等多种外语的面对面翻译,输入法开始进化成为一种人际沟通工具。
除了语音识别技术上的纵向深挖,讯飞输入法还积极在输入场景上进行横向延伸,比如在传统的手写、键盘输入外,加入了OCR扫描、智能预测等功能。输入法角色的多元演变是显而易见的,早已不再是打字的工具,而是用户连接互联网世界的贴心助手,无限拔高了输入法产品的价值上限。
04
讯飞的语音战事
输入法的产品生命周期其实才刚刚开始。
讯飞输入法上线的2010年,深度学习技术还方兴未艾,人工智能还处于第二次浪潮后的静默期。然而过了十个年头后,等待语音技术的却是全新的局面:阿尔法狗燃起了人工智能的第三波浪潮,深度学习等前沿技术加速了落地应用的进程,语音也从小众一跃成为主流的人机交互方式之一。
至少透过讯飞输入法等行业领跑者的动作,外界看到的并非是时间赋予的老迈,而是一无既往的探索和创新精神。
就在讯飞输入法10周年的发布会上,知名相声演员方清平上演了一场极限语速挑战赛,用远超罗永浩当年的语速读了一段《木兰辞》,以测试讯飞输入法在极限快语速下的识别效果。结果让人惊喜,方清平的语速快过了吉尼斯世界纪录,讯飞输入法照旧给出了100%的识别准确率。
与四年前的有所不同的是,同样是技术上的秀肌肉,对于“快”的诠释有了新的注解。如果说讯飞输入法当年的一夜爆红,某种程度上与大众对语音输入带来的新鲜感有关,这一次除了速度,还有温度。
比如讯飞输入法新近推出的10.0版本,通过唇形辅助输入,进一步优化输入效率,在近距离多人说话的复杂场景中,其他人的声音不会干扰语音识别结果;再比如针对盲人群体输入不便的情况,不断无障碍模式,实现了输入面板、菜单面板以及表情面板的屏幕随选朗读,用户在视力不便的情况下也能无障碍输入文字和表情。
至于其中的原因,似乎并不难理解。第三方输入法上一个10年的主场是智能手机,语音输入并非是不可替代的方案,语音输入的早期用户多半以极客为主。可随着5G与AIoT浪潮的来临,智能家居、车载、可穿戴设备等新的场景和需求不断增加,传统的输入方式越来越不友好,语音将是最核心最主流的输入方式。
备战了10年的讯飞输入法,正在进入一个全新的战场,并在积极调整姿态,除了外界所熟悉的技术牌,讯飞输入法打出的还有同样聚焦用户体验的温情牌。毕竟当语音作为人机交互的渠道时,不应该是冰冷的一面,这场语音战事的结果已经可以预见。
05
尾记
10岁的讯飞输入法,就像是互联网世界里的时间行者。
原以为会是失去生机的前浪,却是人工智能语境里名符其实的后浪。如果非要给讯飞输入法的成长轨迹做有个注释的话,本质上在于技术派的工程师们对于语音输入的执着,用持续创新等来了属于语音技术的春天。
如今语音技术正当其时,讯飞输入法的日语音交互次数已经达到10亿次,累计服务设备数超5亿,语音用户占比超70%。在人工智能时代的呼唤下,这位创新老炮儿正在以矫健的脚步迈向下一个10年。
END
主理人 | Alter
前媒体人、公关,现专职科技自媒体