讯飞输入法将“法宝”压在AI助手上

Alter聊IT

    
    作为最早的“装机必备”产品,讯飞输入法已经上线11周年。
    在移动互联网汹涌澎湃的十余年时间里,第三方输入法可以说是见证历史的史诗级产品:经历了智能手机普及初期的高速增长,经历了消费人群迭代的习惯变迁,经历了用户增长趋缓的多元探索,并且正在经历人工智能浪潮对输入法的新一轮重塑。
    有别于互联网的其他赛道,第三方输入法的市场格局可谓相当稳固,讯飞、搜狗、百度三足鼎立的局面已经持续了近十年的时间,期间也曾出现一些昙花一现的产品,但讯飞输入法在内的头部玩家,一次次用产品力验证了强大的用户忠诚度。
    对于个中隐藏的秘密,或许可以从进化到11.0版本的讯飞输入法身上找到答案:人工智能叙事逻辑下的输入法将朝什么样的方向进化,以及在应用场景、目标人群越来越细分的局面下,第三方输入法将解决哪些新诉求?这些亟待回答的新问题将直接左右第三方输入法的走向和格局。
    01 效率,输入法的主线任务
    不同于单机时代到互联网时代的跃迁,人工智能大幕的拉开为第三方输入法提供了多种选择路径:比如不断丰富产品的可玩性,进一步占领用户时长摆脱工具型产品的定位;再比如加速进行横向延伸,抓住人机交互的入口优势不断进入新的赛道,继而在商业化方面有更多主动性……
    讯飞输入法的回答却是效率。
    在讯飞输入法11.0的新功能中,最为耀眼的正是新一代语音识别框架TFMA,解决了复杂场景下的语音识别问题。语音输入作为最典型的AI技术落地应用,最大的挑战非复杂场景莫属,因为用户的输入场景不可能是装有隔音墙的录音室,无处不在的噪声、混响直接影响着语音识别的准确率,进而左右用户的输入体验。
    为了解决语音识别在复杂环境下的普适性,科大讯飞的灵感源于著名的“鸡尾酒会”效应,即人耳在嘈杂的环境下可以巧妙地“离开”一段对话,去听一听旁边的人在说什么,属于典型的自上(大脑)而下(听觉系统)的机制。而传统的语音识别系统,往往是由麦克风阵列对音频做降噪处理,得到单路音频信号进行识别,遵循的是自下而上的机制。
    科大讯飞由此提出了TFMA前后端一体化的方案,将语音识别的前后端联合优化,直接训练多通道信号的识别模型,然后将后端模型的隐层信息反馈到前端,指导前端基于神经网络的波束形成器更新,形成一套自下而上和自上而下结合的流程,同时引入大量的专家知识,融合神经网络和信号处理的优势,保证了系统的鲁棒性。
    对用户而言,使用语音输入最直观的感受是即便碰到“恶劣”场景,手机的语音识别已经达到“非常好用”的程度,识别结果也似乎越来越懂用户表达。
    除了语音识别准确率的提升,讯飞输入法还更新了两个新功能:一是语音识别和翻译的语种,从过去的4种语言扩充到12种,包括中文、英语、俄语、法语、越语、韩语、日语、泰语、德语等等;二是候选项的合理化,用户语音输入结果更符合预期结果,即便是中英混合输入也有近乎完美的呈现,进一步提升了用户输入和表达的效率。
    可以给出的解释是,2010年上线的讯飞输入法,主打的正是语音技术,在输入键盘上增加一个麦克风图标,用户点击后就能语音输入,短短两年时间就拥有了上亿激活用户,不仅尝到了技术创新的甜头,在巨头把持的市场中牢牢占据了一席之地,还深度重塑了输入法的产品形态。
    毕竟效率升维一直是输入法的主线任务,从五笔到拼音再到语音输入,无不沿循了效率为王的铁律,同时也意味着,即便到了人工智能时代,输入效率上的技术创新依旧是输入法竞争的命门。
    02 细分,瞄准场景化的需求
    和技术创新同步进行的,是用户习惯的不断改变。2010年的时候,智能手机的权重远不如PC,可到了2021年,购物、游戏、娱乐等高频场景都集中在手机上,用户时长动辄在五六个小时以上,输入法也有了新的挑战:要解决的不仅仅是输入的速度,也要满足不同场景下的效率。
    讯飞输入法将“法宝”压在AI助手上。
    如果说语音识别开启了人工智能和输入法协同的先河,语义理解、深度学习、知识图谱等技术带来的改变则是进阶性的。输入法和用户的连接不再局限于小小的输入框,而是深入到用户的使用场景中,通过深度学习理解用户的输入习惯,通过语义理解和知识图谱打造“懂你”的知识体系。
    讯飞输入法在11.0版本中进一步明确了和用户的触点,针对用户在不同场景下的个性化需求,瞄准用户在细分场景下的输入效率,让输入法的价值不再停留在工具层面,化身用户个性化表达的“AI助手”。
    比如用户在与人沟通时经常会出现不知道说什么的情况,讯飞输入法推出了AI聊天助手功能,可以为用户智能推荐新语料、错别字校对、语言互译等功能,打破聊天对话时的尴尬场景。就像情侣间输入“想你”两个字时,可以智能替换为“想你,只缘感君一回顾,使我思君朝与暮”,有利于用户的感情升温;
    比如很多用户困顿于朋友圈等社交分享时的“词穷”,讯飞输入法的AI发帖助手提供了美文、模板、AI帮写等服务,可以根据不同的场景匹配不同的文案,甚至输入“美食探店”等标签后能够自动生成对应的文案,既帮助用户营造出了独特的社交氛围感,也在无形中降低了用户的社交分享的压力和时间成本;
    再比如几乎所有人都会碰到的购物评价问题,面对商家们近乎“喋喋不休”的好评恳请,又不想浪费时间和精力想文案,讯飞输入法试图用AI好评助手来解决这些痛点。用户只需要一两个按键的操作,就能自动生成涵盖包装、质量、物流、满意度等信息的通用好评内容,输入效率和用户体验被进一步解放。
    或许这些功能看起来有些琐碎,却清晰地折射了第三方输入法的演进逻辑:无论是输入效率的迭代创新,还是细节上的打磨优化,讯飞输入法都在沿着产品服务化的路径深耕,留给用户的感知绝不是输入工具,而是细致入微的服务,继而在用户体验上远远甩开原生系统,让第三方输入法的价值最大化。
    也就回答了文初留下的问题,第三方输入法在人工智能时代的方向是个性化的输入服务,在数据安全和用户隐私保护的前提下,输入法正在深入理解用户的表达习惯,不断消除用户的表达痛点。输入到表达的描述背后,绝不只是字面上的改变,承载的是第三方输入法的价值进阶。
    03 多元,拔高产品的价值上限
    判定一款产品的价值标杆,技术的领先性占了很大的比重,然而比技术创新更能左右产品命运的,常常是隐藏在细节中的温情。所有经得住时间验证,在互联网历史长河中留下印记的产品,无不有着感性的一面。正是那一抹抹感性,让很多伟大的产品走出了过度功利主义的迷途。
    讯飞输入法自然也不例外。
    可能在不少用户眼中,语音识别框架TFMA、AI助手等硬核创新,足可以概括讯飞输入11.0版本的焦点,但讯飞输入法的回答是——既要硬核用户的个性化场景需要,也要满足不同人群的输入需求。
    直接的例子就是产品的适老化改造。根据中国发展研究基金会在《中国发展报告 2020:中国人口老龄化的发展趋势和政策》中公布的数据:到2025年前后,中国65岁及以上的老年人口将超过 2 亿人。可在很长一段时间里,老年群体在数字化社会中的生存难题,几乎是被忽略的一环。
    输入法作为连接现实世界和互联网世界的“桥梁”,对中老年人群一度相当不友好。很多中老年人不识字、看不清字、不会说普通话,使用输入法时经常遭遇各种难题。在互联网产品适老化改造的大环境下,讯飞输入法在第一时间推出了长辈模式,用户开启长辈模式后,为了方便中老年用户,输入法界面的图标、字体都变大,配色的对比度调高,并在技术维度增强了手写和方言识别的准确率。
    同样的一幕还体现在讯飞输入法的无障碍模式。作为国内最早适配无障碍功能的APP之一,讯飞输入法在无障碍模式中下了很大功夫,用户可以通过语音开启无障碍模式,输入面板、菜单面板以及表情面板都可以随选朗读,哪怕是视障群体也能利用输入法发送语音、文字和表情,打通了视障人群通向互联网世界的“盲道”。
    进一步来说,基于中老年人群和视障群体的产品打磨,为讯飞输入法打开了人群细分的窗口,一连串差异化的功能应运而生:针对Z世代年轻人的需要,讯飞输入法推出了AI颜键盘,用户可以DIY键盘的背景、字体、音乐、动画甚至振感;针对游戏人群的游戏键盘,融合了热门的游戏IP元素,给予用户充分自我表达的机会;乃至针对小众人群的图像输入功能,拍个照片就能录入数据公式、自动批改计算题……
    在互联网进入存量时代后,许多行业都面临增长问题,以至于“流量焦虑”长时间里都是舆论场上的热门议题。讯飞输入法在11.0版本中的思考,无疑为整个行业提供了新的出路:通过满足细分人群的需求,构建产品在细分市场的竞争壁垒,同样可以拔高产品的价值上限,避免流量红利消失的烦恼。
    另一个维度而言,进入到诞生后的第十二个年头,讯飞输入法并没有陷入瓶颈期,而是将多元化作为新阶段的“增长密码”。
    04 写在最后
    以往谈及讯飞输入法的时候,或许还保留有格子衫理工男的刻板印象。
    但讯飞输入法在11.0版本中的表现,正在进一步刷新外界的认知:除了在技术和数据安全上的连续创新,讯飞输入法对用户需求的深刻理解,对用户体验的精雕细琢,对细分人群的贴心服务,也在被外界所看到。
    这是一个技术价值再度闪耀的时代,但“耀点”并非只体现在新产品和新技术上。讯飞输入法将十余年的用户洞察和技术创新,凝结为触达亿万用户的产品和服务,何尝不是对技术价值的最佳注解。
    至少到今天,讯飞输入法依然还是换新的“装机必备”,这也许就是大众对这款产品给出的最好评价。