AI语音交互的2018:这个市场最“火爆”!


    作为语音交互的一大重要细分应用场景,儿童终端市场在经过过去两年持续的试水和探索之后,2018年迎来新一波的增长高潮。从智能故事机、早教娱乐机再到儿童智能音箱,几乎每一类都成为了当前市面上的爆品,成为2018年国内语音交互应用领域的一道“靓丽风景”。
    应用转型与场景需求“双向”驱动 儿童智能语音市场“爆火”
    受惠于智能语音技术的成熟及应用场景的快速扩张,今年以来,在各大头部厂商的牵动下,儿童智能语音终端市场迎来新一轮喷发,成为语音交互众多应用场景中的一道亮景。其中,增长最快的要数智能早教机、故事机和儿童智能音箱三类产品,业内预估今年国内早教机器人市场规模将突破50亿,而儿童智能音箱在百度阿里等巨头的推动下,目前也已占据整个智能音箱市场的20%左右,达到百万量级出货,足见市场之火爆。
    今年,做儿童机器人的公司就多达好几百家,仅大大小小的智能故事机厂家也有一两千家左右,数量比去年几乎翻了一番,深圳市炭火智能科技有限公司市场经理许波表示:“其中,很大一部分厂商基本都是从别的行业过来的,例如有些厂商过去就是做车载后视镜这类终端或者一些非智能类硬件产品,都想借此市场良机赚钱。今年上半年受益于市场持续火爆,公司智能早教机产品目前的累计销量已达到25万台,相比去年有较为可观的增长,下半年我们保守估计销量能够突破30多万。如今,市面上只要是带智能语音交互功能,且定价在千元以内外观还可以的儿童机器人产品基本上都能达到月销量几万台的水平。”
    智能故事机市场,思必驰商务总监韩嘉璇也预计:“2018年整个故事机市场出货量可能达到3000万到4000万台,其中会有一多半属于智能故事机产品,市场巨大。当前的儿童智能终端领域,思必驰方案的整体市场占有率约为20%-30%,依托于前端算法的优势,在Android系统的高端市场也拥有超过50%的市场占有率,相关合作品牌包括步步高、火火兔、遥蓝、小萝卜等儿童终端的出货量均十分可观。”
    为何语音交互能迅速在儿童市场爆火?编者认为,其一主要是越来越多的智能音箱巨头相继发力儿童市场的原因,智能音箱向儿童市场的转移,实现了很好的智能对非智能应用的“降维打击”效果。事实上,早在今年4月份,亚马逊就特意推出了一款Echo Dot儿童版,尽管硬件上与之前的Dot并无差别,但是在软件层面,比如语音识别、儿童读物等都是针对儿童进行量身打造的;紧随其后的5月,阿里、百度、出门问问、喜马拉雅等厂商也都纷纷针对儿童推出了专门的智能音箱,深耕儿童应用市场。儿童智能音箱的爆火,进一步带动智能语音技术向更多应用场景扩散,早教机及故事机这类场景自然就成为了首发战场。
    另一方面,越来越多“头部”厂商集中发力AI智能语音交互类硬件产品也是关键原因。许波认为:“'头部'厂商的带动,很大程度上使得现有非智能交互类产品尤其是传统故事机市场快速萎缩,尽管这种产品在价格方面相比智能交互类硬件更便宜一些,但随着智能交互类产品的大举入侵,二者之间的价格优势也正逐步淡化。更为重要的是,在智能化产品的打击下,这类非智能的产品越来越没有卖点,导致消费者不买账。比如我们最近接触的一家故事机销售商,去年他们非智能产品的业务表现还相对比较强劲,但今年这块产品的出货量就不怎么理想,现在库存也比较多,很多产品也只能降价甩卖。”
    从应用场景需求本身的角度来看,鉴于中国儿童教育市场体量本身就十分巨大,加之智能语音交互与儿童终端产品近年来正快速融合,顺理成章地推动了该场景对语音交互逐渐形成刚需。声智科技联合创始人常乐也表示:“随着语音交互在技术端的逐步深化,如今的语音交互已不再是按键和触控交互方式的辅助或补充,而是以更加独立或者占有主导权的交互模态呈现出来,进而降低了老人和儿童使用电子产品的难度。对于3岁以上的儿童来说,他们迫切需要用语言来表达观点和获取知识,而语音交互正好切中了这一诉求。声智科技在2016年成立之时,就帮助奇虎360打造了多款儿童机器人和故事机系列产品,而随着儿童智能音箱市场的爆发以及语音交互刚性需求的带动,儿童故事机、陪伴以及早教等智能语音交互终端产品的市场体量会非常巨大。”
    儿童应用场景挑战多 算法优化与内容适配是关键
    诚如上述,在儿童教育类终端市场持续高涨的态势下,智能语音交互的市场潜力可谓是不可限量。但就目前的应用现状来看,与成人类语音交互场景不同,儿童场景存在着更多语音及语意方面的“不确定性”和“复杂性”,这也给语音交互厂商带来了更多技术层面上的挑战,首当其冲的就是语音交互系统、内容及相关算法的适配。
    深圳市微纳感知计算技术有限公司市场总监程刚在接受本刊采访时就坦言:“现阶段经过训练,市面上其实已经有很多产品可以做到对方言的识别,成人应用场景之前的很多难点都在逐渐被克服。但儿童交互产品的区别在于,产品要做到童音识别,除了需要解决孩子具备的更高音阶以及不同的言语模式问题外,更为重要的是,孩子并不擅长按照机器能理解的方式与其交互,成年人建立的语音库并不能很好的理解儿童的语言,即使包括Amazon Echo与Google Home在内的业内顶尖设备也都出现了在与儿童交互的场景下识别错误的现象。”
    常乐对此也表示赞同,她认为:“对于小朋友来说,好奇心重,且思维逻辑不如成年人那般严谨,因此小朋友在对智能语音终端提出问题时常常是出其不意、前言不搭后语且犹豫反复的。针对儿童的这种语音交互特性,常常需要做更多技术层面上的优化,比如我们就推出了Free-cut(随时打断,任意唤醒),Free-ask(支持识别犹豫及停顿)以及One-shot(一句连控,唤醒识别连续说)等技术,来提升儿童语音交互体验。”
    对于儿童不同于成年人的语音音阶和言语模式等问题,常乐认为需要针对这些发音特点进行专业的模型训练:“例如我们在帮助百度'小度智能音箱'打造'儿童模式'时,就构建了一个集合百万级数据的儿童语音库,针对儿童的发声特点进行了专项优化,基于6000+个儿童数据模型和超过30000小时的童声语音测试,打造出了儿童专用语音唤醒模型以及语音识别交互引擎,使得音箱在与儿童进行对话时,能够提供更高的识别和唤醒的准确率、更快的反应速度以及更流畅且自然的语音交互。目前该方案已经能够实现定制化,并经过360儿童故事机、儿童陪伴机器人以及儿童智能音箱等众多终端产品的百万级规模量产验证,成本可控。”
    除此之外,与成年人相比,小朋友虽然对智能语音交互产品的用户体验包容度要更高,但他们更为关注产品端所能提供的内容。常乐也认为,不同于成年人一样具备清晰的逻辑思辨能力,小朋友往往会带着求知和娱乐的心态使用智能语音交互产品,他们更关心的是智能语音产品的背后提供的内容,比如提问的百科问答是否能得到答案,或者想要听的儿歌和故事是否可以播放等。因此,对于语音技术厂商来说,如何在提供足够优质的儿童教育服务内容的同时,又能在语音交互系统及算法层面上针对儿童这类特殊应用场景做更多的优化,提供更为灵活且符合儿童心理预期的定制化语音交互解决方案,将是市场决胜的关键。
    总之,编者认为,在儿童教育市场高速成长的驱动下,儿童智能语音终端市场的"雪球"无疑会越滚越大,这也为业内厂商推动语音交互走向大规模普及创造了绝佳的机遇。当然,机遇与挑战总是并存的,儿童语音交互市场需要比成人场景更为复杂且更具定制化特性的语音交互系统及算法设计,同时在内容端也拥有更多的要求,这就需要厂商在软件系统开发、算法设计以及内容提供方面耗费更多的精力、成本以及资源。不过,随着未来市场体量的不断增大,这些成本问题也会逐步消散。