云知声副总裁康恒：全面推动儿童机器人市场的高速发展

2024.03.28

    随着大数据、云计算、人工智能等技术的成熟应用，儿童智能产业成为当前智能化大潮中的火热行业，各方资本纷纷进入其中，产业进入快车道。据相关数据显示，我国儿童消费产业的市场规模大2万亿元，而由儿童智能手表、儿童智能机器人等为代表的儿童智能产品产业规模则达到千亿级别，产业未来发展空间被业界人士所看好。
    在该背景下，由中国智能终端产业大会组委会与深圳市儿童智能产品协会主办，深圳市儿童智能产品协会承办的“2019中国儿童智能产业年会”在深圳成功举办，在会上不仅评选出“中国儿童智能行业十大品牌”，同时还有“中国儿童智能行业十大潜力品牌”的评选。在会期间上，OFweek维科网编辑有幸采访北京云知声信息技术有限公司副总裁康恒博士，而康恒背后还有一个身份——深圳儿童智能产品协会副会长。对于本次大会，康恒副会长对OFweek维科网编辑说：“本次中国儿童智能产业年会将全面的总结2018年市场问题，吸取教训，从而让大家在2019年走得更好更安稳。”同时，康恒从云知声的角度也说道：“我们作为一个技术供应商，我们会把对市场的想法和判断分享给合作伙伴，从而让合作伙伴能够及时有效，并合理的规划自己产品。”

    云知声副总裁康恒
    初级阶段的儿童机器人市场
    任何一个产业刚兴起的时候，都不会是一个健全的产业，而儿童机器人也是如此！纵观儿童机器人市场，其能快速发展得利于AI的发展及应用。但对于AI来说，其虽然已经被行业内人士所认可，但就目前而言，AI还处于发展阶段，其并不能大规模应用于各行各业，只能在特定的行业或场景下，帮助用户更加方便和快捷的提升工作效率。
    儿童机器人市场也同样如此，其成立不过数年，就全球市场而言，并未有相关的规范性文件或经验可借签。正如康恒所说：“为什么市场不完善或不成熟，就是因为我们的产品还没有细分到针对用户年龄段、为不同阶段的儿童提供不同的产品。不同年龄阶段的需求并不相同，用统一的产品去应对所有儿童，这并不现实。”
    从法律上来说，低于18周岁的人均为儿童。但对于儿童机器人企业来说，这一范围较广，从他们的角度来看，儿童分为5个阶段：0－1岁、1－3岁、3－6岁、6－12岁和12－18岁，不同阶段的儿童，其产品和功能形态均不相同。
    0－1周岁：由于该阶段儿童个人意识尚未成立，并不能有效地使用儿童机器人，大部分儿童机器人以播放童谣、观看图片为主；
    1－3周岁：该阶段儿童属于探索时期，一般具备一定的语言能力，其儿童机器人可以播放故事、音乐或查看图片，甚至可以播放较为简单的诗词进行学前教育；
    3－6周岁：该阶段儿童处于快速成长阶段，其不仅仅是听故事、看图片，同时还得加上百科问答等知识性内容，必要时可以为儿童提供部分兴趣爱好的培养及初级训练；
    6－12周岁：该阶段儿童需求则更为复杂，其得开始涉及语文、数学、英语、自然等多种教育问题；
    12－18周岁：该阶段儿童需求则更为高级，现有儿童教育机器人或许将无法满足他们的需求，需重新定义或更为专业化机器人。
    康恒对OFweek维科网编辑说道：“什么样的产品才是儿童机器人？它应该提供什么样的服务？它应该具备什么样的交互？这些都没有共识，不仅仅是企业不了解，很多用户也不清楚自己的需求到底在哪。”
    （1）企业：摸石头过河
    从企业角度来说，市场并不允许企业考虑完善才进入儿童机器人市场，特别在这一刚形成的市场上，更不容企业迟疑。为了更好的抢占先机，大量企业在条件并不成熟的环境下直接进入该市场，并没有针对儿童进行相关的研究及探讨。而这也导致企业在经过数年的发展后，再无任何经验可借鉴，现在儿童机器人企业做的更多的是研发出大量外形不同，功能相似的儿童机器人。
    （2）用户：我需要什么？
    对于用户来说也是如此。在数年前并没有儿童机器人这一产业，用户不清楚自己的需求到底是什么，没有办法去分辨哪些功能是儿童所需要的。
    在面对企业摆出各种形态的儿童机器人，用户无法有效的分辨该机器人适合多大的儿童，能为儿童做什么，但用户自己的需求都无法清晰的反馈给企业，只会导致企业提供更多定位模糊的产品。
    虽然儿童机器人还处于初级市场，但随着市场的发展，儿童机器人产品形态、用户认知依然会持续向前发展。回头再看儿童机器人市场，如果说数年前儿童机器人只有一个麦克风，并进行简单的对话，那么如今儿童机器人不仅有多模态的交互功能，同时增加了各类传感器，从而让机器人能够进行一些简单的运动功能。而用户则可以进行部分编程，从而让机器人做相对复杂的运动，例如跳舞、踢球、弹吉他等。
    语音识别：打造更为精准的语音交互体验
    而在儿童机器人上面，语音交互成为最为关键的一环：如果机器人无法“听懂”用户说的话，那么又将如何开启下一步的动作？但就目前而言，大部分企业并不关心这一问题，这也是市场对产品认知还未统一的原因之一。
    在儿童机器人的使用体验上来说，儿童机器人经常会出现无法识别用户的语言，从而导致无法识别、无法回答、回答错误等各种问题，而这些问题有一定的概率导致儿童认知出错。康恒作为云知声副总裁，其被邀请加入儿童机器人协会，并担任副会长的原因之一就是，云知声在人工智能领域的技术实力及研发能力。
    康恒对OFweek维科网编辑说道：“云知声可以很负责任的对所有用户说，云知声在语音识别方面可以达到95％的准确率，而这是全国一线品牌的标准线。其次就是设备的回答内容，云知声早已针对儿童这一领域进行研发，已经做到非常高的准确率。”
    然而，中文表达并不是依靠单一的文字，同时涉及诉说者的语气、性格等多种因素，在人们的日常对话中，不同语气、环境中的对话语义并不相同，而儿童机器人是否能准确识别这些对话？对此，康恒指出：“就目前而言这个答案相对悲观，主要是技术的进展尚未达到这一阶段。”
    现有语音交互方式主要是在单一环境下的对讲，无法有效识别因为情绪导致的各种对话方式和环境，虽然目前有很多科研机构或企业在不断研发，但精度问题一直无法得到有效提升。但现有技术已经能达到识别声纹的级别，通过不同人的声音特征，从而识别说话人的身份，此外，在康恒年会演讲中演示的云知声多模态技术，也就是除语音交互之外的机器视觉、情感识别等多模态技术能力将成为下一个阶段儿童智能产品突围的关键。2018年11月云知声的图像AI能力已达到国际一流水准，并已进入多模态芯片的研发过程中。通过融合机器视觉与语音识别，为用户提供更多层次的交互模式，使人工智能产品更符合用户的期待，最终为用户提供更好的体验效果。