智能语音场景落地遭遇“瓶颈期”

亿欧网

    当下,随着中国企业复工、各地高校开学井然有序的进行,一些智能语音产品逐渐出现在人们的视野。
    其中,思必驰在疫情期间推出的疫情防控机器人,累积播出电话700万通,其中有350万通是互动型机器人,另外一半是外呼式机器人。该机器人已在全国28个省份的防控一线迅速落地,覆盖苏州、淄博、孝感、黄冈等121个地级市的近800个基层社区。
    在疫情期间,武汉方舱医院的医生提出,在身穿厚重工作服的情况下去记录病例非常困难且不便。同时在医院的环境条件下,通常是多位医护人员共用一套医疗设备,多频次触摸公众场合的设备,也会增加交叉感染的概率。
    因此,云知声将语音识别和知识图谱技术二者结合,应用在医疗领域。可以帮助医生快速、高效地录入病例,并且通过知识图谱来帮助医生检查病例的完整性,并快速发现和定位一些错误。此前,该产品只是提高医生的工作效率,现在,产品已经达到了辅助诊断的作用。
    这次疫情给人们生活带来的最大的改变之一,就是公共场合的交互方式。云知声CEO黄伟告诉亿欧:“此前我们习惯了触摸的方式,但是在疫情期间,公众场合的触摸会增加交叉感染的风险。而零接触的交互方式,会逐步让大家所接受。”
    AI新基建催生行业新模式
    智能语音是一种长链条的系统模式,它讲求的是整体智能,而不是单一的模块智能。黄伟提到,语音交互以前的存在方式可能是“nice to have”,但是在当前的某些场合,它是“must to have”,智能语音系统的价值越来越凸显。
    例如,北京海淀区政府大楼应用的智能电梯方案,正在搭载云知声自研的蜂鸟AI芯片。该芯片是一款专为离线/在线语音交互场景设计的高性能、高集成度、低成本的语音智能芯片,可广泛应用于各类智能家电产品。这也是云知声一直提倡的“云、端、芯”一体化的使用落地,根据不同场景灵活提供智能方案的组合。
    
    此外,不论是深度学习或是机器学习,这种人机交互的手段和方式,其本身是一种辅助技术,更需要与终端产品的应用相结合。所以新基建的提出,很符合当今科技发展的速度,不论是5G、人工智能、大数据、云计算......都是底层的通用能力。
    基于新基建的这些能力,企业才能做出更多有创造性和生命力的产品。虽然AI要对所有产业进行渗透,但AI也在带动所有产业打破行业隔阂。在未来可能会出现行业重塑、融合,甚至催生出新的行业。
    思必驰CEO高始兴举例说道,当一个对话式智能音箱可以在社区进行医疗问诊服务的时候,这个智能音箱的行业属性就需要重新定义。同样,通过语音控制某些车载系统,进而去调节智能家居的使用与否,也打破了车载和家居行业的天然屏障和壁垒。
    所以,新基建可能是未来所有行业重新塑造和发展的根本。同时,黄伟认为,新基建是一个新的时代命题,这对疫情之后,中国经济发展信心的提升,以及未来科技实力竞争力的提升都有重要意义。
    寻医先问诊
    通过这次疫情的爆发,智能语音系统市场看似火爆,铺展面很广,但从场景落地情况来看,也正处于一段“瓶颈期”。
    越来越多的人已经开始使用智能语音产品,但是大部分人低估了智能语音技术对人们生活的价值和意义,只是认为有的话挺好,没有的话也可以。黄伟指出,此前资本市场过度追捧图像识别技术的优越性,而图像识别本质上只是实现了人的ID化,依旧停留在感知阶段,还不到认知水平。
    所以我们需要正视AI技术的真正价值,并去客观分析和评判。
    首先我们要理解,这段“瓶颈期”是什么?这段“瓶颈期”并不是指技术的瓶颈期,只是在突破行业界限后存在的沟通难点,也是开发者和技术提供者与用户的“磨合期”。
    高始兴指出:“技术的瓶颈期一直都有。”首先,学术角度来看,从技术研发上的突破,再到商业的落地,本身就有很长的周期。其次,中国AI的快速发展期是从2015年开始。从2015到2017年,大家一直在追求技术的突破,在2018年之后,大家关注更多的,是场景落地。
    而在场景落地期间,最大的“瓶颈”也不在于技术,而是技术与应用实践的桥梁。因为无法估算AI本身的市场价值,AI需要跟所有的产业进行结合,然而不同的行业之间有信息窗口期。
    人工智能不是高高在上的技术,用户的需求也不是被创造出来,它是天然存在,只是人工智能可以在某一阶段、某一点上提高了效率、减轻了人员负担。
    例如语音电梯场景的落地,思必驰此前利用语音模组可以在电梯里实现语音交互,但是对电梯行业而言,第一,它是工业,工业有自己的设施标准和认证情况;第二,用户和厂商并不认为在电梯里有利用语音控制的必要。这是由于双方没有打通智能语音的沟通桥梁,而这次疫情使大家基于当前需求,快速理解了人工智能。
    同样,深耕在企业服务和公共孵化领域的灵伴科技,也发现了智能语音价值展现的“瓶颈期”。
    灵伴科技COO胡军告诉亿欧:“在疫情发生之前,B端市场和政府部门对智能语音服务需求一直在增加。由于疫情影响,阻碍了人员的聚集和面对面的沟通,更导致了智能语音/文本交互方案的需求增多。”
    从需求端来看,客户对智能语音有了一定的重视,但是人工智能在该场景下的价值并没有获得市场的广泛认知,尤其是信息化程度偏低的企业客户。这就意味着市场从认识智能语音的价值到落地应用,还有较长的路。其次,对于初创企业,存在较高的客户沟通成本和市场教育成本,而从技术层面上看,难点挑战并不大。
    多融合与探索并进
    所有伟大的改变都是从交互习惯改变开始。例如第一代计算机只能通过键盘进行人机互动;到九十年代初,开始使用windows 图形界面,用鼠标来点击;自从苹果手机使用了触摸屏,“触控”成了智能手机的核心互动方式。直到今天,我们发现,触摸并不是必须的,通过语音控制也可以。因此,智能语音交互场景的新机会值得科技企业们继续思考。
    黄伟告诉亿欧:“对于语音行业,接下来在国民经济的应用领域里面,会得到越来越广的应用。”例如在医疗领域,云知声已经达到了认知的阶段。除了利用语音识别系统可以让医疗设备快速完成病例的录入,利用医学的知识图谱,可以让机器更为专业地帮助医生主动识别并发现病例的问题,对录入结果作出准确的分析和判断。
    当前智能语音行业正处于协同发展的阶段,对于智能语音场景的落地预期并没有一个标准线,它需要逐步渗透。从AI的发展速度上看,车载、家居的智能场景落地也是最近四、五年的时间发展起来,2015年以后,不论是市场的火热度,或者是互联网巨头、大部分产品应用公司,都入了局。
    在疫情阶段,国内所有的行业都有受影响,尤其是传统行业和实体业。海底捞停业15天损失了大致11亿,年入50亿的西贝莜面村也称“撑不过3个月”。还有传统眼镜行业,在疫情期间2万多家门店停业,4000多家工厂关门,单个品牌春节期间损失可能在5000万左右。
    相对于传统行业和线下实体业的“哀鸿遍野”,AI技术服务类公司,受到的直接影响辐射面积并不大。
    高始兴告诉亿欧,从思必驰自身来说,受到此次疫情影响的传统行业和实体业正是思必驰的客户群体,从短期来看,在项目合作上会受到一定影响,但是从长远来看,整个AI的渗透和落地,以及场景化的应用是有促进作用。
    例如,思必驰DUI开放平台,目前已经成为底层技术研发平台,思必驰的智能语音识别系统就是基于该平台来实现,在业务领域上,已经覆盖到家居、AIoT、智能电子和穿戴设备、车载等方面。
    思必驰近些年主要在AIoT领域进行拓展和布局,从2018年开始,也逐渐发力在线上企业服务领域。此前,思必驰的个人开发者和厂商加入语音交互功能,主要落地在私人空间的个人应用产品中。而对于公共基层设施的相关场景落地需求,是思必驰正在探索的方向。
    为何中国能够高效控制住疫情的发展,一部分原因是政府的有力管控,另一部分原因是在城市管理的智能化方面,中国要比欧洲强很多。黄伟提到:“在新基建中,一定包含了对整个城市智能化的提升,所以智慧教育、智慧交通、智慧医疗、智慧社区等方面,都会是下一个机会。”
    而对于未来的发展,肯定不能依靠过去“大水漫灌式”的旧基建,那样会导致非常严重的产能过剩,所以我们一定要通过新基建的方式,来提升经济,和中国在科技领域的某些短板。同样,新基建更多是在发挥着底层通用能力的工具作用,在未来的行业发展上,务必向多融合的方向去走。