语音能力引擎日均调用100亿次,百度大脑“唤醒”了什么?
Alter聊IT刚刚结束的百度大脑语音能力引擎论坛,向外界披露了这样一个数字:百度大脑的语音能力引擎日均调用量已经超过100亿次。
对照国内8.54亿的网民规模,平均每个人要和百度大脑的语音能力引擎每天接触12次,场景涉及输入法的语音输入、智能音箱的语音对话、百度地图的语音导航、与各种机器人的有趣互动……无论是覆盖范围还是使用频次,早已超过99%的互联网服务。
可能在不少人的印象里,人工智能还是遥不可及的新事物,百度大脑用数据告诉了我们这样一个事实:人工智能并不遥远,甚至已经是生活中不可或缺的一部分。
01 日均调用100亿次的背后
如果仅仅盯着数字来看,100亿不可谓不庞大,也奠定了百度大脑语音应用规模第一的成绩。但比数字本身更有价值的是,百度大脑如何做到语音能力引擎日均调用量超过100亿次的规模,以及100亿次的语音到底“唤醒”了什么?
第一个问题的答案是开放。截止到目前,百度大脑已经开放了云、端、芯的全栈全场景语音开放能力,广泛应用于文娱、金融、政务等多个行业和场景,开发者们只需要一个简单的调用,即可为产品接入百度大脑的智能语音能力。
而从百度大脑语音能力引擎论坛传递的消息来看,百度大脑的语音引擎全新发布和升级了14大产品内容,包括基于百度鸿鹄语音芯片的4款硬件模组、开发板,针对智能家居、智能车载、智能IoT设备等端到端的软硬一体远场语音交互场景解决方案,语音自训练平台、呼叫中心语音解决方案的升级,以及6个在线语音合成精品音库和5个离线语音合成精品音的发布。
简单来说,百度大脑已经为语音能力引擎打造了一条应用落地的生态链,而且生态链所覆盖的场景和能力还在不断拓展。
至于第二个问题的答案,不妨先来看三个具体的应用案例。
创维AIoT研究院产品经理李凯在演讲中谈及创维和百度大脑的合作,在百度鸿鹄语音芯片等软硬件的赋能下,创维为产品增加了语音交互能力,涉及2500万台的电视装机量,用户只需要一个语音指令就能找到自己喜欢的电视节目,让电视的交互从遥控器直接进化到智能语音时代。
北京子杰宝贝科技有限公司将百度大脑的语音能力引擎带到了医疗领域,之前60%的医护人员每天要花费45分钟到90分钟的时间填写表单数据。依靠百度大脑的语音识别、自然语言处理等技术,医护人员如今用语音就能完成表单的录入。
善行智能在百度大脑的智能语音技术、智能OCR识别、智能物体识别等技术的加持下,打造了可以智能识别障碍物、物品、钱币等物体,并通过语音播报给用户的小Q智能导盲眼镜,帮助盲人群体独立的认知世界。
诚然,“100亿次日均调用量”的背后是人工智能落地应用的生态圈,为合作伙伴带来了转型的契机,为医护人员解决了工作的痛点,也让盲人群体感受到了AI的温暖。而这些仅仅是百度大脑技术赋能的冰山一角。
02 AI赛道中的“学霸”人设
除了智能语音的落地应用,百度大脑还在不断推动语音技术的发展,比如百度语音首席架构师贾磊提出的基于复数CNN网络的语音增强和语音识别一体化端到端建模技术,相较于传统基于数字信号处理的麦克阵列算法,新技术的错误率降低了30%以上,并且已经被集成到最新发布的百度鸿鹄芯片中。
身为人工智能赛道里的“学霸”,百度大脑并非是擅长语音技术的偏科生,而是一个典型的“别人家的孩子”。
在乌镇智库出品的《全球人工智能发展报告》中,专门罗列了中国AI专利ToP 10的企业,百度以935件的专利数量,毋庸置疑的成了榜单上的头名选手,并与腾讯、阿里等同一阵营的玩家们拉开了较大的差距。
在国际权威研究机构Forrester发布的计算机视觉公有云报告中,在百度大脑的AI视觉技术加持下,百度智能云处于中国市场“领导者”领域最上方 ,在数据、解决方案、应用场景、管理能力等多维度领先于阿里云、腾讯云等厂商。另一份《IDC MarketScape:2019中国AI云服务市场厂商评估》中,凭借在能力和市场两个维度的优异表现,百度智能云同样位居领导者象限最上方。
在4月初结束的ICME人脸106关键点检测比赛中,百度大脑力压阿里、华为、美团、中科大等选手拿到冠军;6月份的CVPR 2019上,百度大脑又在视频理解与分析、目标检测、图像超分辨、智能城市车辆识别、人脸&人体检测等领域斩获了10项冠军;11月份的ICCV 2019上,百度大脑视觉团队以mAP值57.13%的成绩夺得人脸检测的冠军,超过第二名0.47%……
如果从时间上看,2016年百度大脑对外开放至今不过三年时间,纵然离不开百度长期的技术积累,这么短时间里的全面开花无疑佐证了百度大脑的“学霸”人设。这样的成长速度与百度的技术基因、工程师文化等不无关系,或许还有另外一重原因。
2017年的时候,就有人将中美在人工智能赛道中的角色比作星球大战里的Luke和Darth Vader,甚至为双方进行了“战力”对比:美国AI公司的数量比中国高出1.82倍,流向美国的资金份额比中国高1.54倍,美国的AI人才库亦是中国的2.01倍……美国在人工智能领域的强力基础,有赖于Google、亚马逊、IBM、微软等先行者,中国人工智能的担子自然就落到了BAT身上。
某种程度上说,“学霸”百度大脑还肩负着抹平中美AI力量鸿沟的义务,而从一系列国际赛事上的表现、国际权威机构的认证来看,百度大脑也是中国AI领域当之无愧的头雁,构建起AI的全栈技术布局,平等的赋能每一位开发者,将是百度大脑现在和未来身体力行的使命所在。
03 百度大脑在持续刷新
百度首席技术官王海峰在百度大脑语音能力引擎论坛讲到进化和赋能:“AI技术的进化和产业赋能正向循环,相互促进,AI在应用场景中不断进化。”可以理解为这就是百度大脑对自身的使命,也促使百度大脑在持续“刷新”。
犹记得2016年的百度世界大会上,李彦宏用了相当长的篇幅来讲述这个“新概念”,彼时还只是记住了“百度大脑”这个名字,至于会产生什么样的影响,恐怕很多人并没有答案。然而短短三年的时间里,百度大脑早已成了生活中的一部分,百度输入法的语音输入,入住酒店时的刷脸认证,农田里的遥感无人机,工厂里的智能零件分拣……在那些看得到和看不见的生产生活场景中,都有着百度大脑的身影。
截止到目前,百度大脑已经开放了228项AI能力,拥有超过150万的开发者用户,当年李彦宏对百度大脑的寄托已经逐步实现。但百度大脑并没有止步于此,在完成AI能力与应用场景融合创新的第一步后,百度大脑在5.0升级时被定义为“软硬一体的AI大生产平台”,让AI迈入产业世界与工业大生产进行融合。
与之对应的是,语音技术推出了风格迁移的语音合成技术,仅需20句话就可以制作一个人的专属声音;视觉方面形成了适用于不同应用场景的技术矩阵,诸如车辆识别、物体识别、风格转化、人流量统计等等;语言与知识方面,构建了世界上最大的多元异构知识图谱……除了技术能力的刷新,百度还将算力、算法和数据打通,以百度智能云为依托,以百度大脑为核心,以飞桨为基础底座,为各行各业的智能化转型升级提供强有力的支撑。
市场的反映也印证了百度的正确性,仅以百度大脑人脸公有云服务为例,公有云日均调用量超过1亿,开发者超过13万,用户使用规模稳居业界第一。并且百度大脑在人脸识别领域积累了1000多家合作伙伴,落地了超过10万个项目,形成了丰富、完整的人脸产品矩阵。
同样“刷新”的还有百度大脑的人才体系。就在不久前,著名的计算机和大数据理论领域专家Jeffrey Vitter加入到百度研究院顾问委员会,美国俄勒冈大学教授窦德景也加盟百度研究院担任大数据实验室主任。从世界级科学家组成的顶级智囊,到百度庞大的一线工程师,百度大脑在为行业赋能,驱动AI走进工业大生产时代的同时,也在不断将AI技术做透、做精、做深。
“刷新”是百度大脑的底色,也是持续修炼内功让AI走进真实世界的态度。
04 写在最后
从2016到2019,人们对AI的理解已经不再局限于围棋大战,可在谈论AI的时候,核心算法上的瓶颈仍然是不少开发者的锥心之痛。百度大脑就像一个扛着挑战一路向前的勇士,在每一个关键节点上为业界开辟出一条条新路。
读懂了这一点,语音能力引擎的100亿次日均调用,注定只是百度大脑的一个小目标,因为“让开发者平等地获取AI能力”这条路本就没有终点。