百度打造国内首个可交互超写实明星数字人,背后技术会有多深?
有观君日前,百度APP正式上线了以明星龚俊为原型的数字人语音搜索助理。据介绍,这是国内首个可以在在APP端实现用户互动的超写实数字人。用户进入该功能界面后,可以与“龚俊”实时交互,如询问天气等问题,“龚俊”将快速识别、搜索,并语音播报首条搜索结果。此外,用户也可以命令“龚俊”完成APP内的部分控制功能,如打开夜间模式、进入书架页面等。
据媒体报道称,该数字人在模型上,百度使用4D扫描技术捕捉龚俊真人的说话以及日常表情的面部细微变化,以实现对其本人的超写实还原。而在语音识别上,百度赋予了其超高准确率的语音识别技术,准确率达到98%,并且对于中英文混杂、生僻字、方言等各种语音也能准确识别。另外,在语音合成上,该数字人依托于TTS(Text To Speech)技术,可以无限接近于原声。
从专利角度看,根据智慧芽数据显示,百度及其关联公司在全球126个国家/地区中,共有1700余件与“语音识别”相关的专利申请。其中,有效专利840余件,授权发明专利730余件。通过对上述全部专利进行分析可知,百度在语音识别技术领域的专利布局,主要聚焦于
语音交互、语音信息、人工智能、语音信号、语音合成、语音控制等相关的技术领域。
目前,虚拟偶像市场火热,众多企业、机构纷纷发布自己的虚拟偶像,如DOTA2官方虚拟偶像dodo,清华大学虚拟学生华智冰,湖南卫视虚拟主持人小漾,还有此前就已经在二次元圈内大火的初音未来、洛天依等。
量子位发布的《虚拟数字人深度产业报告》显示,虚拟数字人的应用可分为服务型虚拟人和身份型虚拟人。替代真人服务中的虚拟主播和虚拟IP中的虚拟偶像是目前的市场热点。报告预计,在2030年,我国虚拟数字人整体市场规模将达到2700亿。身份型虚拟数字人约1750亿。服务型虚拟数字人总规模超过950亿。目前市场仍处于前期培育阶段。
(备注:智慧芽全球专利数据库收录数据包括126个国家/地区中已经公开的专利,一般来说,专利从申请到公开可查询,需要4到18个月)