虚拟人真实自然天花板之争的背后
曾响铃文 | 曾响铃
来源 | 科技向令说
1992年,科幻作家尼尔·斯蒂芬森在《雪崩》里提及了两个概念,“Metaverse(元宇宙)”与“Avatar(化身)”。
今天,市场为这两个概念,都“疯”了一般。
元宇宙,自不必说。
“Avatar(化身)”也同样迸发出惊人的爆发力。
从爱酱到A Soul、从阿凡达到柳夜熙、从数字孪生黄仁勋到小扎,从艾灵到华智冰、夏语冰,虚拟人正在以前所未有的速度走红、出圈,迎来井喷式爆发。
近期,虚拟人产业界又爆出惊天大消息——继上次真假难辨,被认为是虚拟人技术天花板的每经AI主播N小黑走红刚一周,小冰公司又联合北影世纪(北京)教育咨询集团旗下的数字人类公司,打造了表现力更胜一筹的数字孪生CEO李威克。
“我原以为‘N小黑’已经天下无敌了,没想到此人比他还要‘勇猛’。”一场虚拟人之间真实自然度的天花板对决再度拉开。
而当这些虚拟人在不断追求技术的极致表现时,或许一个商业爆发的虚拟人时代就离我们不远了?!
看似差不多的虚拟人,也有“三教九流”?
数字孪生CEO李威克是首个登场于影视和数字营销赛道的数字孪生虚拟人,其真实自然度甚至要比N小黑要更胜一筹。
此前,N小黑上线直播了70多天,竟无一人发觉站在台前的是一个虚拟主播。
甚至,还有人发问“节目24小时都在做,半夜也直播,你们得给主播多少加班费?”
而直到N小黑在节目中“自爆身份”之后,大家才恍然大悟,直呼“没想到,如今的虚拟人已经真实到真假难辨的程度”。
谁曾想,长江后浪推前浪啊!
如今,数字孪生CEO李威克在面容、表情、肢体动作等表现上甚至比N小黑都更真实自然,近乎本尊出镜,不断挑战着N小黑的地位。
不过,话又说回来,究竟什么是数字孪生虚拟人?如此强大!
值得一提的是,当前柳夜熙大火,身为影视和营销跨界老炮的李威克,为何会选择数字孪生虚拟人来作呈现,而不是CG?
正所谓,外行看热闹,内行看门道。
这里面的“道道”可多着呢。
尽管市面上的虚拟人角色很多,但是其背后的技术支持实则都不尽相同。
当前大火的Ayayi、柳夜熙等实际都是动作捕捉结合中之人实拍,用CG换脸加特效呈现出来的形象,而撒贝宁的虚拟主持搭档“小小撒”、新华社数字记者小诤等,则是通过CG形象建模,声音建模,再加上Audio2Face等机器学习方法驱动的虚拟人。
而AI与CG融合度越高,则虚拟人的真实度、自然度以及自主性也就越高,小冰公司联合每日经济新闻打造的N小黑、N小白,以及数字孪生CEO李威克在深度神经网络渲染技术(XNR)等支持下,呈现出来的效果优势也就更加明显。
由此,数字孪生CEO李威克登场的背后,实则又是一次技术的进阶。
N小黑走红、李威克登场的背后,数字孪生虚拟人为何密集登场?
如今,从N小黑、N小白走红到李威克登场,短短的时间间隔之内,数字孪生虚拟人的登场愈发频繁,一个AI being时代加速而来。
在这一切的背后,核心技术的突破究竟解决了虚拟人产业的哪些问题,使得产业的齿轮能如此加速运转?
回到虚拟人产业的痛点上,我们一一拆解。
首先,我们需要明确的是,创造虚拟人其实并不难,十几年前就有,比如2007年诞生的虚拟偶像“初音未来”,难就难在如何让虚拟人看起来足够的真实自然。
客观来看,对比最新的数字孪生CEO李威克与早前的虚拟人角色,几乎可以说是两个不同的物种。
之所以能拉开这么明显的差距,是因为小冰公司采用的深度神经网络渲染技术(XNR)与CG融合后,能基于深度学习的三维场景表达和对应的神经渲染管线,在特定场景中发挥作用,让数字孪生虚拟人的面容、表情、肢体动作更加真实自然。
同时,这项技术还可以充分利用深度学习,从大量数据中提取数据先验,实现更快速的渲染,降低虚拟人的制作成本。
要知道,做到同等真实自然度的柳夜熙,一个月更新一条,其1-2分钟内容成本就已经逾百万,从成本上来看很难持续。而过往的电影CG制作也大多存在这样的问题,成本高且周期长。
如今,在技术的迭代下,这一限制也逐渐被消解。
其次,虚拟人的自主性也非常重要。此前的虚拟人大多缺乏自主性,可落地的场景也少,往往需要提前“彩排”或“人工牵引”,才能完成一系列产业化的操作流程。
就虚拟主播而言,能否实现不用人工干预的、端到端的生成实时流媒体,是一个重要的应用考量。
小冰公司的N小黑、N小白与其他虚拟主播的不同就在于其自主性。
在N小黑、N小白“工作”期间,从金融资讯的文本生成,到通过预训练的虚拟主播实现音画同步播报,再结合同步场景动态绘制,最终生成完整的直播推流,这些全部都是由AI完成,完全不需要人工介入。
在全球范围内,这是自动化AI采编播全流程的首次实现,也是虚拟主播自主性的一次重大突破。
由此,当数字孪生虚拟人越来越接近于人的“自主性”,更自主也就更有用,能发挥出人的劳动价值,产业驱动或许将迎来更多的数字孪生虚拟人的出现,也是可以预见的。
最后,虚拟人的制作周期问题,也很重要。
为什么以前的数字孪生虚拟人没办法密集登场?先来看一个例子。
“黄仁勋”背后的英伟达团队,为了实现“黄仁勋”短短15秒的的亮相演示,由数十位工程师花费了几个月的时间进行AI与CG的融合创造,其中的训练周期、后期优化达到了数月之久。
这就是为什么有的数字孪生虚拟人只能“昙花一现”,因为真的太久了。
如今,这个问题终于得到了解决。通过小冰框架小样本学习技术,N小黑、N小白两个虚拟主播只需要一周的训练周期即可完成。
对比来看,这一问题的破解大幅降低了虚拟人的制作门槛,周期长、成本高的问题逐一解决,故而小冰公司CEO李笛表示:“一个永不疲倦、安全可靠、稳定输出的AI Being时代已经到来。”
数字孪生虚拟人的商业潜力
数字孪生虚拟人加速而来,而数字孪生虚拟人的市场能否如期而至?其背后的问题是,虚拟人能带来多大的商业价值?
昨天在保时捷中国的微信朋友圈信息流广告中,虚拟人Ayayi出镜,引发新一轮朋友圈的热评。
这一次是Ayayi,下一次又将是谁?虚拟人的营销话题度持续高涨。
同时,以数字孪生CEO李威克登场为代表,影视工业和营销行业都同时盯上了数字孪生虚拟人,并选择了AI与CG融合的道路。
那么,在数字孪生虚拟人的背后,实则正在孕育出一个庞大的市场。
其中,李威克也是小冰公司基于深度神经网络渲染融合CG呈现出来的最新成果。由此可见,技术正在带给这个市场无限的商业可能性。
从数字孪生虚拟人层面来看,区别于现实的本尊,数字孪生虚拟人具备比本尊更多的可能性,比如语言能力。
在现实生活中,一个人所能掌握的语言是有限的,但数字孪生虚拟人不同,得益于AI的自然语言处理能力,能轻松学习不同语言,实现多语种的输出。
这个功能目前已在实测,未来或许我们无法掌握多门语言,但是我们的数字孪生虚拟人却能轻轻松松的掌握70国语言都并非难事,只要历经简单的数据采集、训练、渲染和驱动。
从产业应用层面来看,数字孪生虚拟人在技术的支持下,具备了更多可迁移应用的可能性。在每日经济新闻里,小冰公司将虚拟人打造成为了365*24小时主播。而面向其他场景或行业,底层的技术经过迁移结合其他行业的知识体系,便能继续创造等同于行业专家的数据孪生虚拟人。
现在,小冰公司正依托全球承载交互量最大的完备人工智能框架之一“小冰框架”在自然语言处理、计算机语音、计算机视觉及人工智能内容生成等技术方面持续迭代,从而夯实技术基础,打通数字孪生虚拟人应用于各行各业的服务路径。
可以预见,未来的数字孪生虚拟人不仅更真实自然,接近本尊,还将更强大且专业,超越本尊。
那么,当一个数字孪生虚拟人具备这些成熟的条件和能力,其商业潜力或许也将是难以估量的。
而如今,不管是李威克的登场,还是N小黑的走红,两者竞争虚拟人真实自然度天花板的背后,就已经预示着虚拟人日趋成熟,正在迎来商业爆发的前奏。