巨头下场造“人”,一场AI较量
AI既是数字人的基础,也决定了数字人能力的天花板。
作者/静秋
出品/新摘商业评论
“百度世界大会的一大看点正是火出圈、成顶流的数字人。”
7月6日,百度世界大会预沟通会上,百度高级副总裁袁佛玉着重介绍了当下数字人的发展情况。
让人印象深刻的是在信息密集、节奏紧凑的预沟通会中,主持人度晓晓始终应对自如,其间“她”还向百度高级副总裁袁佛玉问了一个关于自己的问题。而在刚刚过去的6月,度晓晓用40秒钟时间完成了40篇高考全国卷的命题作文,惊艳众人。就在今天,度晓晓还将直播挑战上海高考英语作文。
眼下不止是百度在打造数字人,包括阿里、网易、腾讯、字节、华为等都推出了类似产品。巨头下场造“人”不单是具有打造IP的能力,从某种意义上讲,数字人是衡量科技企业技术集成与整合能力的标尺。
一位业内人士认为:“科技公司以IP的方式,全方位呈现各自能力,这背后其实是各自生态展示肌肉的表现形式。”
一、数字人“缠斗”
巨大的市场潜力,是巨头批量制造数字人的直接原因。
日前,IDC发布的报告显示,中国AI数字人市场规模呈现高速增长趋势,预计到2026年将达102.4亿元人民币。而巨头推出各种各样的数字人,看似杂乱无章,实际皆有深层次的考量。
腾讯数字人的基底是建立在语音智能和大文娱生态上的。语音智能方面,根据语义匹配对应动作、字词的能力,是腾讯数字人在技术上的底色。此外,微信上的实时语音转换与翻译,所产生的海量数据,使得其语音会话能力能够经过翻译和转化而持续生长。
推动腾讯发布数字人的动因是巩固大文娱生态。“云小微数智人平台”由播报数智人平台与交互数智人平台两个系统组成。对应的落地场景为手语主播、数字导游、数字客服、虚拟IP偶像等虚拟资产。
同样身处文娱市场的字节跳动,虽然在IP与版权资源上的积累有限,但是通过连续不断地投资与人才引入,一个AI+XR的软硬协同生态正日益明显。
塑造IP较为成功的还有阿里,其曾借着冬奥会,推出了自己的数字人“冬冬”,展示其肌肉。透过冬冬可以发现,由于AI实时驱动,数字人说话的同时,能协调嘴形、表情、动作,乃至模拟真实环境下的部分场景。而且采用了面向高质量图形的Unity高清渲染管线(HDRP),因此在视觉上有着不输AR/VR的效果。
阿里数字人早已开始直播带货,用AI“平替”主播。从逻辑上讲,数字人带货能够解决真人带货的种种局限和各类不可预测的风险。
AI驱动是百度的数字人的最大特点,靠着硬实力,截至目前打造了多个不同面向的IP,如度晓晓、希加加、文夭夭,覆盖了功能型与演艺型两个大类。
百度AI数字人度晓晓
度晓晓和文夭夭创造了功能型数字人的两个范式。前者能力全面,后者则主要面向垂直领域。度晓晓不单是一个CG或者问答环节的数字人,而是能够胜任各类创意型工作,能够作文、作词、作曲、作画,开辟了一个AIGC的内容生产模式。文夭夭为数字人运营细分领域,打开了市场,通过AI技术为文博领域提供新玩法。
演艺型数字人希加加,早前在集度汽车发布会上亮相,一度惊艳业内,百度也成为业内率先尝试在会展领域引入数字人的巨头。
百度AI数字人希加加
看得出或许是由于寻求技术突破的周期长、难度高,现下大部分厂商皆围绕自身长处,推出数字人。
像网易林幺幺通过接入AI算法,主要应用到电商带货中。科大讯飞,虽然没有腾讯、网易、阿里那样强大的图像处理能力,但是从“冰冰”与“加加”两个虚拟IP来看,其核心还是输出科大讯飞的语音交互能力。
二、百度整“花活儿”
不难发现,时下的数字人更像是一个载体,要么搭载内容与场景,要么搭载各类技术,正是因为这个原因,巨头们才不遗余力造“人”。
在梳理之中我们也能看到,无论是知识库与交互,还是算法与建模,AI都扮演了举足轻重的角色,不过分地说,数字人的竞争本质上其实是AI能力的竞争。
而百度可以在短短两年多时间内接连推出度晓晓、希加加、文夭夭等特点、功能、使用场景截然不同的数字人IP,表明“AI路线”的潜能。
在今天的百度世界大会预沟通会上,百度高级副总裁袁佛玉提到,百度AI驱动的数字人的不同在于“可交互”性,而且还具备创作能力。
把时间回拨到2020年,那年百度世界大会上,度晓晓被定义为“智能助理”而首度问世,彼时,人们只是感受到了AI原来并非那么冷冰冰,而是可以有温度,这颠覆了传统认知中,技术都是冷冰冰的陈见。
“智能助理”的定位意味着百度需要持续解决人的各类需求,全方位应对信息输入、处理、输出的挑战。仅仅通过营销方式制造IP,让市场接受数字人,似乎有些追本逐末。事实上,随着入局玩家、搭载场景的增加,以及竞争走向激烈,市场走过新奇阶段时,技术能力将起到决定性作用。
数字人为百度提供了AI技术落地的场景之一。之所以度晓晓们能够有极强的互动性,与之沟通更丝滑,主要原因在于由文心大模型、AI超写实建模所构成的AI内核。
由于数据、算法和算力出现巨大增长,人工智能发展开始转向泛化能力与通用性强的预训练大模型。在百度文心大模型加持下,数字人在生产与创意类应用中的潜能也得到了释放。
日前,像度晓晓迅速完成高考作文,以唱作人的身份推出《每分 每秒 每天》单曲,作出“无界”系列画作,表明百度数字人已经具备面向多领域能力。而且其创意能力,或将掀起UGC与PGC两大生产方式之外,一种全新的内容生产方式:AIGC。
具体而言,百度文心大模型,让数字人能够通过AI技术以自动编排合成的方式生产内容。
AIGC将完全解放内容生产力,满足一些对时效性要求较高的领域。例如新闻,过去完全依赖人工创作与审校,即便如此,走完三审三校流程之后,新闻时效性已经大打折扣,而且还可能出现“谬误”。AIGC的出现解决了依赖人工创作,在可靠性与效率上的劣势。
今年两会时,度晓晓就曾在两会报道中与工人日报开辟了专栏《两会晓晓说》,为融媒体报道带来一种耳目一新的体验。
凭借在AI方面的积累,百度可以在AI各落地场景中玩各种“花活儿”,无论是作为功能型数字人的智能助理度晓晓,还是作为表演型的“虚拟车主”希加加。
反之,我们甚至可以认为,AI既是数字人的基础,也决定了数字人能力的天花板。
“数字人生产周期,从动辄几个月,缩短到小时级别。”袁佛玉在预沟通会上提到,由于百度积累了深厚的AI底层技术,其数字人的成本和制作周期优势将逐渐显现。
三、短期拼场景,长期拼AI
任何技术,如果不能创造价值,很难持续,正是因为巨头们看到数字人背后的巨大宝藏,眼下才会鱼贯而入。
数字人需要走过如下几个阶段“外表像人,对话像人、作为人的帮手”,AI覆盖了整个过程。无论是AI建模,还是NLP,或者是更为深入的知识图谱与百度文心大模型所带来新的AIGC生产模式。
事实是,数字人短期拼场景,长期拼AI。
短期来看,市场对数字人还处于“新奇”阶段,因此主要应用场景集中在广告、电商、游戏领域。这也是为什么,主要受到文娱行业的追捧。
这里需要提到一点,作为另一种IP形式,数字人风险可控,只要不过度营销,较少出现翻车的情况。在偶像频繁塌方的情况下,确实能够填补一定市场,可是如果AI能力不能进一步提升,真正缩小与人的距离,天花板也不会太高。
市场迟早会来到成长与成熟阶段,所以从长期来看,无论是文娱,还是教育、服务、金融,AI的效能将会持续释放。
而另一头,AI能力也将改变当下各方混战的格局。眼下百度“AI路线”,已经提前完成了布局,只需要等待从春秋到战国。
到那时,没有了新奇,人们只会问如下问题:你能帮我解决什么问题。
显然,百度已经写就了答案。