数字人被百度玩明白了

霞光社

    
    作者 | 郭照川
    编辑 | 麻吉
    一直以来,数字人被认为是元宇宙的入口。
    7月6日,在2022百度世界大会的预沟通会上,一位红发少女率先登场,以兼具“科技感”和“专业度”的虚拟形象,在此次会议全程担任了关键的串词、控场、提问和嘉宾介绍工作。
    实用型虚拟数字人正在走进大众视野,百度旗下数字人度晓晓就是其中之一。虽然她的“主业”是百度App的虚拟AI助手,但度晓晓同时又被赋予了实用性的“多重身份”:
    她既是参加过国内顶尖艺术院校毕业展的“AI画家”,又是成功挑战过高考命题作文的“AI作家”,还是创作过歌曲、接过广告、发行过MV的“AI偶像”。
    作画、谱曲、做主持、写作文、陪聊天......百度硬核技术支持下的数字人特有的创造性和交互性,让人不得不相信现实世界与“元宇宙”的边界正在被打破,数字人则将成为与日常生活密切联结的有力辅助。
    拥有个性化交互能力的数字人,真的存在吗?元宇宙发展到现在,最先进的数字人又被赋予了哪些意想不到的能力?
    
    图源:2022百度世界大会预沟通会
    
    从二次元到“N次元”
    谈到虚拟人物,难离“二次元”。
    从初代虚拟偶像初音未来,到许多传统行业的数字代言人形象,基本上都是由二次元人物设计脱胎而来。
    对于“二次元”来说,创造是最难的。虽然这些数字人外观设计得十分完美,但应用路径也非常单一,哪怕是超写实数字人形象,都脱离不了无法实现交互、本身无法创造的局限。
    而在今年的西安美术学院的本科毕业展上,有一系列命名为“无界”的画作,打破了传统数字人的创造“结界”。
    这一系列作品的创作者,是百度数字人度晓晓。虽然画面由AI数字人所绘,但也被美院教授认证为 “已经达到了本科美术生的基本要求”。其商业价值同样不可小觑,这些绘画数字藏品其中的四幅,在获展出之前就已经卖出了超过17万元的高价。
    今年6月7日高考结束后,度晓晓又以全国新高考Ⅰ卷作文《本手、妙手、俗手》为题,在40秒的时间内完成了审题、逻辑、创作等步骤,创作出了40多篇不同的高考作文,还被高考研究专家申怡老师,评判为可以打出48分的“高分作文”。
    不久前,“#国内首个可交互虚拟偶像度晓晓”还登上了热搜。她作为百度数字人作词、编曲了歌曲《每分 每秒 每天》,还和龚俊数字人一起举办了新歌发布会直播。知名乐评人耳帝也认为,度晓晓背后的人工智能创造内容确实可以“提高创作效率、降低门槛、辅助创作”。
    在AI内容创作能涉及的领域内,度晓晓几乎无处不在,于是她也被大家笑称为元宇宙时代“最卷数字人”。除了能写会画的“数字才女”度晓晓,百度旗下另一位数字人希加加,也吸引了不少关注目光。
    希加加一度被称为“第一个吃到汉堡的数字人”。在成都和大连的繁华街头,希加加成为数字人新品推荐官,从麦当劳门店上方的巨大屏幕中闪身而出,抓住了一只大汉堡,一瞬间虚拟与现实的连接让人过目难忘。
    
    图源:麦当劳
    她不仅成为了“00号太空数字乘客”,登上了我国第一艘数字载人飞船,还接下了和Qee熊、FE赛车一起合作设计的许多任务,俨然像一个赛博朋克的新员工了。
    目前数字人真正落地后,展示出来的实际使用价值,已经超出了我们想象中的认知边界——从被动的二次元单薄形象,演变为能备实理解能力,能实现创意作品的自动生成的数字人物,给世界带来越来越多的惊喜。
    从被设定问答程序的单一“二次元”,到富有创意、适用场景更多元的“N次元”,度晓晓和希加加等百度“AI数字人家族”的出场,让数字人赛道的前景变得更加惊艳。
    
    告别“虚火”,铺开实际应用价值
    随着“元宇宙”和“Web 3.0”概念崛起,数字人成为当下最热的风口之一。
    根据艾媒咨询数据,2021年中国数字人产业市场规模和核心市场规模分别达到1074.9亿元和62.2亿元,预计2025年将达到6402.7亿元和480.6亿元。光是2021年全年,虚拟数字人相关投资就有16笔。
    2022年第一个月,虚拟人领域百起融资金额累计已经超过了4亿元人民币。曾经推出知名虚拟IP“翎”的魔珐科技,也在今年4月刚刚完成了B轮和C轮共计1.3亿美元的融资。
    伴随着市场对数字人的极高期望,也出现了很多质疑声音。
    许多人认为目前元宇宙以及数字人尚处在非常早期的阶段,反而是风刮得太猛,导致只剩下“概念横行”“一把虚火”。此类看法并非空穴来风,当下依然存在着许多行业隐忧,例如数字人AI驱动技术不达标、实际应用场景不足、制作成本太高等等。
    然而,随着数字人的应用场景和技术提升,此次百度数字人也展示出了其特殊性:
    度晓晓和希加加与市面的上其他数字人的不同,她们最大的突破点就在于已经实现了“可交互”——无论是度晓晓还是希加加,都可以在多样化的实际应用场景中高度拟真,实现像真人一样互动。
    度晓晓已经具备了对话能力。闲来无事,用户可以像真人一样随时和她聊天,或者让她唱歌来听,独特的情感交互系统让她像一个随时在身边的虚拟助手,又像一个真实存在的可靠伙伴。
    
    图源:百度APP
    甚至面对不同的人的交互方式,个人性格和爱好,度晓晓也会呈现出不一样的理解和反馈。也就是说,在你身边的数字助理度晓晓,无时无刻都和你共同处于向更优秀的自己的进化之中。
    除了对话,度晓晓还能真正做到“理解”用户,区分闲聊与搜索意图,满足用户提出的更多生活需求。例如当你告诉度晓晓“想要看电影”时,她会像朋友一样给你推荐影片。而如果你的需求是“想要喝咖啡”,她甚至能自动跳转到咖啡小程序,方便你下单一杯咖啡外卖。
    虚拟朋友穿插进整个生命过程的陪伴,满足能交互、有回应、满足多种功能需求,才是理想中数字人的“最终形态”。
    
    数字人之战:大厂实力图鉴
    各家互联网大厂,纷纷在数字人领域疯狂加码。
    不久前,字节跳动收购了虚拟社交公司“波粒子科技”,也是看上了其拥有的虚拟人物形象自定义核心技术,意在为元宇宙再添一张牌。近年来专注于智能语音和AI技术的科大讯飞,也在去年年底上线虚拟人交互系统1.0,试图拓宽人工智能生态。
    事实上,百度在很早之前喊出了“All in AI”的口号,2020年就已经筹备上线的度晓晓,诞生于元宇宙浪潮发端之初,一开始就具备了AI驱动下的视觉识别和语音识别能力,背后百度又有AIGC(AI generated content,人工智能创造内容)内容技术的支持。
    百度旗下的虚拟人家族,在互联网大厂的元宇宙赛道竞争中的优势也很明显。
    根据第三方机构发布的榜单,百度凭借多年以来语音、视觉等AI能力的积累,在数字人综合实力方面排名第一,尤其在数字人大规模落地领域,有着强大领先实力。
    一方面,百度数字人背后拥有知识增强大模型“文心大模型”。
    度晓晓、希加加都是具备AIGC能力的数字人,度晓晓创作的AI画制成的数字藏品,在百度上线24小时内就卖出了8700多份。而这种平均每幅画用时只需要数十秒的数字人创作,完全颠覆了当下已知的内容生产模式。
    这样令人惊异的AIGC高效输出能力,则是依托于百度文心大模型。数字人的绘画创作技能,靠的就是文心大模型-跨模态图文生成模型ERNIE-ViLG。
    另一方面,百度AI算法得到突破,使得数字人的制作成本极大收缩,降低了批量生产数字人的门槛。
    百度集团副总裁袁佛玉,在2022百度世界大会的预沟通会上也表示,“随着百度AI算法的突破,能让数字人制作成本十倍、百倍地下降,还能让数字人生产周期,从动辄几个月,缩短到小时级别。”
    这一切,都让数字人大规模应用落地,甚至让实现“人均一个数字人小助手”的元宇宙未来理想成为可能。这也正是今年百度世界大会的主题“AI深耕,万物生长”所阐释的,在出行、产业、生活等领域,人工智能都将发挥前所未有的作用。
    7月21日,度晓晓、希加加等百度AI数字人家族成员,都将深度参与到百度2022世界大会之中。
    今年的百度世界大会,更像是一场对于尖端人工智能技术的一次创新式全民科普。拥有强大创造实力,具备陪伴和交互能力,且能实现可控成本批量复制的数字人,已经为我们打开了元宇宙的大门。