科技感拉满,盘盘这届冬奥会的虚拟数字人

科技云报道

    
    凭借惊天一跳,谷爱凌成为全球新晋顶流!
    2月8日,18岁的中国运动员谷爱凌摘得冬奥会自由式滑雪大跳台金牌,也是中国在本届冬奥会上夺得的第三枚金牌。 
    但就在前一天,本该积极备战比赛的“谷爱凌”却还在咪咕的演播室里赶通告,录节目。 
    当然,这并不是谷爱凌不务正业。因为在咪咕演播室里的其实并不是谷爱凌本人,而是她的“数字分身”Meet GU。
    
    MeetGU冬奥首秀(来源:咪咕视频)
    Meet GU是中国移动咪咕视频推出的首个体育数字达人。按计划,奥运会举办期间,它将在咪咕冬奥赛事演播室中完成滑雪赛事解说、播报及场景电商的虚拟互动等工作。 
    事实上,在整个冬奥会上,虚拟数字人也并不止运动员数字分身这一项。从赛场内到赛场外,虚拟数字人已经渗透到了冬奥会的多个环节。
    
    冬奥会虚拟数字人玩出新高度 
    拉满的黑科技,绝对是本届冬奥会的一大亮点。无论是惊艳不已的开幕式,还是场馆内外的建设,无不因为科技,一次又一次地引发舆论的惊叹。 但万万没想到的是,虚拟数字人的出现,让奥运天气播报这样的日常工作,也玩出了充满科技感的新高度。
    
    或许你会产生疑问,图中的不就是中国天气的主持人冯殊吗? 
    但真相,却并非如此。 
    这位正在声情并茂播报天气的TA,其实并不是冯殊本人,而是一个很纯粹的虚拟数字人——冯小殊。 据了解,冯小殊是由中国气象局华风气象传媒集团,联合小冰公司共同打造。早在冬奥会开幕前10天,他就已经在各大平台上“持证上岗”了。 
    除了冯小殊持续播报“冬奥公众观赛气象指数”,在北京冬奥会期间,AI手语主播也火遍全网。 
    早在2021年11月,央视新闻就已经预告了它和百度智能云联合打造的AI手语主播,将在冬奥会上承担手语翻译的工作,让听障人士也能和正常人一样看比赛。 
    在网上爆红的央视“段子手”朱广权PK“手语主播”的视频中,朱广权用超快语速的顺口溜挑战“手语主播”的“手速”,而这位手语主播也凭过硬的专业能力轻松应战。事实上,这位手语主播就是一位虚拟数字人。
    
    从整个冬奥会的进程来看,虚拟数字人的全面参与,是在冬奥会的宣传、开幕式和播报上。 
    虚拟数字人“热爱REAI”就是首次被采用的数字人奥林匹克公益宣传大使。热爱REAI在2021年11月由新华社推出以来,不仅和谷爱凌的虚拟形象Meet GU进行了联动,也在许多公益宣传场景中与观众有过“接触”。 
    2月2日,在北京举办的“相约北京”奥林匹克文化节开幕式上,中国虚拟歌手洛天依以一首歌曲《Time to shine》受到广泛关注,成为第一位登上奥运舞台的中国虚拟歌手。
    
    作为云上奥运的技术服务商之一,阿里巴巴也推出了冬奥宣推官数字人“冬冬”。尽管赛前新华社将冬冬包装成特约记者,为冬冬专门拍了一个招聘视频,但从实际工作职能来说,冬冬更像是一名虚拟带货主播。 
    冬冬在北京冬奥会主媒体中心的首秀,便是与主持人一同到北京2022官方特许商品零售店介绍各种冬奥周边商品。 
    而冬奥会开始之后,冬冬也会在每天晚上7点半之后在淘宝直播带货2个小时左右。截至2月8日,冬冬已经连续进行了6场直播,并从2月6日之后,直播间的观看人数就已经稳定在14万左右。 
    拓尔思旗下的虚拟数字人“小思”在冬奥会期间连续进行冬奥热点播报的同时,还正式加盟了本届冬奥会宣传报道的重要媒体之一——国家体育总局官方媒体《中国体育报》。据悉,小思可以实现自动采编、智能写稿、虚拟播报等全自动功能。 
    科大讯飞派出的“3D虚拟冰冰”,在专属H5中带领大家说冬奥。凭借酷似央视主播王冰冰的眉眼和神韵,“3D虚拟冰冰”迅速赢得了众多网友的拥趸。令人拍案叫绝的是,“3D虚拟冰冰”还解锁了东北话、英语等多达31种语言技能。
    
    
    虚拟数字人背后的“黑科技” 
    为冬奥会打工的虚拟数字人随处可见,让人们不禁好奇,这些技能点满满的虚拟数字人,是怎么炼成的? 比如气象播报员“冯小殊”的背后,是微软小冰框架数字孪生虚拟人技术。 
    “冯小殊”之所以能在面容、表情、肢体动作在内的整体自然度和冯殊本尊真假难辨,主要是结合了小冰深度神经网络渲染技术(Xiaoice Neural Rendering,XNR)及小样本学习技术。 
    在语音专家模型、嘴型专家模型及人脸渲染专家模型的训练下,“冯小殊”准确学习了冯殊本人的嘴部动作、眼部及脸部肌肉之间的协同关系,而整个训练周期仅为一周。
    就AI手语虚拟主播来说,其背后的技术分别来自百度和腾讯,其中百度主要为央视电视直播提供手语翻译服务,腾讯的聆语主要为央视频提供手语翻译服务,并上线小聪在腾讯体育上进行手语翻译。 
    AI手语翻译的主要困难在于,手语也有自己的“语法”,语序也并不一定与汉语相同,且手语也存在“方言”,即便是真人手语翻译师也难以保障百分百的可懂度。因此AI手语虚拟主播本质上仍是一个即时翻译功能。 
    由百度开发的AI手语虚拟主播由其数字人平台曦灵打造,主要是通过语音识别、自然语言理解等人工智能技术构建手语翻译引擎,再通过专为手语优化的自然动作引擎奖授予实时演绎为数字人的表情动作。 
    “聆语”则由腾讯云小微联合PCG AI等技术团队共同打造,通过整合多模态交互技术、3D数字人建模、机器翻译、语音识别和自然语言理解等技术优化手语翻译。 
    相关报道显示,百度通过百度智能云构建手语翻译引擎,可懂度达到85%以上,聆语词汇和语句覆盖量超过160万,手语翻译的可懂度可达90%,基本可以满足电视直播手语翻译的需要。 
    作为冬奥会备受瞩目的运动员,谷爱凌的数字分身Meet GU则是则应用了3D人脸关键点位置精确修正、眼眶眼球自动适配、任意姿态人脸配准等核心技术,让3D人脸拟合精度达亚毫米量级。 
    不难发现,和早期基于3D技术和CG动画生产的数字人相比,“超仿真”的虚拟数字人已融入了CG(计算机动画)、CV(计算机视觉)、语音识别、语音合成、图像识别、动作捕捉、自然语言处理、深度学习等最新技术,在声音、语气、肢体动作、外表、行为、交互等多重特征上,越来越媲美真人。
    
    
    虚拟数字人或将迎来大爆发 
    虚拟数字人并非新鲜事物,从二次元偶像“初音未来”到清华虚拟学生“华智冰”、万科财务部虚拟员工“崔筱盼”、央美毕业的画家“夏语冰”、美妆博主“柳夜熙”等,虚拟数字人产业正在站上风口。 
    头豹研究院数据显示,当前虚拟数字人市场规模已超过2000亿元,预计到2030年将达到2703亿元。 
    虚拟数字人可被定义为通过计算机动画等技术打造出的具备数字化外形的虚拟人物,主要分两类,即偶像类的身份型虚拟数字人,以及服务型虚拟数字人。
    相关研究数据显示,身份型虚拟人将在未来发展中占据主导地位,市场规模达到约1750亿元,服务型虚拟数字人总规模将超过950亿元。 
    然而,观察时下火爆的虚拟数字人市场会发现,虽然自2021年以来,各种虚拟人已经层出不穷,但真正在这种国际盛会上展示应用的,除了像洛天依这样的元老级虚拟偶像之外,娱乐型、表演型的公司出镜却并不多,更多的还是以技术驱动,并最终在一定程度上替代人类工作的服务型虚拟数字人。 
    事实上,在画面呈现方式日渐成熟的的基础下,叠加5G、算力、AI等技术能力的提升,虚拟数字人的落地场景日渐丰富。 
    未来虚拟数字人不再局限于传统文娱如影视、动画在人物建模、CG等方面在虚拟形象塑造的应用,还将在社交、游戏、办公等场景实现真实人类虚拟化身的身份职能,并逐渐于直播电商、偶像造星、陪伴服务等领域实现商业变现。
    
    
    结语 
    虽然当前虚拟数字人的发展仍处于初级阶段,其智能化水平还比较初级,无法应对复杂的工作环境,距离大规模商业化应用还有一段距离,但在经受了冬奥会的考验后,虚拟数字人终将迎来的大爆发的一天。
    
    【科技云报道原创】
    转载请注明“科技云报道”并附本文链接