2022年虚拟人行业发展研究|千际报告
资产信息网文|微信公众号:资产交易信息
第一章 行业概况
虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物。虚拟人可分为服务型虚拟数字人、身份型虚拟数字人。
1.1 虚拟人分类
虚拟人有多种分类方式:第一种依照技术分类,虚拟人可分为算法驱动型(AI 实时或捏脸 等)和真人驱动型(动作捕捉);第二种依照视觉维度分类,虚拟人可分为 2D 型和 3D 型;第三种依照结构组成分类,虚拟人可分为数字型(用户线上观看)和全息型(用户现场裸眼观看);第四种依照商业模式分类,虚拟人可分为 IP 类(KOL 型、歌舞型、品牌型、娱乐公司推出的偶像型、明星分身型)和非 IP 类(功能型、学术型和身份型)。
表 虚拟人分类
资料来源:资产信息网 千际投行
虚拟数字人具备以下三方面特征:
(1) 拥有人的外观,具有特定的相貌、性别和性格等人物特征;
(2) 拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;
(3) 拥有人的思想,具有识别外界环境、并能与人交流互动的能力。
图 虚拟人行业产业链结构图
资料来源:资产信息网 千际投行 Wind
虚拟偶像是虚拟数字人较早被认可的细分赛道之一,属于身份型虚拟数字人。在群众娱乐需求持续增长以及网络和影像音频技术不断迭代的环境下,我国虚拟偶像产业逐渐走入发展的高峰期。数据显示,2020年,我国虚拟偶像市场规模为34.6亿元,较上年同比增长68.8%;2021年,我国虚拟偶像市场规模约为62.2亿元,较上年同比增长79.8%。
图 2017-2021年我国虚拟偶像市场规模及增速
资料来源:资产信息网 千际投行
虚拟主播则属于代表性服务型虚拟数字人。虚拟主播能够降低主播行业成本,为存量市场降本增效,且随着其趣味性优势凸显,虚拟主播规模快速增多。目前我国主播账号累计超1.3亿,其中虚拟主播占比40%。
图 我国虚拟主播占比情况
资料来源:资产信息网 千际投行
1.2 虚拟人应用
国内虚拟数字人还应用在游戏、金融、文旅、教育、智能服务等实用场景。
(1) 游戏
如《英雄联盟》的人气女团K/DA登陆S8决赛舞台,现场观众能够通过AR设备进行观看;《王者荣耀》推出男团无限王者团;网易伏羲Al Lab携手密歇根大学发明面部捕捉深度学习算法MelnGame,仅需玩家上传一张人物肖像照片即可生成虚拟面部的形状和纹理。
(2) 金融
如华为云打造了首个虚拟数字人云笙入职华为云;百度打造了首个国内银行“虚拟员工”。
(3) 文旅
如京东进口超市推出了虚拟推荐官“ViVi子涵”;网易伏羲首个AI智慧文旅项目落地杭州中国丝绸城,该项目将《逆水寒》中人设、技能与丝绸文化高度相关的“素问”流派虚拟人融入数字展厅,用户可通过按下琴键进行实时互动,“素问”将随旋律变化而起舞。
(4) 教育
如央视新闻联合百度智能云推出的总台首个AI手语主播正式亮相;虚谷未来科技推出全国首位教育领域虚拟人小艾,其人设为喜欢阅读、善于分享的12岁少女,旨在以领读陪伴的“班长”身份激发少儿阅读兴趣。
(5) 智能服务
如搜狗与新华社联合发布的虚拟主持人以高仿真形象示人,可对用户输入的新闻文本进行语音播报;浦发银行首位虚拟员工“小浦”在服务客户时可感知对方情绪并辅之表情和手势,且具备主动学习、持续提高服务效率的能力;百度App上线龚俊数字人语音助手。
第二章 商业模式和技术发展
2.1 产业链、价值链
虚拟人产业链可分为基础层、平台层和应用层。基础层和平台层主要面对的用户是企业, 而应用层主要的用户是消费者。基础层为工具层,软硬件作为虚拟人开发的基石。比如 VR/AR 等 3D 显示设备给使用虚拟人的用户带来了沉浸感和真实感,建模软件可以对虚拟数字人的人体、衣物进行三维建模。
基础层的代表企业有 Meta、影创科技、EPSON、英伟达、Unity 和 Epic Gmaes 等。平台层是虚拟人解决方案的提供商。平台层利用建模、渲染、动作捕捉等技术让虚拟人活过来,知名企业有 Vicon、腾讯、百度、搜狗、商汤科技、创幻科技和科大讯飞等。应用层为虚拟人添上“灵魂”,打造及运营虚拟人人设,最终应用于多样的场景。应用层领先企业有蓝色光标、芒果超媒和次世文化等。
图 虚拟人产业链图谱
资料来源:资产信息网 千际投行
图 虚拟人行业产业链全景图
资料来源:资产信息网 千际投行
当前虚拟数字人通用系统框架及运作流程:虚拟数字人系统一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互等 5 个模块构成。
人物形象根据人物图形资源的维度,可分为 2D 和 3D 两大类,从外形上又可分为卡通、拟人、写实、超写实等风格;语音生成模块和动画生成模块可分别基于文本生成对应的人物语音以及与之相匹配的人物动画;音视频合成显示模块将语音和动画合成视频,再显示给用户。交互模块使数字人具备交互功能,即通过语音语义识别等智能技术识别用户的意图,并根据用户当前意图决定数字人后续的语音和动作,驱动人物开启下一轮交互。
图 虚拟人通用系统框架
数据来源:人工智恩能够产业联盟
1 2 3 4 下一页>