Web3 与虚拟人将如何重塑社交体验

2024.04.22 区块律动BlockBeats

    原文标题：《Virtual Beings - A New Internet-Native Medium for Shared Storytelling》
    原文作者：Justin McAfee @1kx
    原文编译：比得潘 @律动 BlockBeats
    这是一种新的互联网原生媒体共享故事，我们共享的社交体验日益虚拟化的特性将在未来几十年内增加 Virtual beings（虚拟人）的数量。
    虚拟人是完全存在于数字领域的实体或角色，通过社交媒体互动、游戏和互联网原生空间等共享媒体以及全息技术跨越来到我们的世界。它们不仅有人类使用动作捕捉技术操纵控制的虚拟化身，还有将一切感知完全虚拟化的 AI。
    因此，虚拟人包含了多种技术趋势，如 VR/AR、人工智能、高保真 CGI 艺术、游戏、社交媒体，也涵盖了人类社会心理学如社会关系、对陪伴的渴望、文化泛灵论、拟人化设计等特性。

    而 Web3 有可能通过新的创作者收入模式、互联网原生组织结构和支持加密的数字所有权进一步加速这些数字意识的出现。
    TL;DR
    1）定义并简要讨论不同类型虚拟人的历史和特征；
    2）回顾这些虚拟人在创建过程中使用的一些现有技术堆栈；
    3）确定加密经济学和 Web3 技术可以在那些领域改进虚拟人的创建、管理和分发；
    4）突出显示虚拟人领域现有的知名项目；
    5）推测 AI 和合成媒体时代 Web3 社交体验的未来，如「Generated media」（生成媒体）、AI 生成媒体、个性化媒体；
    通过回顾虚拟人的多个方面，这篇文章希望阐明这个概念会作为一种趋势，可以显着受益于 Web3 技术堆栈的使用。
    虚拟人的类型
    虚拟人有多种类型，复杂性也各不相同。
    VTubers
    据 Virtualhumans 介绍，VTubers 通常是人类使用一系列面向消费者的动作捕捉技术和角色创建软件创造的虚拟人物，在流行的视频平台上直播他们生活，如 YouTube、Twitch、Niconico 和 Bilibili 等流媒体上传播。
    最早，VTubers 于 2010 年代中期起源于日本，到 2020 年代初期逐渐发展成为一种全球现象。通过使用实时动作捕捉技术来操纵虚拟化身，VTubers 在一系列平台发布视频，以吸引被他们创建的角色所吸引的粉丝群。
    追溯到 2010 年 2 月，当时视觉小说制造商 Nitroplus 开始将内容上传到他们的 YouTube 频道，并使用他们的吉祥物「Super Sonico」讨论了即将发布的版本。然而，在 2016 年底这个现象来到了一个临界点：「Kizuna AI」在 YouTube 开始了首次亮相。

原视频链接
    Kizuna AI 首次创造了「Virtual YouTuber」（简称 VTuber）这一称呼，并凭借着回答粉丝的问题和评论的亲和力拉进了与他们之间的距离。在十个月内，Kizuna AI 就将她的粉丝群扩大到 200 万订阅者。
    Kizuna AI 大获成功后，VTuber 的潮流在日本开始风靡，并通过对动漫和漫画迷的吸引力在国际上逐步扩展。此外，2020 年 COVID-19 大流行期间，Twitch 收视率的急剧增加则进一步提高了日本以外地区对 VTuber 的熟悉度，并导致 Twitch 上为其单独创建了一个 VTuber 标签；而 YouTube 也在其 2020 年文化和趋势报告中将其列为了主要趋势，强调该概念在当年 10 月已增长到每月 15 亿次观看量。
    如今，VTuber 正利用与粉丝互动、准社会关系、数字化身和讲故事的能力，创造出比人类主播更有趣且充满活力的角色，已有超过 16,000 名 VTuber 在社交媒体平台上拥有数百万粉丝。其中广受欢迎的包括Gawr Gura、犬神科隆、Nyanners、Ironmouse、Kiryu Coco、Code Miko 和 Ai Angelica 等。

日本 hololive production 旗下 Gawr Gura 的 VTuber 形象
    而在 Web3 中，NFT 同样以创建狂热的粉丝群、社区互动和归属感而著称，因此它们与 VTuber 有着非常高的契合度。同时，一些 VTuber 已经开始试验这项技术，Kizuna AI 宣布从 2022 年 2 月开始停更将会花更多的时间来进一步探索 NFT 的用例。
    此外，VTuber NFT 最明显的用例是创建 Token 来控制内容和 Discords，以及创建数字收藏品。但另外两种更突出的可能性或许是：「权限管理」和「头像市场」。
    因为完全可控操纵的角色模型可以由第三方创建并以 NFT 的形式分发，这是对现有市场和委托系统的升级，创作者可以更好地跟踪其模型的使用，同时获得二次销售收入。Anata 就是这样一个实验项目，它推出了 1000 个男性和 1000 个女性的 Live2D VTuber 头像 NFT，这些 NFT 在流媒体应用程序中具有完整的功能。
    Virtual Influencers
    Virtual Influencers（虚拟影响者）是在计算机图形软件中创建的数字角色，并赋予了它由第一人称世界观定义的个性，然后在媒体平台上访问以获得影响力。

Virtual Influencer Imma
    Virtual Influencers 的生活方式被描绘在社交媒体上，通过多种媒体与粉丝进行互动，并经常被品牌用作其产品的代言人。然而，与普通名人不同，Virtual Influencers 是 CGI（Computer-generated imagery，电脑三维动画）生成的角色，因此可以是任何人，可以做任何事情，并在数字世界的任何地方走动。它们不受物理限制，可以同时出现在两个地方，也永不疲倦，永不脱离剧本。
    其中，最著名的 Virtual Influencers 之一是 Lil Miquela，一位 19 岁自称机器人的流行歌星，她住在洛杉矶，曾为 Prada 做过模特，出演了 Calvin Klein 广告，在 Coachella 接受采访，并在 Spotify 排行榜上名列前茅。2020 年，Lil Miquela 为她的母公司 Brud 赚了大约 1200 万美元。
    像 Lil Miquela 这样的 Virtual Influencers 赞助商与她们的合作率几乎是其同行的三倍，因为她们能够控制自己的身份。而很多名人赞助商曾为一些品牌犯下的错误付出过高昂的代价，但这对于整个生活都被脚本化控制的 Virtual Influencers 来说则是永远不会发生的。

    除了便于控制之外，Virtual Influencers 还为品牌提供了跨多平台和形式讲故事的能力，这种方式是人类同行还无法做到的，即所谓的跨媒体讲故事，这种形式为故事或角色提供了不同的访问点。要了解这种方式，可以参考曾在 Fortnite 中举行的 Travis Scott 音乐会。
    为了在该游戏中表演，则必须为 Travis Scott 创建一个化身，并且你知道这实际上不是他，只是他在游戏中扮演一个化身。或者，Virtual Influencers 在所有平台上看起来都是一样的，这创造了一种叙事咒语，而现实生活中名人的肉体到数字的转录是不可能的。
    迄今为止，品牌与 Virtual Influencers 互动最突出的地方是在时尚领域。Virtual Influencers 在社交媒体上摆姿势时，通常会穿着最新的服装。她们的脚本化控制使其能够为自己的品牌打造特定的生活方式元素和个性。如 Lil Miquela 出席了在米兰举行的 Prada FW18/19 秀场，Shudu Gram 则成为 Balmain 模特的数字面孔，Noonoouri 成为了最初由娜塔莉波特曼主演的「胭脂」活动的一部分，而迪奥的广告也增色不少。

    目前，Balenciaga、Alexander McQueen、Valentino、H&M、Nike、Salvatore Ferragamo 等主要时装公司都接受了 Virtual Influencers 来展示他们的产品，而 Prada，甚至考虑将创建自己的内部 Virtual Influencers。
    此外，音乐也是 Virtual Influencers 一个广泛应用的领域：
    - Yameii Online 的曲目《Baby My Phone》激发了多个 Tik-Tok 的合拍趋势和混搭，在数十万个视频中达到数百万次观看量；?
    - Kai，一位 16 岁的 Roblox Virtual Influencers，以创建游戏 Splash（最近从投资者那里筹集了超过 2000 万美元）而闻名，他在 7 个不同的 Roblox 场地同时向超过 10 万名粉丝表演了超过 48 小时；?
    - Riot Games 为宣传新游戏角色而创建的虚拟 K-Pop 女团 K/DA 凭借病毒式音乐视频和歌曲「Pop/Stars」在 Youtube 上获得了 5.08 亿次观看量；?
    - FN Meka 在社交媒体上说唱，同时展示了星巴克品牌的 PS5 和 AR 运动鞋等超稀有商品。
    最近，Virtual Influencers 文化还开始与 Web3 产生了进一步融合：Dapper Labs 收购了 Lil Miquela 背后的工作室 Brud，多个 Virtual Influencers 推出了 NFT，包括 Lil Miquela、LV4、Rae、Shudu、FNMeka 和 Yameii，以及主要的 Web3 工作室，如 RTFKT 与 Virtual Influencers 合作推广他们的 NFT。
    未来，Web3 和 Virtual Influencers 的融合还将更加令人兴奋，如在活动或广告中进行使用，并且 Virtual Influencers 将以去中心化的形式通过 DAO 来策划他们的故事，以及接收分配流向社区国库的收入。
    分布式角色
    分布式角色是由开放且无需许可的社区管理的数字角色，粉丝们使用该角色创作音乐、动画、视频、传说等内容。分布式角色在某种形式上可能是自主的，如 AI 艺术家，但最终还是由社区来管理。因此这与 Virtual Influencers 不同，不是由拥有一个权威或专门的工作室进行管理。
    目前，分布式角色中最好的案例之一是「初音未来」，这是 Crypton Future Media 于 2007 年发布的日本 Vocaloid 软件语音库，Vocaloid 允许用户通过输入歌词和旋律来合成歌声。因为每个 Vocaloid 都有自己的特点，且实际上是独立的「歌手」，所以他们通常以「Moe anthropomorphism」（萌拟人化）角色发行，而其中最成功的便是初音未来。

    最初，初音未来是在「无混音」许可下发布的。出道以来，她出演了数十万首由来自世界各地创作者和粉丝制作的歌曲和音乐视频。并且免费软件程序 MikuMikuDance 催生了用户生成动画的热潮，甚至包括在世界各地的粉丝参加现场的全息表演中，而初音未来的分布式特性和她核心的混音文化促使 Crypton 为该角色采用了非商业性的署名知识共享许可。
    另一方面，初音未来是一个非常成功的分布式软件，它拥有一个去中心化的创作者社区，来为虚拟人创作新歌曲和动画，并且仅在前五年通过音乐、商品、全息音乐会和可共享媒体获得的总收入就超过了 1.2 亿美元。因此这种模式非常适合 DAO——人类创作者发布新的音乐和舞蹈，对内容进行投票，并将收入收集到社区拥有的国库中，而一些分布式角色也已经开始尝试这个想法。
    例如，Botto 是由原生治理 Token BOTTO 持有者控制的去中心化自治 AI 艺术家。Token 持有者通过质押 $BOTTO 以获得不可转让的投票权 (VP)，用于每周对 350 件 AI 生成的艺术作品进行投票。每个时期结束时，得票最多的作品将在 SuperRare 上作为 NFT 拍卖，所得收益用于回购和销毁 BOTTO。迄今为止，Botto 已是市场上收入最高的艺术家之一，总销售额超过 200 万美元。
    而由于创意 AI 具有无限创造新作品的能力，人类策展或将在新经济中发挥着重要作用。通过管理分布式角色的策划、分发、推广和治理，同时从价值创造中受益的 DAO 可能会催生 AI 或人工生成的数字角色制作的新时代。
    自治实体
    自治实体是通过在机器中模拟 AI，这些机器被编程为像人类一样思考并模仿他们的行为，其也可以应用于任何表现出与人类思维相关的特征的机器，如学习和解决问题。
    而前面提到的三种类型虚拟人是以一种或另一种方式广泛地由人类控制，然而，这不是虚拟人的最终类型。自治实体将使用人工智能和其他工具来模拟生活，包括聊天机器人、虚拟世界中的 NPC、以及人工智能伴侣和数字轮回等类型。
    AI 伴侣
    最简单的自治实体形式之一是 AI 伴侣，年轻一代对人工智能的信任和接受程度的提高似乎预示着人类与人工智能实体建立密切联系的未来。围绕这个想法形成的整个商业模式，像 Replika 这样的公司提供友好的聊天机器人，全天与他们的人类互动；Hybri 则提供定制的 3D 模型机器人来模拟浪漫的陪伴关系。
    目前，AI 伴侣市场的增长已经很明显：从微软剥离出来的小冰最近估值为 1 亿美元，在孤独症流行的背景下（61% 的受访成年人认为孤独感显着上升），对话式人工智能市场预计到 2024 年将增长到 13.9 亿美元。

图源：毕马威
    而 Web3 中一个专注于 AI 伴侣的项目则是 Petaverse Network，它借鉴了从 Tamagotchi 到 Nintendogs 的虚拟宠物的悠久传统。Petaverse Network 寻求为虚拟宠物创建一个可互操作的数字标准，在链上发布它们的个性，使其永远存在。这种个性代表了宠物的数据层，当用户在游戏、AR 和 VR 中与之交互时，该数据层会随着时间的推移而更新。并且其他项目也将能够建立在这个数据层之上，为他们自己的虚拟世界和游戏重新解释宠物。
    数字轮回
    进一步扩展 AI 伴侣关系，人工智能可以在个人的数字足迹上进行训练，以在他们死后复制他们的行为，即所谓的数字转世。有了足够多的短信、社交媒体帖子和视频作为训练数据，神经网络就可以学习模拟死者的言语和举止，同时以逼真的 CGI 模型或聊天机器人的形式展示自己。
    最近，有报道称 Joshua Barbeau 使用软件创建了一个由 GPT-3 支持的超现实聊天机器人，通过对已故未婚夫的短信进行训练来重现与她交谈的体验。但由于数字轮回的敏感性，因此权限管理至关重要，而需要质押才能访问的加密 NFT 可能是确保这些数字副本不会在互联网上其他地方使用的最佳解决方案。

图源：《旧金山纪事报》
    不过，自治实体不仅限于 AI 伴侣或数字轮回，也可以是虚拟世界的代理。当今我们探索许多虚拟世界的一个明显问题是仍会感到空虚，那么用高度智能的 NPC 来填充虚拟世界将是赋予这些环境生命的一种方法。可以想象以下情景：
    - Decentral Games 的虚拟赌场配备了高度智能的聊天机器人；?
    - 浏览 24/7 全天候销售数字商品并拥有 AI NPC 居住的 Cryptovoxels 商店；?
    - 使用个性鲜明的拟人化交易机器人；?
    - 使用预言机数据反馈并适应外部变量的链上生物；基于用户在多个游戏中的行为，
    - 使用随着时间的推移在道德上进化的游戏角色。
    因此具有人工智能的虚拟人在数字领域的可能性将是无穷无尽的。
    虚拟人技术堆栈
    虚拟人一般在以下各种技术和创意基础设施上运行和操作。
    AI
    虚拟人的自主程度各不相同，从完全由人类控制（如 Vtuber、大多数 Virtual Influencers），到由自然语言处理 (NLP)、计算机视觉和用于记忆存储、情感、动机等。该领域中一些最常见的工具是 OpenAI 的 GPT-3，这是一种大型语言模型，在描述与实际实体的对话方面非常准确，又或者是机器学习算法，随着交互的发生和时间的推移来更新基础数据集。
    尽管当今许多自主虚拟人都在集中式 AI 基础设施上运行，但 Web3 中的两个著名项目则采用了不同的方法在链上重建 AI。
    基于「iNFT 标准」的首个项目 Alethea AI 去年在苏富比以 478,800 美元的价格售出了 Alice。iNFT 将 GPT-3 个性提示散列到 NFT 的元数据中，随后在诺亚方舟平台上解密并用于生成对用户输入的 GPT-3 响应。这些 iNFT 可以通过与用户的多次互动进行训练，随着时间的推移在不同级别的智能中取得进展。因此用户可以通过将任何 NFT 与个性 pod 配对并结合用户交互和 $ALI 代币质押来对其进行训练，从而创建他们喜爱的数字资产的 iNFT 版本。
    Altered State Machine 则采用了不同的方法来实现类似的目标。ASM 中的代理从一个表格（代理的图像或模型）和一个大脑（一个带有「基因组」矩阵的基础 NFT、一组随机的基础值和一个记录状态变化的记忆树）开始。GPU 云计算提供商使用他们的硬件为特定的 ASM 应用程序（例如流行的游戏或 DeFi 交易机器人）运行训练算法，类似于挖矿与 PoW 区块链的工作方式。这些培训课程的输出称为记忆，并以 ONNX 格式记录在记忆树中，修改价值矩阵以提高该特定应用程序的技能集。
    ASM 的第一个概念证明则是 AIFA，这是一款 AI 足球游戏，它使用了 Unity、IPFS 和示例 Training Gym 的组合。然而，ASM 希望将其代理的应用扩展到之外，其提出了一些包括 DeFi 交易代理、游戏角色代理、聊天机器人和数字助理等概念化想法。
    所以链上 AI 代理创建的设计空间在很大程度上仍未被探索，看到该领域的发展将是令人兴奋的。重要的是，从工作量证明到权益证明的转变意味着大量 GPU 将寻找替代用途，因此使用 GPU 挖掘的去中心化 AI 模型也可能是下一个前沿。
    3D 建模和动画
    虚拟人所有迭代的核心是使用 3D 建模、动画或动作捕捉技术。虽然虚拟人具有多种图形美学和形式，但都需要为动画或运动而装配基本的模型，这些模型的市场和存储库已经存在，而 NFT 则可以为其金融化提供额外的途径。
    如今，在虚拟人和 VTuber 的建模和动画中最常用的应用程序包括Unity、Unreal Engine、Blender、iClone 和 FaceRig 等。
    虽然一些虚拟人不会试图看起来像照片般逼真，但那些确实需要大量工作的虚拟人，设计师经常需要努力克服 Uncanny valley（恐怖谷），这是人类在观察不完美渲染的人脸时所感受到的与生俱来的不安和厌恶感。但随着新一代人更习惯于与 CGI 和人形机器人交互，恐怖谷效应的流行可能会随着时间的推移而降低，不过就目前而言，人形角色的渲染还是必须考虑到这种物理厌恶。

    逼真渲染的关键限制是由计算机处理能力所决定，如高保真面部的渲染需要具有足够多的细节和变形控制，以及纹理图像和高光贴图的网格 3D 模型，所有这些都是密集型的。
    而服装模型同样也是密集型，主要由于次表面散射（如丝绸反射光的方式与棉花不同）导致 CGI 和游戏工作室以及时尚行业对计算机辅助服装设计的强烈需求。专门从事 NFT 模型和数字设计的 Artisant，以及 The Fabricant、The Dematerialized、DIGITALAX、Tribute Brand 和 RTFKT 等数字时装公司如果继续采用 Web3 技术，将会进一步占领虚拟空间的市场份额。而随着虚拟人物的不断普及，数字时装也可能会同步增长。
    此外，头像创作的难度将有助于为 3D 模型创建充满活力的市场，创作者将其模型的权利出售给那些希望在数字艺术、游戏、电影等中使用它们的人。而 Web3 在这里则释放了额外的机会：可以转售的 NFT 3D 模型，二次销售费用回馈给原始创建者，超流畅的支付流可以在虚拟世界中使用的同时控制模型，通过加密文件进行权限控制，必须质押解锁等。
    在动画方面，3D 网格则将被绑定到骨架上，然后可以通过代码或用户操作进行动画处理。目前，将动画和手势与 NFT 相结合的实验已经开始，HEAT 代表了这一运动的前沿，希望为可应用于 3D 模型的动画打造市场。通过将 .glb 和 .gltf 文件重新定位到 3D 模型的骨骼结构，HEAT 将能够为虚拟世界中的任何标准化头像文件创建可互操作的运动文件。
    虚拟人工作室
    构建虚拟人所需的团队规模在很大程度上取决于其复杂性。任何人都可以使用 VRoid Studio、FaceRig 和流媒体设置来创建一个简单的 VTuber 角色，但 Virtual Influencers 或自治实体可能需要 AI、动画、语音合成、建模、内容创建等方面的专业知识。
    虚拟人工作室通常拥有致力于 CGI 艺术、摄影、动画师、故事讲述者、社交媒体策划师、时尚战略、业务发展、公关、财务管理、商品营销等方面的团队。这些工作室可以专注于单个角色的管理，也可以专注于创建大量角色。例如，Shudu Gram 背后的 The Diigitals Agency 共管理着 7 名 Virtual Influencers；Lu of Magalu 则得到巴西最大的电子商务企业之一的支持，SuperPlastic 管理着 Janky & Guggimon、Dayzee & Staxx、Kranky、ShuDog 等。
    而 DAO 作为一种组织内容、创造粉丝体验的手段非常有效，随着时间的推移，整个去中心化的虚拟人工作室将会形成，无论是管理个人和集体角色的 DAO，还是为那些希望将虚拟人集成到他们的项目中的人作为服务 DAO 运营。
    值得一提的是，CULTUR DAO 是最著名的去中心化虚拟人工作室，自称 Web3 Pixar。通过用 Token 来控制 Discord 和内容，一群艺术家、技术人员和传道者使用共享的经济激励措施来推动该领域的创新。同时，委员会围绕化身、AI、语音合成、故事创作以及对现有 AI NFT 基础设施的实验而成立。
    最近，他们的黑客松也产生了许多有趣的项目，包括 Decentraland AI Chatbots、虚拟人芭蕾舞、会说话的 Cryptopunks、AI 字符记忆测试和一种类似电子宠物的虚拟猫 Kittygotchi 等。
    合成社交媒体
    合成媒体是 AI 生成的个性化媒体内容，且数量正在激增，而虚拟人是这一社交媒体层的进一步延伸。虽然现在虚拟人可能仍会感到陌生，但不难想象，在一两代人之后，它们将会变得司空见惯并被社会所广泛接受。
    目前，Deepfake、社交媒体机器人和拟人化智能设备都已经使人类和虚拟人之间的界限越来越模糊，且随着年轻一代更频繁地与虚拟人互动，这种情况还将继续发展。有数据显示，几乎 15% 的 Virtual Influencers 受众是介于 13 至 17 岁之间的年轻人，这是是普通影响者平均水平的两倍。
    因此这种虚拟人合成社交媒体的初始阶段已经到来，如人类与虚拟人结婚的新闻、Hybri 等约会应用程序、专用虚拟伴侣平台，以及拥有比人类更具影响力的 Virtual Influencers、我们对人工智能日益信任等。

    而 Web3 技术将为这些合成社交媒体体验的创建和管理提供了额外的访问点。如 NFT 支持的所有权层、互联网上无数利益相关者的去中心化治理，以前的网络迭代中不可能实现的收入模型、区块链的持久性等都将为合成社交媒体开辟新的前沿。因此加密技术、分散的互联网组织和虚拟世界是建立新的合成媒体现实社交层的基础。