观点 | AI如何推动Metaverse发展?

万向区块链
万向区块链蜂巢研习社第70期邀请到了rct AI联合创始人兼总裁吴显昆分享关于AI如何推动Metaverse发展的思考。
    以下为分享全文,仅代表嘉宾观点,不代表万向区块链立场。

    
    事实上,AI是一个非常广泛的话题,一个直播很难讲到AI的方方面面,今天主要讲讲 AI在虚拟环境中的交叉应用。我会重点讲讲AI技术发展中有哪些跟Metaverse概念相关的东西。
    我们处在从“真实世界”往“虚拟世界”方向进发的历史环境中,真实世界里做了很多事情,主要分为两类:
    第一部分,是我们的肉体要满足的需求,比如说吃喝拉撒等。但是在后温饱的时代,物料供给已经足够充足的时候,有很多行为可以把它放在虚拟世界里。因为在真实世界中的行为是为了塑造自己的identity,比如说你穿什么样的衣服,开什么样的车,去什么样的餐厅,是告诉别人你是一个什么样的人,这样的事情很多都可以被虚拟世界当中的过程替代。
    前一段时间看到罗永浩转发了Shaan Puri的Twitter,说Metaverse其实不是神境化的虚拟空间,其实它是一个时刻,是线上的经济价值,虚拟世界的价值大于物理世界经济价值的时刻。
    如何实现这样一个时刻?主要是把现实生活中塑造identity过程中的很多事情搬到虚拟世界中,当然也包括一些工作、效率上的事情,搬到虚拟世界中,在虚拟世界中你的皮肤可能比你在现实生活中穿的衣服更加能够彰显你的identity。
    我们处于变化的过程中,在这个过程中区块链和AI是天然为虚拟世界服务的,从2015、2016年开始去了解Crypto的话,会发现之前探索到很长一段时间,把Crypto应用到很多物理世界当中的应用案例,比如说版权溯源,甚至是像追溯牛奶品质这样的项目。
    但是这些东西不是特别有效,有很多都会被证伪,因为我们需要真正的虚拟空间,是完全架构在区块链上才比较容易出效果。
    用另外一句话来说,我们可能会觉得元宇宙可以被翻译成另外一种含义,除了刚才说的时间点的理论之外,其实它有另外一个内涵,如果这个世界建构在区块链世界上的话,那我们给这个世界起个名字,就叫做“元宇宙”,我觉得很多业内人在心底有这样的感受。
    在往虚拟世界进化的过程中,一定要有AI的参与。在现实生活中AI参与的很多东西,也会遇到问题,比如我们团队之前把很多精力放在做智能音箱上,我们可以把智能音箱看成在现实生活中不能动的智能NPC。
    如果在现实生活中你要满足这些用户的需求是非常难的,比如说你要用类似的语音助手帮你打车,比如说从杨浦区到徐家汇,只要你把一个字说错的话,那叫车会对现实生活造成很大的影响。
    我们也知道,在AI发展过程中可做图像识别,在现实世界中对于客观物体的物理识别也会有很多困难。比如,用AI去识别一杯水的话也是挺困难的事情,因为要学很多很多图片,很多很多关于一杯水的知识才能知道在现实生活中这杯水是什么样的东西,才能识别出来。但是在虚拟世界中,天然是适合AI生存的。
    比如说在虚拟世界中,如果有一杯水的话,它不是通过识别图片的方式,而是这杯水在建造的过程中会被打上一个标签,说这就是一杯水。我们觉得AI和区块链都是天然更适合在虚拟世界中生存的,如果这两个事情能够结合在一起的话,其实会对人类生活产生很大的改变。
    在说AI具体应用案例之前,可以先讲一个更虚的话题,是我们所要达成的理想的生存状态是什么样子的。元宇宙在很多人的想象空间中它是一个Matrix,它是每个人都戴着VR眼镜在虚拟世界中醉生梦死的状态。
    实际上,我们希望能达到的理想的生存状态,可以用之前我在《禅与摩托车维修艺术》中说的一句话“佛陀在键盘上修行”来解释。
    在物理世界中我们可以更平静而富足的生活,因为我们在物理世界中还有很多塑造自己identity的活动,可以搬到虚拟世界中。由于虚拟世界提供了这几类的自由,比如说肉身不可以得到伤害或消灭,我的空间本质上是无限的,我的通讯是更加自由的。在这几个“自由”的前提之下,对人来说可以进行更广阔的自我探索。
    大家可以看一下《密码朋克》这本书,是朱利安·阿桑奇写的《密码朋克》一书,他认为人类一直需要的几种类型的自由,希望元宇宙能够达到更理想的生存状态,佛陀能够在键盘上修行,物理世界平静而富足,并不是要抛弃物理世界,你可以更好地跟你的朋友、你的亲人沟通,你可以锻炼健身,但有点像宗教先贤给我们塑造的这套生活方式,更自然、更朴素而富足的虚拟世界,给我们提供了更广阔的虚拟探索的空间。
    在谈AI在虚拟世界中扮演的角色之前,我们可以稍微回顾一下虚拟世界的发展历史。
    第一阶段,基于计算机文本所构建的虚拟世界,大概在1960年、1970年阶段之前,是用计算机文本,纯是靠文字构建虚拟世界。
    第二阶段, 加入了包含2D的图像界面为社交元素的虚拟世界,大概在1970年到1980年之间。
    第三阶段,1980年到1990年之间,把用户创建内容UGC特性加入到虚拟世界个体验中,变成了更3D图像、更开放式的、能够包含用户创建内容的虚拟世界。
    第四阶段,1990年到2020年之间,第四阶段比较重要的事情包含了较为完善的经济系统,以及更丰富的UGC工具和较高质量图像、保真度的虚拟世界。
    越到后面会发现有这样一个趋势,改进不仅仅是图像端的改进,包含在虚拟世界中生存人们之间的互动,和在虚拟社会中治理方向的改进。在最原初的状态中,大家会明显感觉到如果我有更接近现实生活中的图像状态的话,它的改进效率是比较高的,以及改进的回报率是比较高的。但越到后来大家越觉得,经济系统上的改进和治理方式上的改进,可能相比较图像的发展来说,也是需要得到变化的。
    第五阶段,2010年之后,可以发现去中心化治理的虚拟世界出现了,有些像Second Life、Sim City这样的游戏当中自治社区雏形会逐渐出现。
    我们会认为到了下一个阶段会是更去中心化的治理虚拟世界,当然,它也会在图像上更加沉浸。
    如果在虚拟世界中要给大家更好的人生体验的话,如果每个人都能成为自己世界中的主角的话,怎么样协调人和人之间的关系,或者创造一种什么样的体验会让大家感觉更好呢?在过程中需不需要引入AI的帮助呢?我们觉得,在第一阶段需要打造用AIGC驱动的更加开源、更加开放的沉浸虚拟世界。当然了,显然来说它应该设立在去中心化世界的底层架构上,被区块链所驱动。
    很多人会觉得Metaverse是一个很难琢磨的名词,也并不指向具体可触可感的技术,比如说你说AI、NLP、NLG都有非常具体的语境,知道我们在用这些技术的时候到底在应用哪些能力,在哪些产品上可能会有落地。在做图像端Computer Vision的时候也知道它需要哪些技术能力,在进一步过程中有哪些进展,在现实世界、虚拟世界中有哪些应用。
    但是Metaverse不是这样的东西,我可以笼统地说Metaverse由一组广泛的协议、技术和互动体验组成的,它是架构在去中心化系统上,同时现在看来很有可能是通过区块链系统的支持来支撑这个去中心化的系统,它可能是沉浸的,也可能是在很长一段时间内是由平面媒体驱动的虚拟环境,它在协议层的很多东西也会跟过去传统的互联网很不一样。
    举个例子,不了解去中心化区块链的人会说区块链只能进行确权,对于很多有效率的传输数据任务是不能达成的。但是,大家可以想一想发展过程中并不是简单地把中心化这套东西和去中心化这套东西简单桥接起来,可能会发明一些新的协议,大家也可以看到有些新的区块链项目做Web2和Web3的连接,有可能在中间加一系列的协议,去除TCP/IP这样的传统协议对隐私、对数据所有权保护的不利因素,我们把一层协议架在去中心化和中心化之间,让中心化的东西也变成有去中心化规范的信息传输标准。
    技术中也包含很多不同的内容,AI、VR、Blockchain、Display、Network、Cloud 等等技术综合组成的体验。互动的方式可能也会从人和人之间到人和虚拟人之间,虚拟人和虚拟人之间都互动组成。比如说在这样一个虚拟环境中,内容的产出不仅仅由一个公司把所有的游戏内容全都体验,或者虚拟环境中的内容全都为你准备好了,你只要买下所有的内容就可以去消费,消费完了就离开内容的形式。可能会转变成更去中心化,更开放的一套系统,能让每个人在系统中建造属于自己的体验。
    除了Player only customer之外,还强调会有Player on the experience的概念。举个例子,比如说在Axie Infinity这样的游戏中,我们知道它是很简单的卡牌对战游戏,如果Axie Infinity像传统游戏一样有证明周期的话,当所有的通证都发完了,那这个游戏就已经寿终正寝了吗?但是按照道理上来说,这些Axie小精灵产权是属于我的,虽然服务器依然部署在比较中心化的服务器上,我既然拥有这些Axie的话,那我能不能利用我所拥有的小精灵构建属于我自己的一套游戏体验,延续这个IP和游戏本身呢?拓展性应该更加强,而不是游戏本身的周期来决定这套体验的周期,它是一套很广泛协议技术体验和互动组成的还在探索的领域。
    构建Metaverse有三个比较基本的元素:
    (1)DAO。我没有用“区块链”一词,因为我想要强调它是关于人和人之间的关系的,它是更去中心化的一套自治组织。在组织中可能会利用区块链上的多种不同工具,相比那些更具体的应用而言,我可能更想强调由人和人之间的协作关系导致变化的这套组织形式变化而衍生出来的效应,所以我用“DAO”一词说明组织形态应该是什么样的,在组织形态下会使用不同的工具,产生不同的体验。
    (2)AIGC。无论是在传统游戏还是像抖音这样的短视频平台,内容主要是由两种东西构成的,一个是PGC,专业的Professional generated content。第二种是UGC,User generated content。一种是中心化的构建方式,第二种是由玩家来驱动的构建方式。
    我觉得这两种都有各自的案例让它表现出来很大的力量。在Metaverse里,我认为AIGC也是重要的一部分,有很多和我们沟通和交流的人会觉得AIGC也可以放在UGC概念里,但是一旦AIGC出现的话,会很大增强UGC在内容创作上的力量。之前很多无论是号称自己是UGC平台的,还是说允许用户自我构建内容的平台,比如说ROBLOX和B站,很多都逐渐变成像PGC这样子的平台,UGC逐渐变成了由专业化的人士构建出来的内容供应者。如果我们能够用AI更大程度上释放玩家的创造力的话,那由UGC模式下衍生出来的内容会有质的飞跃。
    (3)Cloud。用Cloud来代指一系列网络信息传输的网络制式、标准和能力。
    所以说,这三者分别对应了Metaverse的三种特征,一种是大规模、一种是自生长、一种是永续性。而DAO对应了永续性特征,形成保护用户隐私和数据所有权的自治组织。AIGC是提供近乎无限的内容供给,如果我们要去构建虚拟世界的话,虚拟世界应该像生活的物理环境一样,是自生长的环境,在睡觉的时候这个世界也在我们的意志之外自由生长,有AI参与的话,内容供给可能会在我们的意识之外会有自生长的特性。Cloud支撑了大规模的特性,让Metaverse可以超大规模同时在线的特征。
    在我说AI在Metaverse里应用的时候,先梳理一个关系,在Metaverse里如何社交?人和人、人和虚拟人之间的关系会是怎样的?
    Axie Infinity在中心化世界中,人和人的社交是比较重要和主要的社交关系,在Metaverse里人和虚拟人之间也会是非常重要的社交关系,甚至虚拟人和虚拟人之间也会产生非常有意义的社交。
    为什么会这样子呢?因为去中心化的系统里,匿名性是它的重要概念,比如说在区块链游戏中,我觉得Axie Infinity是有账户系统,你也要用E-mail登录。但实际上在Opensea这样的地方,你不用去创建个人账户,它的匿名性本身决定的特性是如果你的行为上像一个真人的话,那么你实际上无法被辨别出来到底是人还是虚拟人。所以,在虚拟的环境中,比起在现实生活中我可以看到你的脸,我会知道你的ID里辨别你是不是真的自然人之外,在虚拟世界里人和虚拟人是更加平权的状态。
    所以,我认为Metaverse里人和人之间是很重要的社交理念,人和虚拟人之间也会是非常重要的社交关系,虚拟人和虚拟人之间也会有非常有意义的社交。
    在社交范式之下,虚拟人可能会扮演比较重要的角色,其实虚拟人也是抽象出来的代表一系列由AI驱动能力的集合,如果我们用AI去驱动很多角色或者是应用能够连接很多人的话,那它可能会成为Metaverse里像手机APP一样的角色,成为信息的收集处理和分发的中心。
    我们也知道,在Metaverse里肯定不希望有个中心化的公司,有个中心化的治理团体来治理所有的东西,如何把很多自动化的东西能够不让很多人扮演服务的角色?如果是自动化的话,其实我们交给AI,交给程序可能会是更好的选择,所以虚拟人可能会成为Metaverse里的信息收集、处理和分发的中介。
    由此可以说,如果我们想要构建大的虚拟世界的话,特别是我们在公司当中可能会有一些项目去设计具体游戏体验的话,除了有每个区块链项目都拥有的网络治理权之外,还有什么区块链原生游戏体验可以跟传统游戏所分别开来?我们就会想到如果虚拟环境当中的很多元素可以用AI的方式重新组合起来,那它内容供给上会非常大的,而且是一个动态的体验、个性化的体验。
    如果让虚拟世界里所控制的每一个角色或者是我拥有的每个虚拟人都能让我编程这些虚拟人的话,那它可以扮演很多不同的角色。这是AI-Powered Narrative或者AI -Powered Capital Native Narrative,AI所赋能的在区块链原生上的叙事体验,这是AI所能发挥作用中的大部分,就是逻辑端。
    实际上它在图像端也会有非常重要的作用,如果我们想要在虚拟世界中构建某些数字的图像资产的话,那么AI也会帮助我们更有效率地构建这些数字资产。比如说在虚拟世界中搭一栋房子,我在虚拟世界中想要表达自己的感情,可能AI可以帮助我更快地构建出来一个我满意的房子,可能AI会帮我挑选出更好的诗歌,可能AI会帮我谱曲。甚至在AIGC的过程中有更奇妙的现在还没有意识到,或者没有发生的一些交互方式,比如说当我们定义AIGC的时候,我们还是认为在操作界面中它帮我们完成一些我们不想完成的步骤。
    但有可能当你在虚拟世界中有非常好的虚拟人朋友,你在过生日的时候他知道你的偏好了,你想要一个蓝色的歌剧院,让你的朋友和你在那个地方聚会,在一起游玩,就会按照你的情感和意愿冲动帮你建造好蓝色的歌剧院。当然,这一切纯粹是由AI来驱动的吗?实际上它是你的意志和情感的表达,只不过我们用更自动化的方式去表达出来了。某种意义上也可以称作是UGC的一部分。
    还比如说,如果我有AI的宠物,这个宠物可以了解我的社交偏好,可能同时同一个模型也去服务了很多其他的主人,每个人都有自己在家里的AI宠物。AI宠物在了解很多人社交偏好的时候,它其实可以起到“社交匹配”的功能,我喜欢什么样的人,它会发现另外一个人和我的契合度很高,可以把我们俩匹配在一起,让我们俩去交朋友。某种意义上,也是构建了虚拟世界中的“你的叙事体验”或者是“你的生活体验”中很重要的一部分。
    总的来说,它可以被分成两大部分,我们是以逻辑端为主的公司,所以在众多虚拟世界、众多Metaverse中希望赋予虚拟生物以灵魂,让它在行为上可以跟我们有互动,在语言上可以跟我们有互动,这一整个行为和语言都总称为一种“内容”,再通过一种更去中心化的推荐算法推荐给用户,让用户在虚拟世界中有更动态化、更个性化、更有互通性的一种逻辑意义上的体验。
    除了逻辑端之外,另外一种就是图像端等方面的体验,AI可以帮助我去构建虚拟世界里的图像,可以在虚拟世界里帮我创作各种各样的文艺作品,可以在虚拟世界中帮我设计衣服等等等等。
    总的来说,NFT是散落在各个地方的数据,Loot的创始人Dom说NFT本身上其实就是“接入一个数据库”,每个NFT最后都有很多数据库。但是用人去把这些纷纭复杂的数据组织在一起,节奏上是很难的事情。如果我们能用一套AI工具把这些数据都组织在一起,给你一个自下而上构建AI体验的话,那么它的效果会非常好,可以有效践行更去中心化的理念,你在虚拟世界中的体验也会更好,因为你是更接近于扮演虚拟世界中的主角角色。
    总的来说,AI跟区块链是纵向和横向的关系,区块链是作为底层平台在去中心化模式下产生了很多各种各样的数据和信息组织的规范和规则。AI可以成为比较中立的生产力工具,把散落在区块链上的各个去中心化信息给组织起来,让它变成可以供去中心化世界里、Metaverse里的参与者参与过程中的内容供给、交互体验等。
    对我们来说,偏向于叙事引擎方面的工作,做了一款产品叫“混沌球”(Chaos Box),使用这个叙事引擎可以分析玩家的交互输入,并且动态地生成虚拟角色交互反应和新的故事情节,在不需要任何脚本的情况下能控制游戏中虚拟角色的行为逻辑,让其自发产生非常智能的行为。
    最后说说Intelligent NFT发展的可能性,我们做了一个非区块链上的虚拟人叫VIDA,主要是给中国高中生做心理疗愈的。另外我们也和次世文化做了一个虚拟男模,也是世界上第一个Intelligent NFT。在这个NFT当中,除了你有一个图像资产之外,我们也提供了接口,你能跟NFT进行对话。宇宙的尽头是什么等等这种问题都可以问,它本身有自己的性格,你可以跟它进行交互。
    以上是我今天的分享,感谢大家的观看。