AI版《我的世界》震撼欧美,AI实时生成游戏成下一个大风口?

雷科技


    把AI融入游戏,已经不是什么新鲜话题了。
    早在2005年的《极度恐慌》中,Monolith Productions就通过引入AI的方法,让游戏中的敌人拥有了简单的思考能力,他们会通过简单的指令进行沟通、会通过玩家的行为判断威胁性,甚至会利用地图和手上的武器进行包抄等战术操作。
    直到今天,极度恐慌里的人工智能系统依然是游戏界广泛学习的样本之一。
    
    随着大模型的飞速发展,如今的AI也呈现出了一种新的面貌。
    英伟达ACE for Games的出现,让NPC们能够按照设计师提前设定好的故事背景、设定以及人物性格,利用大语言模型实时生成与玩家的对话内容,让我们看到了为NPC「注入灵魂」的一种可能性。
    诸如英特尔、微星等公司,也都在开发着基于AI大模型的游戏辅助功能,力求让AI变成陪你我一起打游戏的「助手」。
    不过这些操作,本质上都是在游戏里融入AI赋能以提升体验的做法。
    但你有没有想过,有朝一日,不用游戏引擎,仅靠AI大模型就可以自动生成游戏了?
    不用想了,因为这已经成为了现实。
    近日,初创公司Decart AI和芯片公司Etched宣布,在红杉资本 (Sequoia Capital) 和Oren Zeev等知名投资者的支持下,他们最近成功获得了2100万美元的融资,并打造了一款世界上首个实时、可玩、可交互的AI游戏——Oasis。
     
    
    (图源:Decart AI)
    不同于我们以往介绍过的,在基于引擎打造的游戏中融入AI的做法,Oasis被吹捧为第一个可玩的AI模拟「开放世界」,让玩家置身于一个完全基于大模型生成的世界中,可以移动、跳跃、拾取物品、打破砖块,并基于玩家的不同操作实时生成周边环境。
    我们对于游戏的认知,或许真的要被AI彻底颠覆了?
     AI如何让游戏世界变化无穷?
    想体验Oasis的话,方法其实还挺简单的。
    目前Decart AI已经在网页上公开了一个完全可玩的三分钟Demo,大家都可以通过访问Oasis Al的官方网站来玩游戏。 
    对于国内用户而言,这个网页并不需要任何特殊手段连接,但是Decart AI表示该网页目前仅能在Chrome浏览器上面运行,这意味着大伙不可以在移动设备和其他浏览器(如Safari或Firefox)上尝试该游戏。
    为了让大家知道用不适配的浏览器打开会是什么样子,下面是一个示意图。
    
    (图源:雷科技)
     
    如果使用Chorme浏览器的话,那你会看到这样一个界面。
    Oasis默认给出了五张不同地图的基础图片,包括Mountain Meadow、Desert Expanse、Rugged Coastline、Danse Forest和Village Outpost,甚至支持自己上传《我的世界》截图以生成独特的世界。
     
    
    (图源:雷科技)
     
    对了,还得排队来着。
    还好实际排队的人不多,差不多等了小半分钟就轮到小雷的回合了,简单选个地图进入游戏,我的第一反应是—— 
    这东西也太糊了吧!
    
    (图源:雷科技) 
    当然,模糊是正常的。 
    根据官方介绍,在没有任何延迟的情况下,Oasis在H100上运行时能以360P的分辨率实现每秒20帧的渲染,并实时生成视频交互内容。
    对于我们这些动辄2K/4K,120Hz/240Hz,这样的画面效果确实是有点不堪入目了。 
    不仅如此,即便是在公司的高速网络环境中,我在移动、转动视角时,依然能够感到明显的卡顿感,而且操作间的灵敏度忽高忽低,存在一种非常黏滞的操作感受。
    
    (图源:雷科技) 
    但是,「it just work」
    这玩意居然能够真实运行起来这一点,本身就已经足够令人惊讶了。
    在这个世界中闲逛,你甚至会发现Oasis居然基本掌握了《我的世界》 里较为复杂的游戏机制,例如建筑、空间位置、放置方块、昼夜照明、库存管理、对象理解等。
    如果你能控制住自己的好奇心,不要转过头,那就能沿着默认的视野一直无限地走下去,甚至不会有太多破绽。
    
    (图源:雷科技)
    但是一旦你转头,你就会发现——
    有什么不对劲,刚刚自己走过的绝对不是这条路。
    不仅如此,当你准备重新上路的时候,你会发现前进的目标早已经不见了,甚至被替换成了一道不可名状、有点相似但又处处不同的诡异风景,周围的世界已经大不相同。
    从某种意义上来说,就像是我置身于一个非欧几里得空间那样,一切物质的存在都不再遵循于常理中的透视法则。
    挖掘方块?当然可以。
    
    (图源:雷科技) 
    但是当你挖开方块之后,出现的不一定是方块下的地形,你正在挖掘的方块可能会被任意方块替换,它可能会变成栅栏、变成玻璃,或者是原样待在那里,但就是很难遇到遵循游戏规则的时候。
    而且挖开方块,并不意味着你能捡起方块。
    
    (图源:雷科技) 
    想要放置方块,最快的方法不是挖掘-拾取-放置,而且不断刷新你的角色背包,直到Oasis觉得你应该有一个方块,接着尽力把它拖到你的物品栏,还要注意别被随机替换成别的物品,这样才能开始搭建。
    对了,即便开始搭建,也要确保你的视线不会离开方块,不然就会被Oasis AI刷新掉。
    加上目前网页版的时间限制,这导致想在Oasis中搭建一个房子,变成了登天难事。
    至于完成Oasis制定的挑战?
    
    我在实际进行的五局游戏中,甚至都没能够发现一个除了玩家自己以外的生物,就更别提什么僵尸之类的了。
     比起游戏,更像是互动视频 
    好的,体验部分就到这里,大家感兴趣的话可以自己去试试。
    在经历过如此不同寻常的尝试后,我想很多人的心里都会有像我一样的疑问,这究竟是怎么实现的? 
    作为Oasis的技术支持,两家公司都发布了技术博客,其中Etched提供算力,Decart AI主要负责训练模型。 
    简单点说,Oasis Al是种生成式AI,它可以根据用户提供的输入生成图像或视频。
    与根据用户提供的输入生成图像的Midjourney/Dall-e,或者根据用户提供的输入生成视频的快手可灵类似,Oasis Al会利用了经过大量《我的世界》游戏视频训练的数据,在我们游玩时实时创建对应的游戏帧。
    
    (图源:Decart AI)
    和图像或视频生成应用不同的是,在经过训练后,Oasis已经能够了解基础的游戏机制,例如用户面前存在台阶就需要跳过去、多个栅栏之间可以连接起来等,但是对距离和空间感的把握依然有待提高。
    所以,从本质上来讲,这只是一个根据玩家交互实时演算的AI视频罢了。
    无独有偶,今年8月,谷歌发布了世界上第一个完全由神经模型驱动的游戏引擎GameNGen,可以在单个TPU上以超过20帧每秒的速度交互式模拟经典射击游戏《DOOM》
    效果的话,可以参考下面这张动图。
    
    (图源:GameNGen) 
    当时就有人声称,从此不再需要游戏引擎,AI大模型能基于扩散模型,为玩家生成实时可玩的游戏。
    但是在我看来,这个未来距离我们还挺遥远。
    原因其一嘛,在于资源的消耗。Oasis背后消耗的计算资源难以估计,而最终实现的效果也仅仅是一款360P/20FPS的游戏,而GameNGen目前甚至没有可以实际游玩的Demo内容,对性能的要求是其中不可忽视的重要一环。
    其二在于,目前AI其实并不能很好地掌握资源的概念。在Oasis的实际体验中,玩家的仓库内容和数量可以说是在持续、没有规律地变化着,这也符合我在日常大语言模型交互过程中难以让其定义常量和变量的情况。 
    最重要的一点,在于这类AI制作游戏的原理。不管是《我的世界》还是《DOOM》,本质上都是在世界赛广为流传、享誉盛名的游戏杰作,这才让AI企业们得以获取大量的视频资源训练出对应的游戏模型。
    那如果是一款新游戏呢?
    只有概念、没有美术、没有设计、没有视频,没有了前任铺垫的基础,现在的AI制作游戏无异于空中楼阁。
    Oasis会是一个好的开始,还是另一个被大肆炒作的AI理念呢?或许只有时间能给我们答案。
    


           来源:雷科技