这个元宵节，我看到了AI的野望

2024.03.26 当下科技

    文／当下君
    图片／来源网络
    刚刚过去的元宵节，收到了好几个朋友发来的贺卡，虽然画风奇特且中西合璧，但仍然让笔者反复把玩，原因是这些精美的画面，完全是由AI自动生成的。
    现在，对于这类现象，一个新名词出现了——那就是AIGC（AI Generated Content）。
    有人觉得这只是AI厂商的节日营销，但笔者却认为，一个巨大的风口其实已经隐隐出现，它实际上是由日渐严重的原创内容荒和网民们日益增长的内容需求共同催生的。
    如果你感觉到无论是短视频，还是公众号里的图文内容，甚至是内容型社区里的原生内容的新意在不断的下降，抑或是根本就是在彼此复制创意以至于大量低水平重复内容反复出现，你的感觉可能是对的。
    从web2．0开启至今的UGC模式可能已经出现瓶颈，创作者日益难以满足十亿量级的网民并发的内容需求。
    而AIGC虽然在如今提供的内容仍然比较初级和幼稚，然而一旦你明白其内容生成的机理和成长空间，你或许也会认同，由AI大量生产消费级原创内容的这一天是迟早会到来的。
    1、AIGC时代终将到来
    当第一台电子计算机出现在世界上，并以bytes为单位来存储信息，当第一个互联网络（阿帕网）开始实现信息的实时交互后，我们就开始了用数字方式消费信息的时代。
    这个阶段的早期，人类在数字世界的主要建设工作，其实就是在开始创造一个现实世界中知识系统的数字镜像，进而实现从数字孪生到数字伴生，再到数字原生的跃迁。而内容或者说信息，始终是人类最核心的数字消费内容。
    例如，谷歌、百度为代表的第三代搜索引擎，其实就是在用数字化的手段去完成从UGC到PGC再到AIGC的演进。
    我们曾经以为内容是永远消费不完的。
    最初的互联网上，数以千万页计的新增数字内容，其实是以扫描书籍并形成图片的形式提供的，它实现了初步的知识在线化，可以迅速访问，但交互性很差。
    此后的若干年，互联网上主要的内容生产变成了可以直接编辑、修改、创造的文本，互联网民开始生产大量的图文原生内容；特别是所谓的web2．0时代以后，UGC（用户原创内容）迎来了一波又一波的井喷——在bbs里、在百度贴吧、知道这样的知识社区里，在博客、微博、短视频打开的一个个内容赛道里，为用户创作内容所提供的工具层出不穷，不断降低创作成本和增加创作收益，一个由UGC推动的时代终于开始了。
    而今，人们能够用多模态（语音、图片、视频）去搜索并携手创造各种新互动内容，也能够依靠搜索引擎、信息流去分发这些内容，一个UGC内容消费的闭环已经形成并产生了巨大的经济效益。
    如今，因为每个人都从理论上拥有UGC的权利，所以，我们可以假设10亿中国网民都是UGC作者，但事实上并非如此。
    其实也不难感觉到，天涯这样的老牌论坛上新的内容越来越少，知乎、B站上因为高水平新内容促成爆款的频次也在降低，快手、抖音这样平台的日活数据也基本上停留在2年前的水平……而且，很多人都觉得，内容社区质量最好的往往在开创的头几年，此后内容的质量下降、创意抄袭的现象，会严重到肉眼可见、可感的程度。
    这种现象的形成，除了和人口红利的增长已经彻底消失等结构性因素有关以外，其实也提出了一个新的命题——当互联网把10亿级的消费者连在一起后，他们并发的内容消费需求，已经远远超过了内容的供给能力，UGC只是减缓了“内容荒”时代的到来，但没法阻止这一天的到来。
    你可以设想，如果你每天看到的文章都在重复，短视频平台上刷不到新鲜有趣的视频，电影院里没有高质量的电影，甚至你和身边人的话题也都了无新意……这是一种什么样的感觉？
    只有明白了这个道理，我们才能认识到，其实人类在内容创造上的能力或许是弱于对内容需求的增长的，而一个经济体越发达，其显而易见的特征就是对精神内容消费的提升越明显，甚至在对物质的消费上也要附着更多的精神特质。
    但一个解不开的结就是——优质且受欢迎的内容生产速度会更慢、数量也会更少，内容的生产无法满足消费的需求的时代其实已经到来了。
    只有站在这个高度，再去注视AIGC的出现，我们才意识到，在我们营建未来虚实融合的元宇宙世界的时候，我们也必然需要一个更为强劲的内容生产体系，而AI似乎是目前少见的可靠路径。
    显而易见的是，只要AIGC的内容原创，或在已有内容的基础上添加出新的元素，而不是无效复制已有内容，这个商业闭环就可能形成，而成本和价值将成为两个重要的支点。
    终有一天，我们要依赖AIGC来弥补数字世界对内容的疯狂消耗与有限供给的缺口。
    但这一天还远么？
    2、熟读唐诗三百首——大模型的支撑
    虽然我们在畅想AIGC的到来，但实话实说，目前AI的原创能力还是相当贫弱和有限的，但一些新的技术的加持，如大模型的应用，正在加速提升这一领域的竞争力。
    比如，百度文心大模型，一个很重要的特质，就是知识增强，而这对于AIGC有很重要的意义。
    我们都熟悉一句话——“熟读唐诗三百首，不会作诗也会吟”，意思说，如果你对已有的著名诗词已经都能烂熟于胸，那么，你离自己创作就已经很近了，就到了快要破茧成蝶的地步。
    而人的学习能力是有限的，《全唐诗》有接近5万首，通读都很难，背诵就更不要说了。而这对于大模型来说，并不是什么难事。
    而且，以往的模型，要么是在一个知识体系内、要么是在一个模态范畴内，而文心最大的特点就是“跨越”了这些固有的体系，它可以跨语言学习、跨模态学习（语音、图像、视频），这样的好处除了效率高、学习能力更强之外，最重要的是通过对现在已有的大量的信息，可以做更深层次的整合、加工、对比，最重要的是可以在极短的时间内尝试无数的信息组合，而这可能是产生新的内容的一个最重要的前提。
    这就好比一个人从《诗经》到《全唐诗》再到宋词元曲无不烂熟于胸，而且每天能够尝试用这些内容进行千万次新的组合的尝试，这种“知识增强”很可能就是AIGC的前夜。
    事实上，随着 AI 技术的发展与完善，其丰富的知识图谱、自主创作的能力和跨模态学习的能力，注定会在内容的创作为人类带来前所未有的帮助。而这也可能分成几个阶段：
    早期和中期，AI主要是以创作助手的角色出现，它的赋能更多的表现在能够帮助人类提高内容生产的效率和降低生产成本，帮助人们丰富内容生产的多样性，以及提供更加动态且可交互的内容。
    比如，还以作诗为例。面对一个创作主题，人类肯定会优先从自己大脑所构建好的知识图谱中选择一个最熟悉的方向来构建内容，我们称之为灵感或文风。但AI大模型可能从其更庞大、更多维度的知识体系，进行几十种不同角度的尝试，这些尝试可以给诗人巨大的灵感触发，提供更多的创作思路，帮助作者提升创作效率的同时进一步丰富内容的多样性。
    有时候，AI的帮助也不止于灵感触发，它还可以协助人类省略创作中的纯技术、低水平重复的过程。比如笔者就拜访过一位卫星图片分析部门的工程师，他告诉笔者，卫星每天至少产生40TB的数据，但其中80％因为人力有限而无法识读利用，白白放弃。但当使用了AI自动裁切、AI对特定目标（如飞机、车辆）的自动识读后，不仅释放了以往被浪费掉的大量数据的产能，而且产生了新的应用模式——例如，AI可以日复一日的通过识别超市外停车场的车辆数量，来判断消费景气指数。
    所以，无论是依靠灵感的艺术创作，还是高度依赖技术的视音频创作，甚至是搞学术研究和商业内容开发，AI都可以帮助人类探索新的方向，节省大量的时间。
    30年前，最先学会用电脑代替钢笔的创作者在生产效率上显然得到巨大的提升，那我们也完全可以假设，今天在生产消费级内容时，率先掌握了AI辅助能力的创作者大有希望在效率上超过其他人。
    例如，数字人、虚拟人是今天的大热门，市场上已经有挺多的虚拟形象。表面上看，它们都是机器生成的。但实际上它们的背后，大都是人在操控，没有太多“智能”。而如果是拥有大模型的企业来做，它们会把类似于文心大模型在跨模态综合技术方面的优势结合进去，让虚拟人能够跟用户进行自主的对话，这才是有智能的虚拟数字人。
    现在，央视甚至已经成立了人工智能编辑部。
    而且，大模型的进一步发展还可能带来新一代“通才”式创作者的出现。
    过去，像金庸这种在作品里结合了历史、诗词、佛学、棋道、书画的作者被称为“奇才”，像冯唐这样跨越文学、医学和商学的作家被称为百年不遇的“异数”。
    但是，通过百度文心大模型的知识增强，知识图谱中包括了人类智慧对世界上各种事物及其关系的总结与抽象，完全有可能在某个时点上产生比人类智能和学习规律跨度更大、包容更多的“创新型的AIGC”，它可能在灵性上和人类仍有差距，但对于输出消费级的内容已经足够甚至能做到比人更稳定、更高产。
    3、AIGC是未来虚拟混合世界的重基石
    无论我们是否把未来的虚拟混合现实的数字平行空间称为元宇宙，我们都将迎来这个世代——一个数字化沉浸的世代，而构建这个世界需要的内容工作，比人类已经进行了数十年的数字化建设而言，容量要深广宏阔的多，这其中大量的创作工作量已经不是人力可以企及，笔者认为，这才是AIGC的终极阶段——参与到数字平行世界无穷无尽的内容创作中来。
    虽然人们对元宇宙有不同的理解，但基本共识是——构造虚拟场景并能在其中实时协作，就是做元宇宙的基础，这话是英伟达的黄仁勋说的。
    从这个角度来看，人类发展数字技术的几十年其实就是一个用数字把真实世界在线孪生的过程，孪生一定是第一阶段的主流方式——学会走才能学会跑，此后则是伴生和原生，每个阶段都需要大量的内容创作。比如，仅仅是把我们现有的二维数字地图变成带有时空信息的三维高精度地图，就需要对整个地球表面进行计算机图形学意义上的重建和渲染，而能够担当这样工作的有且只有AI。
    在未来的世界里，我们将不只有“看”这一种方式来获取信息，而在获取、传递与接收信息的过程中，为了提高信息获取的效率，同时达到虚拟和真实混同难分的效果，人类在内容创作上会更依赖各种数字载体，如果没有载体，信息就无法传播，而当信息拥有了载体，信息形态就发生了改变，比如它可以是一个小体量高密度的载体，比如文字；也可能是一个大体量但更有趣的载体，比如脑机接口或增强现实，而所有的这些载体的生成和传递，离开AI也是不可想象的。
    也就是说，AIGC对我们现在“以真实世界为主，逐步融入虚拟世界”的节奏来说，将是一个逐渐替代性发挥作用的形式，而对于未来虚拟与真实混合的元宇宙世界，将是一个绝对主流的内容创作方式，你能看到和感受到的日月星辰、饮食男女，背后是一个个强大的AI大模型，以3D打印般的输出能力带给你与别人截然不同而实时更新的体验。
    当然，即使这些听起来很“深“很“远”，但笔者相信，它的发展是循序渐进的，是在共享的基础设施、标准及协议的支撑下，由众多工具、平台不断融合、进化而最终成形的，没有一个公司、一个体系可以包打元宇宙的天下，但元宇宙的建设仍然遵循市场经济的规律——在同等内容体验下，谁能提供更低成本和更高效率的经济模型和成本效益，谁就有可能获取未来某个数字世界赛道的支配权。