算力网络:下一代互联网or中国科技的被迫突围?
脑极体最近几天,随着美国宣布实施针对中国的新一轮并且更严格的芯片出口管制,关于计算存续与计算供应链安全的话题又一次热度高涨。
目前阶段,中国确实面临着来自芯片与计算领域的巨大发展压力。一方面,算力需求持续激增已经成为中国发展经济发展的常态。截至2022年6月,中国算力总规模超过150EFlops,稳定居于全球第2,并且很有可能在未来赶超美国。另一方面,算力的来源是芯片,而芯片也成了目前中国科技被反复针对的主要问题。由国际局势带来的供应链安全问题、计算成本激增问题,正在成为中国一切与计算相关产业必须面对的困境。
算力是数字化、信息化基础设施的核心,也是这个时代国家战略发展的关键。为了解决半导体贸易管控带来的压力,近几年中国也频频推动与计算相关的行动与措施。其中最著名的应该就是大家耳熟能详的“东数西算”。
而东数西算开始推进之后,产生的首个变化,或者说凝结出的第一波产业成果,就是希望形成一张联接全国,让数据和算力往来交汇的网络。如果说,去年东数西算是计算领域的第一热词,那么今年算力网络则开始承接这个地位。
在政策方面,算力网络被以最快速度纳入国家战略。2021年,工信部印发了《新型数据中心发展三年行动计划(2021—2023年)》,其中明确指出“用3年时间,形成总体布局持续优化,全国一体化算力网络国家枢纽节点、省内数据中心、边缘数据中心梯次布局”。2022年1月,国务院印发的《“十四五”数字经济发展规划》提出,“推进云网协同和算网融合发展、有序推进基础设施智能升级”。
面对急速开启的算力网络建设热潮,乐观者说这是云计算的举国体制,是互联网的下一代基础设施。而悲观者则认为,算力网络是中国面对长期缺芯局面的最坏打算,是被迫且无奈的战略突围。
那么,算力网络究竟是什么?它与国际科技局势间有怎样的关系,又是否能成为中国科技破局算力困境的手段之一?
让我们换个视角,重新理解一次——什么是算力网络?
下一代互联网?下一代云计算?
算力网络是什么?这个问题有狭义和广义上的双重答案。
狭义上来看,中国算力网是在“东数西算”工程与全国一体化算力网络的布局下,由鹏城实验室按有关部门要求推进的算力网络计划。今年6月,中国算力网——智算网络一期正式上线,这个项目标志着中国正式启动了具体的算力网络建设行动。
而广义上来看,算力网络的概念并不难理解。“东数西算”的整体逻辑是在西部地区建立数据中心,将西部产生的算力与东部的算力需求结合起来。但算力不像南水北调、西气东输这样的工程有明确输送指向。算力需求是随时发生、动态变化的。想要让集中在西部的算力能够与东部需求联系,就需要一张新的网络来承载算力生产与需求的匹配。这张网络就是算力网络。
从这个角度看,“东数西算”最终能够走到多远,是非常依赖于算力网络建设的。算力网络决定着“东数西算”工程的统筹调度能力与整体运行机制。没有算力网络进行供需对接,“东数西算”也就无法实现。
而如果算力网络建设达成了一种高度理想化的状态,那么中国的所有网络资源、计算资源、 存储资源,都可以通过算力网络进行统一调度,最终实现业界始终在畅想的“算力像水、电一样随时取用”,甚至把中国构建成一整台巨型计算机。
从发展逻辑上看,算力网络可以视作国家统一打造的云计算+网络基础设施,因而有人将其理解为云计算2.0。云计算的商业模式,是厂商自建或租用数据中心,并通过网络将算力等相关资源分组给用户。而算力网络构想的是以社会化的方式,搭建一张随时能够调取巨大、多样性算力的整体网络。另一个角度看,云计算支撑了众多有大规模算力需求的网络应用崛起。比如电商、视频聊天、网络游戏等等,因此云计算也被称为互联网2.0的基础设施。那么算力网络如果可以支持更复杂的算力需求,比如支撑元宇宙、Web3.0、AI大模型等等,是不是意味着算力网络将成为互联网3.0基础设施?因此也有很多专家认为,中国推动的算力网络建设,将成为下一代互联网的发展根基。
从应用上看,国家级的算力网络确实有其价值空间。比如自动驾驶车辆,每天将产生几个T的数据量。当自动驾驶走向产业化,这些数据如何留存、调用将成为社会级的算力考验。聚全国算力来满足这些新兴科技的庞大算力需求,就成为一种解题思路。另一方面来看,大量政企数据由于数据安全方面的考虑,是无法使用公有云服务的。而高度安全、统一,且有国家背书的算力网络,或许可以解决这些难题。
总而言之,从供给端看,算力网络可以整合计算资源,将分散、独立的数据中心、计算中心整合起来,形成“集中力量办大事”的效果;消费侧,算力网络则可以提供确定性的计算体验,把算力变成以最简单、低成本方式输送到企业。
当然,算力网络的发展目标在今天还处于顶层设计和探索性建设的初级阶段。它的有效搭建,需要数据中心、运营商、云计算服务商,以及企业用户、政府机构、产业组织的协同配合。
不管怎么说,以如此高速登上历史舞台的算力网络,不免让人想到它的另一种价值。
突围:算力网络的隐性意义
10月7日,美国商务部工业与安全局(BIS)公布了对中国的出口管制新规声明,其中重点在于先进芯片及芯片制造设备领域。这份声明中,提出了比以往更加全面、严苛的先进计算与半导体制造相关限制措施,主要限制产品包括高算力芯片、先进逻辑芯片和高端存储芯片等等。
持续恶化的半导体供应链局势,以及带来的科技脱钩负面联想,引发了社会舆论的又一次激荡。回到算力网络这个话题。我们必须看到,“东数西算”工程的快速推动,是无法与中美科技博弈大背景相分割的。面对美国长期化、稳定化的科技封锁策略,中国其实拿出了非常多的应对措施。在产业与技术层面,这个应对可以分为三个层面。一是补完先进半导体的研发、制造能力,这直接显现于2019年之后芯片国产化的大潮;二是大力发展新兴技术,因为新兴技术意味着新的基础设施供应链,包括半导体供应链。历史上历次半导体突围,往往都以新技术作为撬点。这一点表现在对AI、自动驾驶等技术的大力推动上,总结为“新基建”的发展体系。
除此之外,中国拿出的第三个应对思路,就是对先进算力的集中化使用和集约化发展。固然“东数西算”直接指向于东西部地区的算力成本、能耗成本差异,但同时也隐含着将先进算力进行集中化建设,以节约各个企业、行业的算力投资的目标,继而降低社会对先进半导体及相关设备的依赖程度,提升整个国家的计算产业安全能力。
如何让“东数西算”真正体现出这一价值呢?这就需要构建一张真正可以将集中化算力带到应用空间中的网络。这也是算力网络发展的核心必要性所在。
事实上,我们并不认同所谓科技脱钩的说法,因为彻底的硬性脱钩是很难成立的。在接下来很长一段时间里,我们可能会见到更多中美科技分野,即中美呈现出不同的科技发展思路与对未来的差异化预判,并且导致大量局部科技领域的竞争加剧,全球科技合作变得更加复杂微妙。
在这个背景下,算力网络是一次国家之间围绕计算发展方向与计算供应链安全的出牌。
通过算力网络,打造“全国一台计算机”,是一件有必要性也有合理性的创新。它既有迫于局势的成分,但更多的是主动选择。
而这也意味着,算力网络注定会走入一条无人踏足过的道路。
无人区:既令人激动,也饱含未知
毋庸讳言,中国科技在长期发展中,有大量借鉴和追赶美国的成分。从信息化基础设施建设,再到互联网经济的崛起,对智能技术的押注等等莫不如是。
但当中美科技路线开始发生,并且注定走向更强的分野化,二者之间的路线差异会愈发显著。这是令人激动的,也是需要警惕的。我们如何确保这是一个美国利用信息革命超越日本的故事,而不是苏联发展半导体、计算机的故事呢?
作为东数西算工程的重头戏,算力网络也充分展现着这一层时代意义。算力网络代表着科技举国体制的创新,同时这也是一个缺乏参照系的发展思路,是一个标准的无人区。
谷歌、IBM等公司,在很早就开始探索将企业打造成一台计算机。他们在美国相对地价、能源价格低廉的地区搭建数据和计算中心,再通过全国性网络来支撑自身的科研与业务应用。但即使全球最顶级的科技公司也依旧是一家公司,其算力网络的覆盖难度、应用差异都有限。中国在“东数西算”背景下所希望打造的算力网络,将是类似模式的全国化覆盖,其复杂程度不可同日而语。
但从另一个角度看待这件事,会发现从整个芯片博弈的历史上来看,也只有发展出具有应用价值,能够为市场接受的全新基础设施,才有可能在国家级的科技对决中赢得机会。我们在《芯片战争》这本书中讨论过这样一件事:芯片产业的竞争不仅需要补完人有我无,更重要的是发展人无我有。事实上,一旦半导体产业开始定型,补全人有我无将非常困难。新的基础设施与技术发展机遇,才是撬动整体格局的机会点。
尽管算力网络的意义和价值令人激动,但它在今天也还具有太多的未知。从这几年芯片国产化的局面中可以看到,科技自立绝不是一帆风顺的。能否真正让算力网络实现各界期待的价值,或许主要取决于能否解答三个问题:
1.算力网络能不能真的被用起来?
不同地区每个行业、每家企业的算力需求都是非常不同的。而用一张网络适配如此多样的算力需求,在今天还是一件有待探索的事情。如何在层级多样、难以预测的算力供需之间实现按需分配、灵活调度,本身是非常困难的技术问题。而如果不能有效解决这些问题,算力网络会不会变成一种悬浮游离在规模化市场需求之外,专注于政企与科研用途的“少数网络”?这是一个需要警惕和思考的问题。
2.如何避免算力浪费,实现成本与效益合理化?
在“东数西算”的大背景下,很多地区、部门、产业组织都开始建设各自的算力网络。这种政策导向下带来的重复建设,几乎是中国进行基础设施投资的常态。但算力网络的本质是集约化与集中化。如果不同的算力网络之间相互无法调用,标准并不统一,那么最终必然出现算力浪费、成本不合理等问题。因此,算力网络的需要建立多方面的统一标准,对硬件、网络协议、数据接口等层面进行打通。
另一方面,算力网络这样的创新性大型工程,将带来巨大的网络迭代、系统维护等投入。如何估算和平衡其建设维护成本,也是一个需要解答的问题。
3.如何在科技举国体制与市场化之间达成平衡?
在目前这个阶段,算力网络固然有很多技术问题需要解决,比如计算系统与网络系统如何协同的问题,以及相关的技术体系建设;异构算力如何兼容到同一张算力网络的问题等等。但在更加宏观的层面,我们可能必须面对国家工程、举国体制,这些在目前阶段成为主流的科技发展模式,如何与市场化、商业化进行平衡的问题。
在算力网络的建设中,如何确保技术与产业方向不会偏离市场主体需求?如何避免滋生地方保护主义,减少无谓的重复建设?会不会产生难以抑制的腐败?就像芯片国产化项目在过快审批、过快建设中出现了很多问题一样,算力网络也必须在汲取科技举国体制优势的同时,真正让市场和用户成为最终的受益者、抉择者。
总而言之,算力网络需要放在时代大背景下进行考虑。中美之间的科技对垒,供应链脱钩风险,提升了算力网络的建设效率。同时,算力网络也和中国数字经济的发展基础、发展规模紧密联系。中国已经有充沛的底层需求,去建设和升级算力网络,对其进行大规模投入。而从技术上,我们也要看到AI大模型、自动驾驶、知识计算这些领域都指向着指数级的算力增长。算力网络也和技术进步紧密相关。
这种局势下,算力网络可谓牵一发而动全身。盲目地悲观、乐观或许都不科学。只有整体性考虑中国社会与经济的算力变局、智能变局,才能认识到算力网络所代表的“全国一台计算机”设想,其真正利弊在何处。
最后想说的是,如果我们将算力网络视作互联网和云计算的升级,那么也许应该看到,支撑互联网、云计算兴起的并不是宏大叙事,而是双11电商大促里的一次抢购、通宵打游戏时的一次狂欢。
算力网络的未来,在万家灯火间。