圆桌实录 | 构建更好的Web3:计算、分布式存储
万向区块链万向区块链蜂巢研习社重磅推出“构建更好的Web3”系列活动,邀请Web3及相关科技领域的资深从业者、研究爱好者,通过4期讨论探讨Web3的宏伟版图和潜力赛道。
构建更好的Web3系列活动的第二期,蜂巢研习社邀请了独立研究者潘致雄、Nervos Network架构师谢晗剑(Jan)、Meson Network的联合创始人兼CEO Sherlock、everFinance创始人熊炜,深入讨论了Web3里的计算和分布式存储。
以下为讨论全文,根据速记整理,略有不影响原意的删改。讨论内容仅代表嘉宾观点,不代表万向区块链立场。
潘致雄(主持人):
各位万向区块链B站直播间的朋友们,大家晚上好!很高兴受邀担任今晚Web3专场活动的主持人,我是潘致雄,之前在链闻负责研究,现在在做一档播客节目。很高兴今晚和三位嘉宾一起聊聊Web3,特别是计算、分布式存储相关的话题。
今天的三位嘉宾分别是:Nervos Network架构师谢晗剑(Jan)、Meson Network的联合创始人兼CEO Sherlock、everFinance创始人熊炜。先请三位嘉宾进行自我介绍, 以及目前在做项目的进展,可以跟大家做同步,先从Jan开始。
谢晗剑:
谢谢潘老师介绍,我是谢晗剑,大家平时叫我Jan,我是Nervos Network的架构师。Nervos Network在做的是分层网络,Layer 1有PoW公链,最近发布了Layer 2 Godwoken,接下来在做的还有其他的Layer 2的项目。
不管是Layer 1还是Layer 2,Nervos Network都有些生态项目在运行,并且已经发布了。Layer 1上比较活跃的项目主要是NFT相关的,Layer 2上比较活跃的,主要是DeFi相关的,还有一类是去中心化身份相关的项目,像UniPass和DAS。
潘致雄(主持人):
Jan是早期以太坊相关的开发者,所以找他来聊计算相关的话题特别合适。接下来请Sherlock。
Sherlock:
非常感谢今天能有机会跟两个大神一起做沟通和分享,我是Meson Network的联合创始人Sherlock。Meson Network在做带宽的交易市场,在互联网里至少会有三类资源:计算、存储、带宽。
Meson尝试用一种协议的方式把大量在数据中心里的带宽聚合到平台里,把带宽再服务给像Arweave这样的去中心化存储用户,包括像NFT交易平台,也包括小的做视频/图像的NFT平台。
另一方面,也会寻找把带宽需求端做更多的边界拓展,包括但不限于在区块链行业里,也会找到更多在流媒体领域的用户。
最近在测试网阶段,测试网里聚合到了小几万的节点,有来自全世界的矿工在里面做数据交互的行为,也服务到了一些场景。
潘致雄(主持人):
Sherlock在分布式存储的上一层做流量、带宽相关的业务,和存储这一层打比较多的交道,所以想邀请来专门聊聊存储相关的话题。接下来是everFinance的熊炜。
熊炜:
我是everFinance的创始人熊炜,我们在基于存储区块链Arweave上做支付结算协议everPay,该协议是一个区块链金融基础设施。
为什么选择用存储项目作为协议的底层?去年我们提出了“存储共识范式”的开发思想,将人电脑的存储切换成去中心化的存储区块链后,该电脑上的所有程序都可以具备共识。
我们所开发的everPay更像是支付宝一样的后端程序,但这个“支付宝”源程序可以被任何下载和运行,程序会从Arweave上加载所有的交易数据,计算出最终的账本共识。
作为金融基础设施,everPay协议将来会衍生出生态,可以在协议上实现各种DeFi及金融相关的产品。
潘致雄(主持人):
熊炜在存储相关的区块链设施上做相对具体的应用探索,对存储特定这一块儿有非常深的了解,所以邀请你一起聊聊存储相关的事情。
上周第一期活动中,Mask Network的Suji邀请了科技博主潘乱、科幻作家楸帆聊了聊Web3,他们聊的是更高维度展望相关的话题。
而今天聊得相对会具体一点,先从Web3或下一代Web设施的基础设施开始,对于应用来说,设施最核心的绕不开计算相关的业务和存储相关的业务。
这两种资源是传统Web2世界非常重要的资源,可以用来处理一些业务逻辑、保存用户的数据之类,在传统应用中是非常重要的一环。
今天会覆盖到这几个话题,一方面,可以先听一下大家的理解,对于Web3所需的设施和Web2有没有哪些不同?并且之后还会聊一聊分布式计算平台的定义分类、存储平台的定义分类,未来的趋势,以及最早出现的Web2、Web3的应用可能会是什么样的形态。
先从每个人都会问的问题开始,Web3应用所需的计算、存储资源、基础设施,与传统Web2应用可能会存在哪些根本上的不同?可能有哪些方面会超出Web2?或者从信任层面的不同,各种层面都有可能有些不同,但大家觉得最根本的存在哪些区别?
Jan可以从计算方面聊聊,其他两位可以从存储方面聊聊。
谢晗剑:
其实我觉得计算和存储基础设施在Web3时代是一样的,本质上没有区别,Web3基础设施、基础资源的核心特点是没有门槛,它是没有门槛的去中心化的市场。所谓的“没有门槛”的意思是它是任何人都可以进入的市场,它可能是双边关系,有提供资源的人,有消费资源的人。
无论对谁对哪种角色来说,谁都可以来提供资源,反之谁都可以来消费资源,这是和Web2非常不一样的。
看今天的基础设施、基础资源,今天有很多云服务,有AWS、S3这样的存储。但是本质上它是有门槛的服务,像AWS、阿里云的特点是提供商是有门槛的,只有我一个人可以做,我一个中心化的服务商可以做提供商,但是我对所有人开放。在消费端是没有门槛的,你只要愿意花钱来用就可以用,你可以认为没有门槛。
也有另外一种形式,比如说开放式的分布式计算,比如说大家听过一个项目叫SETI,用大家闲置的CPU资源去搜寻,它的特点是CPU的计算资源供给是没有门槛,所有人都可以来提供,但是消费端其实只有一个人,就是这个科学项目,不是说所有人都能用到这些计算机。
还有一个项目叫BOINC,是伯克利的开放计算基础设施,它也是利用大家的闲置资源,也是提供商这一端是开放的,但谁能够用它是有门槛的,是由BOINC组织决定我这里有很多计算资源你可以用,他可以用。
在Web3之前很少见到这样的构思,我们要把市场的双边都变成Permission list的市场。因为它是很难的事情,它在区块链出现之前很难做到。
要构建这样的双边市场,其中很核心的问题是可验证性,不管对于计算和存储都是一样的。提供商是开放的市场,谁都可以来做提供商,我怎么验证提供商提供了他当时承诺给这个资源使用者的服务呢?可验证是很难的事情,你还要设置系统是激励相容的系统,里面有很多角色,有提供资源的人,有消费资源的人,还有中间协调整个市场的人,可能还要考虑一些其他很奇怪的因素。
如果把我的计算外包到我不认识人的电脑上去算,我是不是介意我的数据会泄露,或者我把我的数据存到一个我不认识人的硬盘那里,我是不是介意数据会被泄露?所有这些方面都需要考虑。
总结一下,Web3基础设施最有意思的地方、最明显的特征是他们追求的是,无论是供给端还是消费端都是无需许可的市场。这是很核心的特点。
潘致雄(主持人):
谢谢Jan的总结,需求和供应无需许可的双边市场,Sherlock和熊炜呢?
Sherlock:
说到Web3所需要的一些计算和存储基础设施,有一个前提,先得定义什么是Web3,如果Web3定义还不清楚,再直接往后讲Web3需要什么设施,在我心目中还是比较模糊的。
另一方面简单看一下大家是怎么定义Web3的,刚刚Jan给了非常好的定义,也是我非常喜欢的定义,无需许可。很大一部分人会觉得Web3网络、所谓的新一代Web其实是无需许可的。但我们还会看到一些其他的定义,当年在柏林Web3 Foundation开过一次会,当时提出的观点是Web3是可验证的。
如果把时间再往前推,万维网发明者Tim Berners-Lee提出的Web3定义叫“语义互联网”(Semantic Web),通过一个个关键字段形成一张图,以知识图谱的形式串联起来。这是现在有些群体对Web3的定义。
在这种定义下,我现在心中也不知道什么是Web3,但是这个现象是非常正常的。回到Web1到Web2的时代,或者把这个时代叫做互联网、移动互联网时代,思考当年的人是怎么定义互联网。
很有意思,当时我的一些投资人也跟我讲过他们当年投出像腾讯、阿里等在互联网时代成为巨头的企业。他当时问过这些人,你们能不能跟我讲讲什么是Web2,什么是你心中的互联网?大家都讲了不一样的故事,比如说马云给投资人描绘了一幅场景,放在现在这个场景就是电商、阿里云、支付系统。
马化腾向当时那代人描绘的场景是想做一种社交,发展到今天原来使用的微信就是互联网,微信、抖音就是移动互联网的一些代表。
在Web3时代最后结果到底是什么,或者有没有清晰的定义都没有关系,每个人在心中都有对Web3的定义,不断在各自的周围感受它,形成一种包围它的认知。真正到那一天我们就会知道原来这就是Web3。
第二,它需要的基础设施到底是怎么样的?
如果真的穿透到底层的话我们到底真正需要什么样的东西?像今天这个问题,计算一定是一样的,我的观点结论和Jan非常非常相近,这些东西是一模一样的,你不可能脱离开来最底层的计算资源,计算资源来源于最底下的芯片,比如说像英伟达的芯片,最后放到家用、数据中心给商业场景或个人提供服务。
存储是一样的,还是通过最底下物理层的硬盘介质提供服务,也不一定是硬盘,可能是存储介质存在服务,只不过Web1时代这种介质是更古老的磁盘、磁带,到了互联网Web2时代用上了机械硬盘、固态硬盘,Web3时代本身的底层介质会进化,但是最后服务的形式还是一样的。
最大差别就在于同样的资源到底表现给用户、提供给用户是一种怎样的形式,是不是通过过去在互联网时代用同样的方式,用契约的形式,比如说签合同,比如说云厂商跟亚马逊隐性签了一些合同拿到他的资源,他跟底下的资源提供商提供服务。到达下一个时代的时候还是同样的资源,但是最后接触拿到资源的模式变了,不需要再签合同,只需要遵守一定的协议或标准就能拿到这些资源了。
另一方面,在需求端也是一样的方式,需求端到底要不要做到无需许可 我不知道,用户需不需要没有任何门槛地使用这些资源?现在Web3的设施、Web2的设施也是非常脆弱的。在去年年底,大的云厂商发生过大量的宕机事件,如果再往前推,Facebook服务器也宕机,影响Facebook、Instagram、WhatsApp。大家会发现,平时非常熟悉的互联网应用,现实世界突然都宕了。
放到Web3来看,能不能做到一种形式把资源的可靠性提高,不会轻易被宕机,也不会轻易的数据被抹除,所有权也不会轻易被篡改。这是我心中想到的Web3基础设施的样子,以上是我个人的观点。
潘致雄(主持人):
我特地绕开了Web3定义的话题,因为现在是很新的领域,大家没有清晰的概念定义也很正常,大家都在叫这个名字,包括元宇宙每个人看了也不一样。熊炜怎么看?
熊炜:
既然大家都说到了Web3定义,我抛砖引玉说一下自己的见解。Web3和Web2最大的区别是数据的所属权,同时也包含Token所属权。
拿内容平台来说,使用传统的Web2写文章,这些文章会被审核并可能被删除。而Web3时代,不管是你在什么平台写的数据,这些数据是属于你自己的,并且数据确实具备一定的抗审查的能力,很难丢失。
Web3为什么能做出所属权而Web2难以做到?就像Jan说的一样,在数据产生的时候具备了可验证性,可验证性能让这些作品、资产具备所属权。
最简单的例子就是NFT,传统领域画一张画,画可能被别人盗走了,如果之前没有公开过,画作的著作权都难以保障,在传统领域很难界定权属问题。但如果作品发布的时候已经在区块链上,那区块链就会成为可以验证的时间序列,我的作品只要比别人先发,在区块链上比别人的时间更早,这样无论从司法鉴定还是共识层面都能很清楚地确定所属权。
当我们的文章等各种内容都是发布在传统中央服务器、单点服务器,可能会有几个备份,但这些服务器全都是由一些服务商来管理的,服务商也可以做权属证明,但是这个权属完全依赖于权威的中心节点。如果其他机构不认可该“权威”,那么该所属权也难以生效。
再看Mirror这个内容平台,也是中心化服务商,但它却属于Web3分类。Mirror能成为Web3平台的根源在于它将NFT发到了以太坊,将内容存储在Arweave这样的去中心化存储上。这时候中心服务商所提供的内容的性质已经不再是Web2的性质,哪怕有一天Mirror关掉,任何人都可以拿到数据重新启动平台,并且这些数据对应的所属权皆可验证。
Mirror已经出现了“分叉”,目前在市面上有Mirror Hub各种各样的第三方开发者自己开发的程序为Mirror进行内容展示,Web3秉承了开放性。数据是公开透明,并且具有所属权,开发者所实现的功能,不管是读取还是展示,都会以原来可验证的所属权成为基础,为大家提供服务。
再回到一些根源问题上,在没有数据所属权的时候,我的数据被别人拿去使用,我不会获得任何价值及收益。但如果我是通过以太坊私钥或者其他密钥发上去的数据,这份密钥就会成为Web3的身份,以及数据所属权的可验证源。
再说一下所属权,所属权并不一定需要数据是隐私并对别人不可见的,而是这份数据可以和密钥进行锚定,有了这份公开透明的权属证明,后续应用的权益就可以回馈到这份密钥上,它是有理有据并且可追溯的线索,作为Web3用户的权益保障的根基。
Web3需要有一些永存的基础设施才能达成,如果数据不能永久保存,不能持续存储下去,那就无法验证,无法进行追溯,那么Web3的目标就很难达成。
潘致雄(主持人):
谢谢熊炜的分享,我大概总结一下,大家提到了很多点,但核心每个人都提到了供给需求的Permission list,围绕在Web3上的,以及应用和数据的可持续性、可验证性,内容的所有权、抗审查内容。区块链本身就是永存的,以太坊、比特币在区块链上从最早到现在,已经有上千上万个节点在存着了,需要永存的,这也是非常重要的一个点。
接下来聊更具体一些的垂直分类和定义的问题,可以先从分布式、Web3计算平台开始聊,什么是分布式计算平台?会有哪些分类及未来的趋势?
先简单聊聊我大概知道的,我觉得以太坊、EVM或者Network相关的都可以称为计算层,可以提供需要很强共识的业务逻辑,可以为整个网络提供计算能力。当然它不是专用计算,是通用的。
专用计算也有很多,包括越来越多的渲染计算、很特殊的计算、科学计算,都有相关的平台在区块链上运作。
不知道Jan怎么看待区块链计算平台的定义、分类、趋势的话题。
谢晗剑:
回答这个问题之前我想接着刚才说的问题补一句,我觉得数据的永存保存是特殊的场景,不是Web3基础设施的核心特征。
对于不同用户来说,需求是不一样的,有的人可能希望数据保存一万年,比如说NFT。但也有一种需求是现在找到空间临时放一年,我愿意为之付费,这是另外一种场景。对基础设施来说,所有场景都要考虑,不是说只考虑其中一种场景,这是我的个人看法。
对于计算来说,Web3去中心化计算、分布式计算可以沿着我刚才说的定义往下讲。现在可以看有哪些项目属于供给端、需求端都是完全Permission list的计算市场,现在有很多项目是这样的,本质特点是无需许可的双边市场。
早期的项目像Truebit、Golem,Golem是以太坊上第一批出现的远古项目,以太坊没有上线的时候就有。还有iExec这种也很老,还有面向特殊计算领域的Livepeer等。
还有一些不存在在以太坊上,基于独立的区块链去提供计算资源的项目,最有名的是Dfinity,现在改名了叫Internet Computer。
总的来说要分类的话,核心还是可验证的。我作为有计算需求的人,我把我的计算结果交出去,我把结果拿回来的时候,结果可信度有多高,得到了什么样程度的验证?从这个框架上思考的话,智能合约平台也可以看作是分布式计算平台的极端,因为它是一种效率很低的验证方式,全网所有的节点对计算结果重复执行做验证,比如说以太坊网络里有多少个全节点,比如说1000个,同样一笔交易会被执行1000遍。
但是对于其他的一些去中心化计算网络设计来说,想要用其他的方式替代这种效率很低的计算验证方式。
比如说Truebit是分布式交互验证的模型,很像大家今天都在说的Rollup。Rollup是乐观执行,我作为Rollup节点收到计算请求后先乐观执行,把执行结果反馈给用户,任何人可以去检查执行结果是不是对的,如果你不满意的话,你可以去挑战,你可以在Layer 1发交易挑战验证结果是不是对的,真的发现结果是错的你可以惩罚我。
Truebit本质上也是这种模式,挑战过程会比Rollup更细。如果要把它和Rollup比的话,Truebit是一种更细粒度的挑战模式,它不是挑战交易,而是挑战交易里可能有100个指令,我在指令集里挑战,找到出错的指令,指出来这个指令的执行过程是错的,要求大家重新去算它。做起来很复杂,Truebit最后也没做出来。
像Livepeer一开始也是想利用Truebit挑战模式构建去中心化的视频转码和推流,但因为 Truebit没有做出来,一开始发展也不快。
像Golem很像是我想象中的那种去中心化基础设施,计算和存储资源的基础设施,它设计了经济模型激励所有人提供你的CPU、内存加到网络里来,Golem网络会帮助你分发任务,你可以把你的资源放到网络上,相当于你在卖资源,另外一些想要用资源的人可以挂单买资源,网络在中间做撮合的角色,把这两方撮合到一起,在使用的过程中付费。我个人觉得,去中心化的计算市场是非常难做的,它比存储要难,所以我觉得现在存储是走在前面的,去中心化计算市场非常惨淡。
Golem号称现在计算能力是14000个CPU core左右,内存有20TB,磁盘也有152TB。但是这个数据跟几个大的存储链Filecoin、Arweave等相比是很小的。这还只是容量,如果只是看网络使用量的话就更惨,非常惨淡,这里面有很多坑是没有绕过去的,现在还在探索的过程中。
我平时也会关注这些项目,最近比较有意思的项目是Render Network,它是做GPU渲染的,它走了非常奇特的路线,有点像以前国内圈子很喜欢说的词——“链改”。Render Network本来就是做GPU渲染的公司,做的也挺好,但是和区块链结合了一下,把Token经济学引入进来,激励形成市场。
但是在整个设计上,现在这个阶段目前还是非常中心化的,看Render Network的设计,各方面都是中心化的设计,它有很古典的经济模型,用Render Token来做支付购买使用计算资源,但从产品层面包装的非常好,从可用性上Render Network比Truebit、Golem、Livepeer等都做的好。
从另外一个角度说明现在去中心化计算市场技术层面还在非常早期,只有牺牲掉很多非许可性、去中心化的考虑,才能得到非常可用的产品,Render Network就是很好的例子。
总的来说,现在已经有很多去中心化的计算网络,不管像智能合约区块链,还是处在中间的Golem、Render Network这样。Golem更加偏去中心化一点,Render Network更加中心化一点。
再往中心化和Web2这边走的话,像Flux用Token激励大家提供你闲置的服务器资源、VPS资源,也是要形成一个市场,你可以租用,和Golem有点像。但是它和我们想象中的Web3计算市场/存储市场有很大的区别,理想的计算市场应该像我们用自来水一样,我拧开龙头想要多少计算量、想要多少CPU就可以用,开发者不用做额外的扩容工作,而不是像使用今天的云计算服务一样,你给我的是10台机器,我要自己搭建自动扩容的体系,自动扩容应该是中间层。
Flux很像今天的云服务,你可以来租我的服务器,你可以在服务器上跑Docker,但如果你想要自动扩容的话可能麻烦一点,不能像使用一块硬盘一样使用它,或者像使用一台计算机一样使用整个网络的资源,你要自己去管理很多台服务器,想办法怎么样把你的应用、计算、存储分配到机器上去,分配的过程要自己处理。这已经是非常偏Web2的一种形式了,但是它也是属于Web3基础设施这一类。
可能未来会有很多这样不同的市场满足不同的需求,在Web3的程度上会有差异的,有的基础设施、有的项目特别Web3,有的基础设施特别Web2,他们在中间的程度上有差别,它不是非黑即白的东西。
潘致雄(主持人):
我正好追问一个问题,我听下来感觉它就像一个光谱,最那头的以太坊或者类似的公链是强共识,安全性很高,去中心化程度相对高一些。光谱的另外一头是中心程度高一些,可验证性削弱一些?
谢晗剑:
大致是这个概念,但是我想指出在光谱的那头不光有以太坊,还有其他项目。以太坊和其他项目的区别是说你的验证手段,你到底是用零知识证明,还是用其他同样保护隐私的外包计算,还是说用以太坊,信用等级差不多的,只是说实现方式不太一样。
潘致雄(主持人):
技术层面不太一样,有些零知识或者别的密码学可以导致的结果不一样,包括共识用的也不一样。接下来一个问题想聊存储话题了,想问一下两位分布式存储有哪些,你们觉得怎么分类这些事,未来会有什么样的趋势?
像我理解聊得最多的可能也就Filecoin和Arweave,这几个项目大家都知道的,你们觉得应该怎么去分类或者理解,有没有光谱的事情?
Sherlock:
在我看来很多事情都是一体的,你不能简单脱离一些东西看单独的设施,如果你真的考虑计算的话,计算一定会有存储。包括我们自己讨论带宽的话,带宽一定会有存储,甚至很多事情是相对粘合在一起的。
比如说某一种是计算资源优势特别突出一点,有另一种项目可能会在存储或者某一种资源上做更多的激励。对未来给Web3提供服务的存储,我自己的答案会比较极端,我希望能找到一些平台做到了过去在互联网世界里做不到的东西。
怎么定义这个点呢?刚刚熊炜提到的Arweave,Arweave向市场提供的是什么?简单讲是永存。从我个人观察来看,太坊也提供永存了。
区块链核心是什么?就是存储、数据库,是一种特殊性质的数据库,本质上已经做到了存储这件事情。比特币在上面存储太贵了,在以太坊上虽然可以存储,但也很贵,尝试找到在成本上做妥协的方案,比如说Arweave设计方案下的存储,它也是永存。
包括以太坊、比特币区块链,包括像Arweave做的存储维度,在过去互联网里很难以做到的,你甚至可以大胆预言这个世界过去了50年、100年、500年以后,亚马逊、Google这些中心化的云厂商可能倒了,如果在50年前看,诺基亚倒了,可能100年以后Google也倒了,Google倒了的话是不是意味着亚马逊存储没那么持久下去?互联网时代你想提高存储的可能性,你只能不断地找云厂商。但有没有哪种设计天生能提高冗余度?大部分区块链都能做到这一点,无非是有区块链的特性和差异化。
第二点,很多存储项目会选择在传统互联网维度上尝试和现在云厂商做比较。比如说有人会质问你,比如说会质问Filecoin会不会相比现在互联网里亚马逊的S3存储更便宜了?还是性能更好了?还是做到了其他优点?这是大家的习惯思维,把你拉到习惯的领域,互联网常用的基准指标,通过衡量的指标来衡量你是不是非常好的设施。
事实上当我们进入到下一个时代,所有衡量的指标全部重写,现在来看所有指标都没有任何意义,比如说网络收入,甚至过去在互联网股票时代的市盈率,这些指标放在下一个时代里是没有价值的,通过这种方式去尝试思考理解下一个时代的平台,者这个平台架构模式是不是合理的,是不是有未来的,这个问题我是不能接受的。
我自己把现有的存储分成几个类别:
第一个类别是做到过去做不到的事情,像Arweave存储,包括以太坊也是一种存储。
第二个类别是尝试在过去的互联网指标里和现有的云厂商竞争,Sia和Filecoin尝试在某些指标上做到现在云厂商做到的事情。
第三个类别,将存储作为共识,Chia做的事情非常类似PoW对计算资源的使用,只是利用存储这个概念,把它作为一种工作量证明的手段,并没有利用存储。但这条路不一定是错的,也可以走出来一条方式的。
这是我的一些理解,谢谢!
潘致雄(主持人):
谢谢Sherlock,熊炜是怎么看待这个问题的?
熊炜:
我们将存储分类有两个类型,再说分类前要先讲一下账本的故事。
如果在个人电脑上做个账本,我给谁转账、谁给我转账记录得一清二楚,这是一个传统的会计账,我自己对账目一清二楚,但是他人却无法信任我的账本,每个人的账本需要相互对账才能获得共识。如果现在我把这部分账本放在某种区块链基础设施上,成为永久存储或者任何人都可以获得的账本结构,这时候可以认为该账本就是比特币,其实比特币所做的就是将普通的每一笔账本通过PoW方式让整个网络进行联合进行验证。
不管是比特币、以太坊还是将来的Web3存储,它和传统模式的Web2、传统会计账的区别在于达到了数据的可验证性,以及数据的永久存储。
如果说比特币账本不具备这种可验证性,和随时追溯数据的能力,它就不可能具备去中心化共识的。
在存储领域有两个方向:
第一个方向,IPFS。像刚才Sherlock说的和传统的云厂商进行对比,实现了去中心化的租赁,传统云厂商是中心化管理的存储市场,现在可以通过IPFS上边的经济激励实现存储的激励。但是这种租赁还是临时的,并不是提供永不改变账本。
第二个方向,永远存储。Arweave所实现的永久存储中,每一份数据,每一份文件就像比特币上的每一个账目一样,永久存储,让每一比特的数据都变得可追溯、不可篡改,这时候上面构建应用的性质就发生了改变。
任何应用只要使用了这种可信的永久存储,不管计算在何时何地发生都会据具备不可篡改且可追溯的特征。
最后总结一下,存储有两个方向:第一种,如 IPFS,创建去中心化的存储租赁市场;第二种,永远存储,让每一份数据和每一个比特都不可篡改及可追溯。
潘致雄(主持人):
我大概总结一下,Sherlock的分类相对比较清楚一点,三类:永存的,和Web2竞争的,Chia是比较特殊的例子,可以用来做工作量证明,的确成本也比较高,没有用在比较具体的例子上。感谢两位的回答。
谢晗剑:
我刚才说了,去中心化存储走的比去中心化计算要前面,现在已经有一些很有意思的项目在实际使用,去中心化存储是一个非常有意思的市场。
像Arweave这样的项目是小而美的项目,找到了非常精准的点——永久存储的需求,这个需求是真实存在的,例如NFT的存储需求,或者是大家做Layer 1会想Archive节点怎么设计,以太坊也存在这样的问题。
这是非常有价值的市场,而且也确实是这个时代的基础设施才会去考虑的问题,以前没有人考虑过要怎么样把数据保存一万年,所以这是非常有意思的方向。
但是我想说,对于现在所有存储的区块链来说,包括Filecoin,包括Sia,包括Arweave。我的观念是现在都还在验证,他们的经济模型里都有一个非常重要的成分是靠早期的区块增发奖励对存储使用做补贴。
然而,存储的使用成本是去中心化存储、计算能不能走向大规模应用非常关键的一点,你能不能做到便宜,能不能和现在日常的云存储一样。
比如说Arweave打的是很特殊的场景,打的是永久存储,可以贵,这没有问题。问题是现在所有的需求都没有被验证过,比如说Arweave模型里有计算方式,可以根据未来存储进展,单位存储成本降低,它可能是收敛的,它有一定的极限值,这点是成立的。但是问题是Arweave通过这个方式计算出的对存储的支付没有反映到对用户收取的存储费用里,存储成本很大一部分被区块增发补贴掉了,不是使用存储的用户在付成本,而是网络持有Token的人在支付成本,因为在增发。
对其他的区块链其实也是一样的,Filecoin和Sia也都是这样,对其他去中心化的计算也都是这样。所以这是很关键的问题,所有基础设施设计现在都没有得到验证。
如果你仔细分析网络设计的话,有很多很明显不可能做到存储成本很低的,有的项目鼓励你租用云服务的机器、云服务的计算资源、云服务的存储提供服务加入网络。可想而知,它的成本更高了,资源成本是很重要的问题。
另外一个比较重要的问题是面向Web3来看,未来基础设施架构面对一般市场的架构会是什么样的?我常常会想Filecoin、Sia、Arweave各自的特点,Filecoin是比较正面刚的,看到了一堆很难的问题,比如说我怎么样证明数据真的复制了3份,我怎么证明数据真的保存了一年,这都是一些非常难的问题,他找了很多也许不是那么完美的方法来解决它,糅合成了很庞大但却是解决问题的系统。
Sia是设计的非常精巧的项目,构建了非常好的存储双边市场。Filecoin和Sia都是签合约的方式,我可以告诉你我想住多大的空间住多久,找一个人给我提供,我支付存储服务费用。Arweave也是非常巧的方式。
他们给人的感觉其实不太一样,但是如果你从技术架构的通用性上来说,我会觉得支持合约的市场比不支持合约的市场更有技术含量。道理是简单的,如果我可以支持100T空间租一年的合约,我很容易把它拓展到100T租无限久的空间,只是在定价体系上改一下公式而已,需要思考的问题是怎么对合约进行定价,怎么对用户的需求进行定价,如果你是100T租一年可能需要付100块钱,如果你是100T租无限久,同样可以按照折现的方式给你未来所有的现金流成本折现到现在做定价,是一种可以扩展的架构。
反过来是不行的,如果你不支持合约的话,或者你只支持固定的合约,你没有办法拓展到其他各种各样需求的合约。技术架构会决定未来发展的上限,这是我的看法。
潘致雄(主持人):
我再补充问一个问题,Nervos Network生态还是有很多应用的,有没有具体的应用适合某一个存储层,有过合作或者利用他们存储层的吗?
谢晗剑:
像NFT这类的应用非常适合Arweave,Arweave在这个点上的市场非常非常准。如果我拥有NFT想要存图片的话,我肯定希望它永久存,这是NFT很强的卖点。因为专注于这一个市场,可以把用户体验做得非常好,不用考虑签合约,或者Filecoin和Sia还没有走到中间层把用户体验优化到很好的阶段。
比如说我现在想跑一个Dapp,Dapp有存储的需求、计算的需求,实际上我只想租用资源,现在最典型的就是GPU渲染、视频渲染、动画渲染等场景,很适合用临时的资源来做。Filecoin和Sia都很适合,但是问题是没有计算的那一层。
Sherlock:
刚好请问一下Jan,你刚刚提到存储能不能把成本给降下来,你觉得存储的普适性,成本降下来这件事情是非常重要的吗?
谢晗剑:
我觉得这件事情是非常重要的,如果你要和中心化服务竞争,不管你是什么类型的存储,不管是存一年的还是存永久的,中心化服务都可以反过来做同样的事情。
比如说今天认为永久存储的价格有上限,1T总共收100块钱就可以了,中心化存储也可以提供永久存储的服务,也收固定上限。本质上其实是一样的,如果你面临这样竞争的话,你必须要说服用户你来用我的而不是用别人的,在这里面存储成本是很重要的问题。
永久存储以前就存在的,只不过中心化服务协议会乱改,并不是没有出现过,比如说以前的GMail or Google Photos,你可以永久存。如果说在经济上是可行的,那中心化服务能够做一样的事情。
比如说可以设想未来有这样的场景,中心化服务迫于竞争的压力都可以采取各种各样永久存储的服务,这里面有10个中心化的服务在做,有开源工程师做了方便你迁移数据的开源工具,可以很方便地在中心化永久存储的服务之间迁移。到时候会是所有中心化、去中心化服务在一起竞争的大市场。
不光是存储,计算也是一样。去中心化服务能不能在竞争力留下来?能不能真的争取到用户?对服务收取的费用是很关键的问题,一般用户倾向于我宁愿承受一点中心化服务会挂掉的风险,但因为它便宜所以我愿意用它,这会是很多普通用户的选择。
Sherlock:
回过头思考收费这件事情,现在像以太坊这样的平台收费核心是没有剥削定价,过去从来没有跟以太坊服务或者类似的服务做过定价,所以可以按他的模式来收。
同样的道理,就算Arweave找了所谓的锚点,找了类似摩尔定律的方式进行半导体进化,尝试进行收敛。但这件事情在过去也是无法定价的,所以它可以用非常昂贵的方式给它所谓的“永存”定价。
如果用签合同的方式给存储系统定价的话,势必会跟所有的中心化系统竞争,他们是有一套他们的定价模型。你往往很难和他们竞争这件事情。
谢晗剑:
现在所有去中心化基础资源网络都没有真正解决定价的问题,因为大家都是在用早期增发做补贴。这个资源的真正价值是多少,其实是没有人知道的。
熊炜:
这部分我有一些不同的看法,将比特币区块链和Filecoin对比,Filecoin就是非常明显地靠增发机制进行激励,Filecoin网络上几乎没有有效数据。但是比特币网络的业务成熟很多。
同时Arweave也是一样,在增发递减收益也并不明显,将来的更多收益是依靠对链的使用。分成两种:Filecoin更像是矿链,比特币和Arweave则是应用链,应用链更倾向于通过用户使用链,消耗Token,在网络里进行流转。
Sherlock:
互联网模型早期通过大量烧钱来垄断市场形成规模效应,同样在Crypto里你不需要烧钱,但需要用激励体系的Token补贴,补贴到最后系统能不能走下去很难讲。
谢晗剑:
Crypto找到了一种非常好的冷启动的方法,这是非常好的方法,很正确,但是它并不能回答我说的可持续性的问题。
这里的问题是两个,一个是要冷启动,早期补贴没有问题,无论是互联网还是Web3都可以这么做,但最终走到中期和后期之后要考虑可持续性,不可能无限制地补贴。这件事情反复被验证过很多次了其实。
Sherlock:
刚好我也有个想法,在我看来大部分网络会有两端,一端是供给端,一端是需求端,当我们尝试设计经济模型的时候,要看你的经济模型是倾向于哪一端的。
第一个例子,以存储为例,Filecoin大量激励供给端,甚至一定程度上取得极限。确实,它的模型下会涌现大量的节点,节点占到了大量的机房、IDC节点,它会变成供给需求先有鸡还是先有蛋的问题,本身没有绝对的对错。这是Filecoin的例子。
第二个例子是激励需求端取极限是什么样的例子,在我看来有个例子叫BitTorrent,它对于存储激励是怎么样做的呢?用文件的人要自己存文件,任何资源大家都很好下,因为大家都有很多分片,但是对于冷门资源基本下载不下来,因为没有人会有动力存。最后变成你开个会员从IDC里给你把数据拿过来,在我看来这是取得极限,激励需求端。还有一种模型是用Token激励一部分供给,把剩下的Token提供给需求端。
回答Jan说的可持续的问题,我觉得还是得从需求那边来,本身有点像正向循环死亡螺旋的情况,当你的供给端上升的时候,你的需求端就会上升,需求端上升反过来会刺激供给端。如果说你没有突破死亡螺旋的话,你是走不进正向循环里的。
在我看来,真正能持续下去的方式一定是需求端真正有需求,确实是满足需求的,同时供给端整合资源的模式是正确的。
先讲整个大背景,确确实实会有很多闲置的供给情况,如果你通过一种非常高效的方式把闲置的供给聚合起来,那确实有一定可能性成本会降下来,这种情况下你是可以服务需求端的。
熊炜:
Sherlock说的我很赞同,Arweave就有这种感觉,需求者使用Arweave越多,这时候对Arweave的供给需求越多。Arweave如果被大公司和用户使用价值会上升,上升之后相当于可以获得更多的收益,增加存储,形成螺旋的上升过程。同样的如果有螺旋上升,也有可能存在螺旋死亡的问题,导致存储进行缩减的情况。
Sherlock:
Jan,可持续的系统,有没有看到什么你认可的方案?
谢晗剑:
我们可以把每一个项目都看成是一个创业项目,大家都想做一个平台一个网络,这是两个问题。早期肯定要冷启动,要补贴,要激励的,中期开始要可持续,要建立健康的商业模式,所谓健康的商业模式是要有正向的现金流,以X块钱生产一个东西,以Y块钱卖掉一个东西,Y要大于X,这是很简单的经济学的道理。
我希望看到可持续发展的项目早期是通过增发补贴早期用户冷启动,中间的时候转向正常的商业模式。现在所有的项目都是在补贴,还没有走到验证正常商业模式那一段,如果要走到那一段的话就要考虑成本的问题,还是回到我刚才说的,会变成核心问题。
潘致雄(主持人):
其实比特币区块链也存在这样的问题,大多数贡献者是靠区块奖励来的。
谢晗剑:
对,潘老师说的非常对,这个问题也是比特币区块链最核心的问题,比特币区块链什么都好,就这个问题现在没有解决。
潘致雄(主持人):
大家对于这个话题还有什么想聊的吗?
Sherlock:
这个问题好难,其实我也不知道,我也在看一些探索。
潘致雄:
时间关系,再聊最后一个问题。现在看到这两种资源很多时候是分开来的,但对于Web2世界可能又是打包在一起,当然你要一起买,在AWS上要买存储S3、买计算资源。
但是在区块链上,在Crypto、Web3的世界,你们觉得这两种资源是耦合状态,还是解耦状态,还是独立发展对生态更有意思?我现在能看到有一些的确在整合,包括刚刚Jan说的Golem,有计算、存储、内存,Internet Computer做了计算、存储,包括EOS之前也是计算、存储都整合在一起了。以太坊比较纯粹,只有存储这一层,对于这个话题你们是怎么看的?
谢晗剑:
整合其实有两种方式:一种是资源相互横向整合,一种是资源和公链的纵向整合。未来的基础设施有三种资源:计算、存储、带宽。
这三种资源和像以太坊这样的大公链会不会整合?这是我比较相信的趋势。对于这些去中心化的市场来说,最好的选择是基于一个公链来做,因为你会有更好的安全性、更好的协同性,和其他的Dapp会有更好的协同性,他们之间的互操作性、协同性一定是最好的。
我一直有一个观点,我觉得计算市场、存储市场、带宽市场其实和隐私一样,它不需要单独一条链的,我们可以在区块链发展早期看到很多链长期在做隐私,但慢慢隐私需求会被公链给吸收掉,这是我的看法。
另一方面的融合,计算、存储、带宽三种市场会不会融合成统一的计算资源存储市场?比较难讲,但是有可能会保持各自独立。为什么呢?这三种资源的特点不太一样,就比如说计算很可能是瞬时性的东西,存储是我一直放在那儿放的东西,他们在定价模型、收费的方式上不一样,可能需要不太一样的经济模型,使市场最高效的运作。这三种资源市场之间保有分开的可能,也有可能由于某种原因大家把它统一到一起。
今天云计算的市场也是分开定价,这三种资源的融合比较难讲。
Sherlock:
这个问题非常好玩,刚才Jan第一个讲的是资源定价的方式,最后服务给用户其实是一体的。在我看来我个人觉得存储是基石,所有东西离不开存储,存储是最重要的,但离用户最远,用户对存储的感知没有那么强烈。
用户真正资源感知比较强烈的,要么是带宽,要么是计算,这两个离用户直接感知会比较近,带宽非常近,带宽基本就是数据交付用户最后环节。再讲一下两边定价的差异,非常同意Jan说的瞬时、持久化、稳定、存储资源。
可以类别一下,带宽资源非常像电,电能的储能非常难,就像你要把电的东西给储存下来需要造电池等各种东西,电的储存非常难。其次,电的输送非常难,成本非常高,不可能说在某个海岛上有电,输送到某个核心城市再去发电。
在我看来,这些资源极有可能是一个区域的资源服务一个区域的市场,带宽大概率是服务区域市场,同时搭配当地的区域存储,搭配区域的计算。所以我的结论是它们会分开定价,但可能会合到一起服务给用户。
熊炜:
这个问题真的非常有意思,Sherlock和Jan都提到了,这三种不同的形式一定会有不同需求,而且在不同的形式内,每一个独立的子领域都有各自的需求。
就单存储,临时存储和永久存储定价也是不一样的,带宽也有要求高带宽的需求。同时,计算的时候有些是做科学计算,而有的只是账本计算,这两种计算的成本也是完全不一样的,那么成本不一,如何能定价定到一起?
现在所看到的把三种东西全部定在一起,像以太坊计算和存储一体,它适合的场景就是做DeFi,而除了DeFi之外这个世界有太多的其他计算,科学计算、隐私计算各种各样的需求,这些计算并不是一定适用于以太坊计算。
我的观点是存储、计算、带宽一定会是分离的,但是他们可以各自利用区块链和代币经济学实现每个领域最优的定价。
带宽就像Sherlock说的每个地区不一样,我作为中国用户要用美国的带宽,可能只是因为我的企业在那边有服务,我才会按照那边价格租赁。
但我没有必要在中国服务中国用户的时候租美国的带宽,哪怕那边更便宜我也不会租赁,因为我的用户访问美国带宽的时候会更慢一些,这样差异化的市场一定要有差异化方案来解决,不可能把所有方案全部放在一个区块链里统一全部解决了。全部统一解决就像DeFi或像以太坊现在的形态,以太坊、区块链2.0形态已经走到了一个比较完备的高度,再往后突破,不管是做Web3还是做其他应用,一定是存储、带宽、计算分开,有不同的模式和范式去实现最优的经济模型。
潘致雄(主持人):
谢谢熊炜的分享,大家对于这个话题还有什么要补充的吗?
核心相对比较统一的观点,定价需要分开的,因为这三种资源的确情况不一样,有人觉得可能会打包在一起服务于用户,是有可能的,特别是应用层在挑选资源后结合好了直接丢给用户,用户可以直接用,用户感受不到不同的定价,但应用层要把这些事情处理掉。
Jan也提到这三种资源有可能不需要一种链,就像Golem一样依附在以太坊上,各种情况也有可能。
非常感谢大家今天的分享,聊了聊Web3、计算、存储、基础设施相关的问题,特别是聊了和Web2大家认为的区别,“无需许可”是非常重要的关键词,其他的还有所有权、永存,计算平台的光谱,有强共识安全性的或者相对安全性弱一些的计算平台。
分布式存储会分成永存或者和Web2对标,以及偏工作量证明相关的使用途径存储平台。最后还聊了聊这两种资源有没有可能合并在一起成为巨型平台,至少在定价层面,因为各种地理情况的问题或者因为各种资源的时间因素不同,价格是需要独立的。
非常感谢三位嘉宾的分享,今天活动到此为止,谢谢!