区块链的性能优化是一个很热的话题。然而,由于区块链系统的复杂性,系统性理解性能优化门槛很高,这就为“性能虚标”提供了空间
前有“百万tps”大跃进,后有“80万tps”宕机链
所以,我希望展开来讲一下决定区块链各模块的性能瓶颈和挑战,看看那些漂亮数据背后的水分
1.网络模块
作为一个去中心化的系统,网络通信是整个系统的基础,也有人将其称为Layer0
我将网络模块抽象为三层:网络设施层、节点连结层、广播协议层。每一层都是下一层的基础,每一层的性能都是下一层性能的上限
网络模块的带宽和延迟构成了区块链系统tps和finality延迟的基础
1.1网络设施层
“美联储传声筒”:美联储在加息问题上面临艰难决定:3月21日消息,“美联储传声筒”Nick Timiraos称,在当前的情形下,美联储面临是否加息的艰难决定,美联储官员们必须在通胀担忧与对银行业动荡溢出效应的新担忧之间取得平衡。
Timiraos 认为,美联储是否继续加息 25 个基点的决定可能部分取决于市场如何消化瑞银收购瑞信的消息,以及美国和其他经济体采取的平息市场对银行业担忧的举措是否奏效。而在 2018 年至 2022 年期间曾担任美联储副主席的克拉里达表示,建议美联储继续进行 25 个基点的加息。如果美联储暂停加息,市场可能会讨论,是不是他们隐瞒了一些市场不知道的真相。[2023/3/21 13:16:16]
带宽:主要取决于网络基础设施的发展,以及区块链节点的配置要求。前几年公链的网络配置要求一般在20Mbps到100Mbps.到2022年,Aptos已经要求1Gbps网络带宽了。总之,带宽要求越高,节点门槛越高,越中心化
英国央行副行长:尚未决定在英国引入公共数字货币:英国央行副行长坎利夫表示,尚未决定在英国引入公共数字货币,目前尚不清楚英国央行能否成为公众信心的支柱,除非它能够向公众发行货币。(金十)[2021/5/13 21:59:34]
延迟:延迟有一个优化的极限,就是光速。互联网中的传输延迟比光速延迟要更大一些。Conflux曾经测得的洲际节点延迟可达200-300ms。如果是那种所有节点都在一个数据中心的“机房链”,延迟可以忽略不计
1.2节点连结层
节点连结层主要通过邻居节点间的通信实现网络中的消息广播
带宽:一般情况下,节点连结层可以获得接近于网络设施层的带宽。也可以选择牺牲带宽来降低延迟:例如,当要广播一条消息时,同时发给所有邻居,而不是发完一个再发下一个
延迟:消息广播延迟和节点数量有关,节点越多,延迟越高
目前比特币和以太坊大概有几千个节点。根据我们的实验,如果全网有一万个世界各地的节点,广播延迟中位数3~6秒,最大可至15秒。通过一些协议优化,最大延迟可以再降低一半
德国央行官员:推出央行数字货币是一项“决定”:金色财经报道,在周二的一次讲话中,德国央行执行委员会成员Burkhard Balz将引入欧洲数字货币(数字欧元)描述为“决定”,而不是完全技术性的决定。Balz认为,鉴于此类项目的具体情况,以及对金融稳定、银行体系的健康状况以及消费者付款方式和持有价值的本质的影响,数字欧元的创建将具有意义。因此,对CBDC进行相对于其他选择的全面概念分析和评估是有必要的,特别是在履行我们的任务授权方面,而且也要考虑到其对整个社会的影响。他还表示支持央行之间的国际合作,包括在所谓的稳定币这一主题。[2020/10/21]
而一些宣称确认延迟1~2秒的公链,显然只能支撑更少的节点
1.3广播协议层
节点连结层只负责转发数据块,而不管数据是什么。而广播协议层则定义具体的区块、交易转发规则
带宽:主要在于如何减少冗余传输。试想,如果每个邻居都给你发了同一笔交易,是不是很浪费?Conflux设计的转发协议Shrec,就通过减少冗余,在同等网络带宽下将广播交易的tps提升了6倍
动态 | DigixDAO投票决定清算价值6400万美元的代币销售所得ETH:金色财经报道,DigixDAO已投票决定清算代币销售所得ETH,价值高达6400万美元。据悉,Digix在2016年进行了ICO,筹集了约466648 ETH,当时价值约700万美元。根据ethscanner上的两个地址,DigixDAO目前还持有380000 ETH。Ragnarok项目是将ETH返还给ICO投资者的一项措施,该项目由去中心化自治组织DigixDAO独立持有,该组织获得了95%以上的投票支持。通过这一措施,一份合同将被执行,每DGD返还0.19 ETH。根据博客文章,Digix对该提案投了弃权票,因为其不赞成清算该资金。[2020/1/21]
不过,只要网络设施层带宽足够高,即使不优化,这里也不会成为瓶颈
延迟:一些共识协议会将广播协议层的延迟放大若干倍,例如,比特币的出块间隔需要5倍于广播协议层的延迟,而确认需要6个块。因此,优化这里的延迟至关重要。2016年,比特币通过紧凑区块的设计,将区块广播延迟从120秒降低到了不到10秒
前瑞波老板的一个决定造成了瑞波遭遇120亿美元诉讼风波:前瑞波老板克里斯·拉森(Chris Larsen)在2016年做出的一个决定造成了他和公司之间的分歧。瑞波与一家银行财团签署了一项协议,其中包括一个合作伙伴以微薄的价格购买500万个瑞波币。瑞波称交易是不诚实的。在过去一个月XRP价格大幅上涨后,现在合同价值达到了120亿美元,双方都陷入了一场官司,这场官司可能会影响该公司及其数字货币的未来。瑞波本周在纽约一家法院提起反诉,指控R3财团以恶意的方式签署了这项交易。诉讼中称,相反,R3歪曲了它的资源和目前的执行能力,仅仅是为了诱使Ripple执行协议。例如,尽管R3向Ripple表示可以接触到其大银行的主要银行财团,但R3知道并有理由确信,几家对瑞波起作用的关键银行很快就会离开它的财团。XRP全球均价2.04美元,涨幅4.21%。[2018/1/13]
紧凑区块不包含完整交易,只包含交易哈希前6字节,因为这些交易已经在网络中被广播过并被多数节点收到。这可以加速区块广播,使广播协议层获得接近节点连结层的延迟。2017年后,高性能公链基本都采取了这一设计
2.共识模块
共识协议是区块链系统中最复杂、最精巧的部分,它协调各个互不信任的节点,并为上层应用提供提供可信的去中心化服务。很长一段时间内,对共识模块的性能优化都是热点
带宽:中本聪共识自身的缺陷导致它的共识带宽必须处于一个非常低的水平,否则会增加网络分叉,降低系统安全性
2017年后的新协议基本都可以充分利用带宽了,这不再是一个难题
不过,有些项目混淆了共识模块的tps和区块链系统的tps,把充分利用带宽称为“无限可扩展”,仿佛网络带宽是无限的
延迟:共识的延迟指区块从产生到finalize需要多久。中本聪共识的确认延迟很差,大概需要30~60倍广播协议层延迟,后续PoW协议例如Bitcoin-NG,OHIE等也没有优化这一延迟
Prism将延迟优化到了23倍,Conflux优化到了3倍。PoS协议我了解得有限,估算大概需要5倍延迟
不过PoW和PoS协议有一个很大的不同:PoW参考最大延迟,PoS参考中位数延迟,而最大延迟和中位数延迟可能有3倍差异,所以PoS共识普遍延迟表现更好一些。节点少的话,进入10秒也不是不可能。至于以太坊这种上了PoS共识反而更慢的,只能说是一个奇葩吧
共识模块是“参数虚标”最严重的地方。比如,明明需要等6个区块才能达到安全性要求,项目方告诉你1个区块就行,反正没人攻击就不会露馅,没资产就没人攻击
还有一种叫分片的技术:给节点分组,把交易分给各组,每组只处理自己的交易、相信其他小组。这种技术通过增加小组数量,容易获得一个很高的tps用于吹嘘,但相信其他小组会带来安全风险。所以分片适用于对安全性要求不高的场景,如国产联盟链
3.执行模块
以太坊之所以能在比特币外开辟一片天地,在于它创造了可编程的数字资产。因此交易执行模块也是区块链系统的重要的一环。也是在早期的性能优化中被忽视的一环
执行不再区分带宽和延迟,只关心单位时间内处理的交易或计算任务数量。
执行模块的效率受到计算机系统各个资源的限制
3.1CPU资源
在串行执行中,CPU的性能瓶颈是非常明显的。在过去5年内,CPU单核性能提升了不到1倍。在EVM中,如果不考虑存储访问,最快的CPU大概1秒能执行1亿gas,是现在以太坊性能的80倍
并行执行是利用CPU资源的关键一步。一些项目在尝试提出更利于并行的语言模型,例如Move
在Conflux一项关于EVM并行化的研究表示,目前以太坊链上交易的并行化潜力是9倍tps
但是,并行化VM有很多的挑战。比如,理想情形下,交易高度并行;最差情形下,交易相互依赖,只能串行。那如何设计gas定价与gaslimit,使得理想情况可以充分利用并行优化,而最差情况又不至于跟不上执行?
3.2存储访问资源
和网络设施层一样,这里的性能主要取决于硬件的发展和区块链节点的最低配置。除非数据被缓存在内存里,执行交易时的读写性能不可能超越硬盘的读写性能
还拿Aptos举例,他们节点的存储要求是40KIOPS,而一笔交易可能涉及到发送者和接受者两个账户的状态修改,也就是最差情况下网络只能支持2万tps
但他们的宣称tps是16万,可想而知这后面有多少不公开的前提条件了
3.3可验证存储结构
可验证存储结构是区块链存储的一个重要数据结构。它允许一个轻节点向一个它不信任的全节点查询链上状态,是区块链trustless里的最重要一环
在以太坊中,访问可验证存储结构MPT比直接访问数据库慢10倍。所以,有些区块链干脆去除了可验证存储结构,以换取更好的性能
最后做个总结,区块链的性能优化不是一个追求极限的过程,而是在各种限制下对安全、效率、去中心化程度的取舍
有些取舍是可以被优化的,比如中本聪共识中,共识带宽与安全性的矛盾后来被解决了
有些取舍是不可避免的,如果你要求每个节点配备256GB的内存,就注定了独立参与者的数量不会太多
一味地去追求纸面上的高性能,只会得到一个中心化的宕机链。只有真正去面对和解决性能优化中的问题,才是性能提升的正途
希望这篇文章对大家有一定的帮助,有想跟作者聊聊的欢迎私信!
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。