观点 | 以太坊状态规模管理诸提议(上)
从状态树上移除 vs. 给状态树安排一个 “退休” 部分
另一个区分不同状态过期提议的技术角度是 “一树流” 和 “二树流”。也就是说,我们到底是像现在这样,只有一棵状态树,只不过把某些状态标记为过期;还是直接把失活的状态从主状态树上移除,转移到另一棵专门的(只包含过期状态的)树(或者其他数据)上?
一树流
- 激活节点以白色标记,失活节点以灰色标记 -
注意,即使是树上的中间节点,也会被标记为激活或者失火(或者,更现实一点的方案,每个节点都会带有失活日期的标记,所以能够容易检查其活性);标记工作可以在状态树上的每个节点(叶子节点和中间节点)处完成。
二树流
- 白色的树包含激活状态;灰色的树存储失活状态 -
一树流的好处是,最起码,其工作方式看起来会跟当前的状态树相似,失活和复活的流程也比较简单:复活流程只需刷新树上相关节点的 “过期日期” 参数,而失活则是自动化的。但它的缺点在于:它需要一种能够在节点中以此种方式存储过渡信息(intermediate information)的树结构,而且不能很好地扩展到 Verkle 树。此外,它还需要额外的默克尔证明元件,不仅要能够下沉到叶子节点,还要能够(在需要证明某部分状态已经过期时)停在中间节点处。
以太坊基金会发布官方《主网合并公告》并推出100万美元漏洞赏金激励措施:8月25日消息,以太坊基金会官方网站发布协议支持团队最新的《主网合并公告》,除了确定世界标准时间2022年9月6日上午11:34:47升级Bellatrix、TerminalTotal Difficulty触发预计在2022年9月10日至20日之间之外,以太坊基金会还宣布将原漏洞赏金激励计划扩大四倍升至100万美元,旨在鼓励社区在9月8日之前发现The Merge中存在的潜在问题和Bug。
此外,以太坊基金会提醒节点运营商必须同时运行执行层和共识层客户端,才能在TheMerge期间和之后在网络上正常运行。[2022/8/25 12:46:42]
二树流的好处是:当前的、形式纯粹的状态累加器就能支持这类方案,而无需为每个节点增加元数据。缺点是,它需要对整个协议做一些更深层次的变更,而且需要一个显式的流程来灭活状态(所以过期不再是自动化的了)。另外,它也没有为复活冲突两难(见下一节)提供内置的解决方案,所以需要在两种办法中作出选择。
注意,在二树流中,存储失活状态的数据结构不是非树不可。事实上,完全有可能出现这样一种设计:需要复活一个状态对象时,只需提供一个指向该对象失活时候收据的默克尔树,再附上一些密码学证据,证明此前该对象未被复活过(或者最近又重新过期),即可。
复活冲突
然后我们就到了状态过期方案的一个关键难题上:“复活冲突”。复活冲突的概念如下。假设某个账户由地址 A 生成;这个账户过期了;然后,地址 A 又创建了一个新的账户(例如,使用 CREATE2 操作码保证两次生成的账户的地址是同一个);最后,地址 A 再尝试复活那个最开始的账户。这时候会出现什么情况?
科学家学术论文描述针对以太坊PoS链的3种攻击方法:10月31日消息,来自斯坦福大学和以太坊基金会的计算机科学家Caspar Schwarz-Schilling、Joachim Neu、Barnabé Monnot、Aditya Asgaonkar、Ertem Nusret Tas、David Tse最近撰写一份新白皮书,描述了针对以太坊PoS(权益证明)链的3种攻击方法。该白皮书揭示了最近出现的两次以太坊网络攻击,并且该论文的作者改进了这些技术。
除了前两种方法(理论上会造成“短程重组”和“对抗性网络延迟”)的改进之外,计算机科学家还提出了第三种攻击。“结合两种改进的攻击技术,我们获得了第三种攻击,它允许拥有极少权益(stake)且无法控制网络消息传播的对手进行甚至是远程(long-range)共识链重组。”作者们补充说,“诚实但理性或有意识形态动机的验证者可以利用这种攻击来增加他们的利润或阻塞协议,从而威胁到PoS Ethereum的激励一致性和安全性。该攻击还可能导致投票处理拥堵导致共识不稳定。”
同时,以太坊网络批评者使用这篇论文强调当网络过渡到完整的PoS系统时与这些攻击相关的潜在漏洞。Chia创始人、Bittorrent创建者Bram Cohen发布关于这项新研究的推文。Chia支持者回应称,“让我们在一年后重温你的推文,看看Chia与ETH相比取得了什么成就。请考虑你的态度,正在拒绝像我这样的社区成员。”
该论文的作者总结道,“我们的攻击也使得可能出于意识形态动机的先天性恶意行为者推迟并在某些情况下彻底拖延达成共识的决定。第4.2节的改进攻击为攻击者提供了一种工具来做到这一点,即使攻击者无法控制消息传播延迟(这被认为是概率性的)。”(Bitcoin.com)[2021/10/31 6:23:20]
这里有几种可能的解决方案:
数据:以太坊网络当前已销毁超49.5万枚ETH:金色财经报道,据Ultrasound数据显示,截止目前,以太坊网络总共销毁495449.17枚ETH。其中以OpenSea开头地址销毁945.03枚ETH,ETHtransfers销毁582.85枚ETH,UniswapV2销毁431.48枚。注:自以太坊伦敦升级引入EIP-1559后,以太坊网络会根据交易需求和区块大小动态调整每笔交易的BaseFee,而这部分的费用将直接燃烧销毁。[2021/10/11 20:19:08]
显式的 “账户合并” 流程:类似于规定 “除了两个账户的 ETH 余额相累加以外,以旧账户的状态为准”或者 “除了累加 ETH 之外,以新账户的状态为准”;甚至于,可以由旧账户的合约代码来规定特殊的合并流程
通过消除同一地址重复部署的功能来确保复活冲突不会发生:也就是调整 CREATE2 的功能,比如在最终哈希成地址的数据原像中包含当前时间,因此即使未来使用同样的数据来生成,也无法得到同样的地址
向状态对象增加一个 “存根”,以防止在同一位置生成新账户(上述一树流方法自动实现了这一功能)
要求生成新账户时都必须附带该账户此前未过期的证明:某种意义上等价于存根方案,只不过这种办法是把存根放在状态的一个单独部分中,所以任何想要创建合约账户的用户都必须跟踪这部分状态
(注意,如果我们使用存储槽过期方案,则上述任一解决方案都必须延伸到单个存储槽层面,而不能止步于账户层)
以太坊2.0客户端Lighthouse发布最新进展:内置Schlesi支持:以太坊2.0客户端Lighthouse开发团队Sigma Prime近期发布了项目最新进展,具体如下:
- 密钥管理实施;
- 首次使用Trail of Bits进行外部安全审查;
- 内存占用最小化;
- 依赖项升级;
- 内置Schlesi支持;
- BLS升级。[2020/5/24]
主要的担忧有:(1)会给应用增加很多复杂性,他们需要加入合并的逻辑;(2)这样做了之后,除非在链上 “注册” 一个地址,否则用户就没法再轻易获得可以与之交互、可以积累资产(例如 ERC20 token)的地址了。未注册的地址是很重要的:任何第一次收到 ETH 的用户都是在使用一个尚未注册的地址。这第 (2) 的担忧的根源是:未注册的地址实际上有了时间限制,如果用户生成了一个地址、收到了资金,但在接下来一年里忘了发送交易(也就是忘了 “注册”),那他的资金就会被锁住。
注意,EOA 也不能幸免。虽然看起来能够,因为 EOA 的合并流程比较简单(只需把旧的 ETH 余额加到新的里,对 nonce 则有 EIP 169)这样的方案。不过,这里也有两个问题。首先,账户抽象的目标是用合约来替代 EOA,而账户抽象化的合约的合并流程可能并不简单。其次,会受过期和复活事件影响的不仅有 EOA 本身,还有该 EOA 所参与的应用中的相关存储键(例如 ERC20 token 余额),所以还是需要复杂的合并逻辑。
声音 | V神:Dapps应与任何支持以太坊的浏览器兼容,反对“捆绑”模式:今日推特网友“CharlesSWE”发文不满以太坊链上开源众筹平台Gitcoin“强制”用户使用MetaMask浏览器,该网友表示Opera都支持以太坊Dapps并且兼容Web 3的供应商了,(Gitcoin)实在没必要这么做。在 Gitcoin 看见这种情况的感觉就跟“请使用 IE 浏览器安装程序”一样。V神转发了这条推特并表示,所有Dapps都应设计成与任何支持以太坊的浏览器兼容。供应商的“捆绑”模式恰恰是这个行业(去中心化)要反对的关键问题之一。[2020/1/14]
因此,从我的角度来看,破坏性最小的是某种形式的存根方案。不过,存根方案里存在一个信息理论问题,会导致一些奇怪的结果。为了防止新的状态对象在 N 个已经过期的状态对象位置处创建,一个覆盖(cover)了这 N 个地址(以及/或者 存储键)的集合必须是状态的一部分。如果这个集合是信息最小化的(即,只包含了这些地址),那么这个集合的大小会是 O(N),因此其状态规模也是 O(N);那么,激活状态的规模就将与失活状态的规模成比例,所以实际上我们并没有解决这个问题。
Tree rot
解决这个问题的唯一办法就是覆盖超过那 N 个账户的信息;实际上,我们将不得不让整棵树都变得不可访问(再次提醒,这就是一树流解决方案的实质:如果两个账户过期了,它们之间的所有空间都会隐式过期( if two accounts get expired, all the space in between them also implicitly gets expired))。
而这里还有一个问题:这产生了一种形式的 “树发霉(tree rot)”,随着时间推移,对于新帐户的创建来说,状态树的所有部分都是不可访问的,至少对那些没有跟踪该区域过期状态的用户来说是这样的。
而树发霉导致的次生问题也必须解决。举个例子:如果一个合约要创建子合约,它必须能够在要么未发霉,要么用户具有见证数据的状态区域创建合约(也许需要用户提供的 “提示”)。树发霉问题的一个解决方案见此处:持续地开放状态的新区域以供账户创建。另一种思路是每个用户都选择状态的某些区域(例如状态的 1/256),跟踪该区域的变化(包括过期状态)以便能创建见证消息,并且只在该区域创建帐户。
树发霉的另一个问题是,它需要一个显式的数据结构来存储和检查范围。如果一棵树有能够放在节点中、指明该节点以下的哪些部分已经过期的数据(就像一树流解决方案所用的那样),那是最好的,但一个键值对存储要做到这一点还是相当有难度的。
在状态过期方案中使用树结构所产生的许多问题,都可以被追溯到这样一个事实:我们需要对哪些状态是活跃的、哪些状态是失活的,达成共识。在二树流模式中,这一点更加明显;但即使是在一树流模式中,状态树上也需要有显式的标记,以便近期使用快速同步下载了状态的以太坊节点能够确定一笔尝试访问某个账户、但又没有提供见证消息的交易,应该成功还是失败。那我们能不能做到不需要明确这个区别呢?
如果我们实现了完全的无状态性,然后能帮助交易发送者和区块生产者可靠地获得见证消息生成所需的状态,不就解决这个问题了吗?那什么办法能帮助交易发送者和区块生产者做到这些呢?
一种自然而然的办法是:网络中的节点都仅保存状态树的一部分,例如,在过去一年中访问到的那部分。只需在客户端设定中加入一个自愿的设定即可。如果我们想要更可靠一些,我们可以通过引入一种 proof of custody 方案,强制至少矿工(后面就是 PoS 的验证者)存储一些数据。
有一点需要注意:如果共识层不能感知哪些状态是活跃的、哪些状态是失活的,那访问近期状态和老旧状态的 Gas 开销就是一样的。这会导致两个结果:
访问近期状态的 Gas 开销也需要进一步提高
包含了见证消息的区块大小上限可能非常之大,如果一个区块里满是访问老旧状态的事务的话(大概是?800 bytes * 12.5 m gas / 2400 gas per access ~= 4.1 MB,已假设实行了 EIP-2929,转成了二进制树)
如果我们想避免这些不利因素,就需要在共识中跟踪哪些状态对象(包括尚未填满的地址空间区域)是活跃状态,这又会让我们回到接近于状态过期方案的属性。这再一次地说明了,“无状态性 vs. 状态过期(状态租金)” 是一条光谱,是一个复杂的权衡空间,而不是一个非此即彼的选择。
以太坊的一种重要的中期可扩展性解决方案是 rollups(中文译本)。不过,rollup 本身并非不再需要担忧状态数据规模问题;实际上,rollup 系统的状态规模问题,与以太坊链本身的,性质完全相同。
幸运的是,如果我们能推出一种解决方案,则至少 EVM rollup(尝试最大程度复制以太坊运行环境的 rollup 方案)能够使用同样的解决方案,来解决其内部状态的规模问题。因此,状态规模管理方案,与 rollup 和 分片等可扩展性方案是互补的(state size management is complementary to rollups, sharding and other scaling strategies)。
(译者注:个人认为此处的 “互补”一词有严重误导性。)
状态规模是一个日益恶化的问题,而状态规模的解决方案也能为大幅提高区块 Gas 上限铺平道路。我们应该对某种形式的状态过期方案达成共识并加以实现。不过,不同的解决方案之间存在重大技术权衡,尤其如果我们还想要保持当前设计的一些重要属性的话。
一些我们可能需要牺牲的属性包括:
用户可以离线生成账户并以该地址接收资金、并且在使该地址在链上显明之前可以静默任意时长的属性
地址保持 20 字节的长度(rolling state expansion 方案需要更大的地址空间,虽然地址的长度可能本来就需要为抗碰撞的缘故很快改变)
状态可以被视为 “纯粹的” 键值对存储的属性,以及无需在状态树上每个节点内存储元数据的属性
现有的应用需要程度不等的重写,以保证用户无需存储全部失活状态就能生成见证数据
Gas 消耗量;或者创建新合约、写入新存储槽的难度
我们如果已经准备好作出牺牲,有些方案可以很快开始着手实现。另一方面,也许假以时日,我们能修补或者更好地汇总这些观念,减少问题,尤其是使它们在技术上更容易实现(例如,允许使用 “纯粹的” 键值对存储)。我们应该更深入地理解我们 更愿意/更不愿意 接受哪些方面的牺牲,并继续积极研究改进提案。
原文链接:
https://hackmd.io/@HWeNw8hNRimMm2m2GH56Cw/state_size_management
作者:?Vitalik Buterin
翻译:?阿剑
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。