比特幣行情 比特幣行情
Ctrl+D 比特幣行情
ads

PRY:Medalla 測試網網絡動蕩始末

Author:

Time:1900/1/1 0:00:00

編者注:2020年8月15日,Medalla測試網出現了驗證者參與率的大幅下降,起因是Prysm客戶端默認使用Cloudflare公司的roughtime服務來較準節點的本地時間,但當時的roughtime服務出了錯,導致所有Prysm節點的本地時間都快了4個小時,如此一來,Prysm節點就與使用其它客戶端的節點隔絕開來了。

事發之后,Prysm客戶端團隊迅速推出了緊急修復并密切跟蹤事態。但Medalla測試網仍因為各種原因而繼續動蕩,無法敲定epoch。事實上,事發之后,截至發文之時,Medalla測試網僅在北京時間2020年8月20日凌晨曾敲定區塊,隨后驗證者參與度又降到了66%以下,未能敲定區塊。

事實雖然令人不安,但它恰好提供了一個我們審視Eth2網絡、審視節點行為的機會——絕不應放過這樣的審視和反思的機會,否則我們仍有可能重蹈覆轍。

我們選擇了多份材料,嘗試多角度、多層次地復現完整的事實、囊括盡可能多不應被忽略的因素。誠然,我們缺乏能觀察到去中心化網絡全局情形的上帝之眼,認知的深度必定有其邊界,但我們仍然希望,對陷入混沌的網絡的恢復過程和參與者在此過程中的激勵因素,能有一個完整的描述。到目前為止,這個目標還未實現。

第一份材料,來自Prysm客戶端工程師prestonvanloon.eth在推特上對事件的報告。

Medalla測試網全局性故障初探

phil.eth:

ETH2.0測試網Medalla目前無法敲定區塊,因為Prysm客戶端的roughtime時鐘同步出了問題。目前已經有了修復方案。請Prysm用戶更新并重啟你們的客戶端。這一突發情況再次表明了客戶端多樣性以及測試網的重要性。

prestonvanloon.eth:

今天早些時候,Prysm出現了全局性故障,持續時間將近90分鐘。本次事件的始末如下:

世界協調時17:30左右,@terencechain發現其客戶端的時鐘提前了4小時。很快,出現時鐘偏移報警,discord頻道也被大量用戶報告淹沒。

前Alameda CEO Caroline Ellison證詞已被暫時封存并向FTX客戶、投資者致歉:金色財經報道,據《紐約時報》披露,前Alameda Research首席執行官Caroline Ellison已經表示,自己想向FTX客戶、投資者、Alameda貸方道歉,并且對因FTX破產而導致的一系列刑事指控“感到非常抱歉,并且知道這是錯誤的”。據悉,美國檢察官擔心SBF可能提前知道FTX首席技術官Gary Wang和Alameda Research前首席執行官Carolin Ellion已經認罪,因此已將Caroline Ellison的證詞記錄暫時封存并推遲了公開備案時間。[2022/12/24 22:04:57]

Prysm客戶端確實出了問題。

Medalla測試網上的驗證者參與度驟降,其下降速度甚至超越了$YAM的歸零速度,從75%降至5%以下。PrysmaticLabs團隊立即展開了緊急行動。

我們決定將軟件改成默認禁用roughtime時鐘同步,取而代之的是可選擇的功能切換。這樣可以防止此類問題再次大規模爆發。從現在開始,roughtime的結果將僅供客戶端軟件參考,不再用于自動時鐘校準。

下圖是Prysm節點出現超過2秒的時鐘偏移的時間段,從北京時間凌晨1:30至3:00持續了大約90分鐘。

-圖片來源:@prestonvanloon.eth-

現在,我們正看著這個數據思考一個問題“roughtime服務器怎么會偏差這么大?”數據顯示,所有Prysm服務器報告的偏移量都在0.1秒不到。最后為什么會提前4小時??

-圖片來源:@prestonvanloon.eth-

我們還在調查這個問題!肯定是roughtime的增量計算出了bug,我們希望能盡快找到它。無論調查結果如何,我們認為應該將自動時間校準作為可選項,甚至徹底取消掉。

歡迎閱讀完整的事后調查報告,了解最新的調查進展。

3Commas完成3700萬美元B輪融資,Target Global和Alameda Research等領投:9月23日消息,加密機器人交易平臺 3Commas 完成 3700 萬美元 B 輪融資,Target Global、Alameda Research、Jump Capital 以及加密托管公司 Copper 的創始人兼首席執行官 Dmitry Tokarev 領投。本輪融資將用于推進機器人技術、擴展交易生態系統和增強開發人員工具,并為 3Commas 生態系統創建應用程序。

3Commas 是一個產品生態系統,提供由機器學習驅動的交易機器人管理的交易工具和自動化策略,這些機器人使用歷史數據來幫助投資者利用不同的加密交易策略。(Coindesk)[2022/9/23 7:15:15]

在主網上線之前,測試網就是用來發現這類問題的。面對這種情況,多幾個客戶端選擇對用戶更為有利。

原文鏈接:

https://twitter.com/preston_vanloon/status/1294392007599652865

作者:?prestonvanloon.eth

翻譯&校對:?閔敏?&?阿劍

編者注:第二份材料來自Prysm客戶端團隊的分析報告,有詳盡的時間線記錄。從中我們可以知曉Prysm客戶端發布緊急修復的整個過程,以及緊急修復帶來的連帶影響。截至本譯稿發表之時,該分析報告表示已經找到了故障的具體原因。值得一提的是,報告原文所用的都是UTC時間,我們一律轉換成了北京時間。

“roughtime”事件分析報告

作者:Terence、Raul、Preston

狀態:等待決議。根本原因已找到,問題已緩解。

網絡:Medalla

總結:Cloudflare的roughtime服務器全都返回錯誤信息,而Prysm節點并沒有采取適當的應急措施。這個bug導致所有Prysm節點出現時鐘偏移。在時鐘偏移的影響下,驗證者為超前的slot提議區塊并生成見證消息。

Parity 與MediLedger達成合作以提高生命科學供應鏈的完整性:金色財經報道,MediLedger Network背后的科技公司Chronicled與Parity Technologies (Polkadot和Substrate的開發商)達成了合作關系。兩者將共同利用現代點對點通信和區塊鏈技術,以提高生命科學供應鏈的完整性和效率。據悉,MediLedger Network是使用Parity的區塊鏈框架Substrate開發的區塊鏈系統,目標是追蹤處方藥的供應鏈,更好地制止假藥流通。(PRNewswire)[2022/1/23 9:07:13]

影響:由于roughtime響應錯誤以及出現時鐘偏移,驗證者計算slot錯誤,提議的區塊和生成的見證消息均無效。這個問題影響到了全局參與度。在北京時間凌晨1:30至2:45之間,所有Prysm節點都受到了影響。

根本原因:來自Cloudflare服務器的roughtime響應出錯。具體來說,是因為“ticktock”報告了一個24小時之后的時間。這個時間戳,再經過所有6個服務器的數據取平均值,是的所有Prysm節點都產生了4小時的時間調整。

解決方案:在我們評估roughtime響應錯誤所引發的潛在問題時,先將roughtime時鐘同步設為可選項。

發現:Terence最先發現了這個問題。他注意到一個本地信標鏈節點一直在拒絕超前的區塊和見證消息。幾分鐘之后,由于roughtime時鐘偏移量較高,產生了報警。同時,#general和#bug-report頻道的用戶開始報告本地節點拒絕超前區塊和見證信息的問題。

經驗教訓

哪里出了問題

我們誤以為,對于roughtime服務器故障的問題,我們有適當的應急方案。

網絡中的每個Prysm節點同時受到影響,導致驗證者參與率大幅降低。

PrysmaticLabs團隊原以為,NTP服務器本身較為分散,而且每個服務器都開放6個端口,不會出現全局故障的問題。

Alameda Research向DeFi借貸協議Oxygen投資4000萬美元:Alameda Research今天宣布向DeFi協議Oxygen投資4000萬美元。Oxygen是一個基于Solana的借貸平臺。與Aave和Compound等借貸協議類似,“Oxygen將首先通過池提供借貸服務,用戶將存儲他們的資產,并利用Serum的鏈上基礎設施,根據他們想要的條款放貸。用戶還可以在以自己的投資組合為抵押借款的同時,借出資金以產生收益。”

雖然在官方渠道上很難獲得具體細節,但Oxygen聲稱擁有一系列計劃中的功能,包括與以太坊原生協議(如Aave和Yearn)的跨鏈集成以及完全去中心化的治理。該協議目前處于Alpha階段,最大的債務池為1000美元。除了Alameda Research之外,MultiCoin Capital、Genesis Capital和CMS Holdings也加入了這輪融資。(Cointelegraph)[2021/2/24 17:49:19]

萬幸的是

一位貢獻者已經向我們提交了一個PullRequest,把roughtime時間校準設為可以選擇退出的功能。

我們已經可以用命令行功能標簽立即選擇取消roughtime時鐘校準,這讓修復措施變得簡單,而且只需一次PullRequtest就能驗證。

用戶在Discord上積極參與討論。當節點出現問題時,有大量用戶提供了詳細報告和重要指標。

我們有一個持續不斷的重同步機制,當它發現時鐘偏移量超過2秒時,它會不斷更新節點本地的時間。我們一直在重新校準roughtime時鐘,以便更快解決這一問題。這可能讓這次事件提前了大約30分鐘至1小時結束。

roughtime時鐘同步問題似乎在大約90分鐘后就解決了,而且在我們能夠緊急發布新版本前,這個事件就已經結束了。

時間線

2020/08/15

1:25AM:Terence發現他的本地節點由于一直拒絕超前區塊,收到了大量報警。這些區塊的slot都超前了4個多小時。

Prysm節點需盡快升級至alpha.22版本 支援Medalla測試網從同步障礙中恢復:星火礦池(SparkPool)呼吁以太坊社區,目前Prysm已修復同步出錯問題,所有使用Prysm客戶端參與Medalla測試網的用戶需檢查自己的客戶端是否升級到alpha.22版本。如果尚未升級,應盡快升級,以支援Medalla測試網從同步障礙中恢復。

注:8月15日,以太坊2.0客戶端執行團隊Prysmatic Labs聯合創始人Preston Vanloon表示,8月15日,以太坊2.0測試網Medalla上出現時鐘bug,導致對所有節點造成影響,Prysm節點出現了長達近90分鐘的時鐘偏斜(clock skew),驗證器也陸續收到超前Slot區塊和證明。[2020/8/17]

1:28AM:Prometheus監控報警系統收到了roughtime偏移量高的報警。那時,距離網絡最后一次敲定區塊過去了10epoch。

1:35AM:至少有30名用戶在Discord頻道表示他們開始收到下方報警:WARNroughtime:Roughtimereportsyourclockisoffbymorethan2secondsoffset=4h0m0.028854657s

1:43AM:Terence在#war-room頻道群發了告警消息,稱這是一個PS0級別的事件,需要大家共渡難關。

1:45AM:Discord頻道的用戶提出,重啟信標鏈節點和驗證者客戶端無法暫時解決這個問題。最可行的方案是將roughtime時鐘同步設為可選禁用的功能。

1:51AM:問題上升到了多客戶端聊天室

1:52AM:Ivan完成了https://github.com/prysmaticlabs/prysm/pull/6898

2:00AM:Terence與512位驗證者一起在本地測試了6898號PullRequest。

2:20AM:據已捕獲的調試日志顯示,“ticktock”服務器有段時間一直在報告24小時之后的時間。

2:27AM:Raul聯絡了Preston。Preston將在1小時內回來構建新版本。同時,我們將發布docker鏡像。

2:40AM:Preston指出只靠緊急修復還不夠,我們需要取消將roughtime時鐘同步作為默認項。

2:42AM:Raul開始調查Kibana,并使用fluentd中的filter分析來自roughtime的調試日志響應。

2:43AM:Terence交叉檢查了信標鏈命名空間中所有pod的kubectl日志。正如預期的那樣,pod確實存在roughtime時鐘偏移問題。

2:46AM:Raul向6898號PR提交了正確的修復程序。

3:05AM:Raul確認該修復程序可以讓節點在本地工作。如果存在時鐘偏移,修復程序會產生告警日志,但是不會試圖基于roughtime服務器更新時間。

3:08AM:Terence在我們的discord頻道向所有人宣布:“Prysm節點出現roughtime響應錯誤,應急措施沒有達到預期效果。我們已經找到了故障所在,很快就會進行緊急修復,并在1小時內上線新版本。在即將發布的新版本中,roughtime時鐘同步將不再是默認項。”

3:18AM:Buildkite單元測試、規范測試、docker鏡像構建成功。e2e測試尚未完成。Preston準備啟動上線流程。

3:22AM:新版本生成:https://github.com/prysmaticlabs/prysm/commit/d24f99d66db22691b69c76bc57c7509e7f3ba8fe。Terence確認這個方法可以修復其驗證者節點。Preston開始使用新的docker鏡像依次重啟我們的有狀態集合中的pod。集群驗證者會基于新的鏡像進行更新。

3:34AM:Docker鏡像被標記成alpha21版本,穩定性好,二進制文件已經構建完成

3:34AM:對有狀態集合中pod的健康狀態進行監控,確保滾動更新成功

3:36AM:使用新的docker鏡像對我們的驗證者pod進行滾動啟動。

4:29AM:在日志上查看返回的延時值。平均來看,這些值似乎都在0.1秒以下。延遲不是調查的關鍵指標。準確來說,“中點”才是需要研究的地方。注:下表時間是太平洋標準時間。https://kibana.prylabs.network/goto/e5f5f64a4426c85aee1d76abc2d994be

-圖片來源:@prestonvanloon.eth-

5:32AM:查看高于2秒的偏移量。從該數據中可以看出,在長達90分鐘的全局故障期間,Prylabs出塊節點的偏移量大約是14000秒。注:下表時間是太平洋標準時間。https://kibana.prylabs.network/goto/6ce2d73c13c0eef600b604fee6d8f4f4

-圖片來源:@prestonvanloon.eth-

4:41AM:通過Prometheus報警系統關于平均偏移量的數據,我們可以明顯看出在北京時間凌晨1:30至2:45之間確實存在時鐘偏移問題,之后偏移量開始下降并恢復正常。

4:52AM:即時調查結束。這次時鐘偏移故障顯然已經結束,而且修復程序已經發布。已經更新的節點將立即恢復,還沒有更新的節點需要過段時間恢復。監控系統顯示,驗證者參與度在逐步回升。

6:20AM:用戶報告說罰沒保護機制已經啟動。這是因為之前的時鐘偏移導致驗證者超前4小時提議區塊并生成見證消息。為了避免遭到罰沒,Prysm驗證者沒有繼續提議無效區塊。

8:13AM:再次故障

8:13AM:Nishant注意到6898號PR中存在嚴重缺陷。只有在roughtime功能標記開啟的情況下,用戶才能設置它的功能。

8:16AM:Preston更新了“最新的”二進制文件,使其指向alpha20版本來實現臨時回滾,并建議用戶回滾至alpha20版本。我們現在正在等待合并7004號PR作為alpha22版本的候選。

8:45AM:值班團隊正在評估是否擴大熱狀態緩存的大小,以便alpha22版本能夠更快讓網絡重新開始敲定區塊。當前默認的熱狀態緩存大小為8個epoch,但是Medalla測試網距離上一次敲定區塊已經過去了將近100個epoch。

9:12AM:值班團隊決定將默認緩沖大小更新至64epoch,并使其可以通過功能標記來配置。經過初步測試,這有可能會使內存使用量增加1.5G。等網絡重新開始敲定區塊后,緩沖大小還可以調整。

9:57AM:所有PrysmaticLabs驗證者節點都生成了會被罰沒的見證消息。緊急修復程序刪除了Prylabs驗證者節點的本地存儲。沒有任何外部的罰沒保護機制在運行。具體情形尚待確認……在1024名驗證者中,至少有800名驗證者已經或即將遭到罰沒。

10:37AM:多名用戶報告稱無法同步區塊鏈。目前的問題是,網絡中有太多節點在同一時間進行同步。Alpha22版本被推遲,需要等待進一步通知。

10:46AM:Prylabs團隊認為現在最好的辦法就是等待。用戶應該運行alpha20版本或最新的docker鏡像。

2020/08/16

2:12AM:正在對同步難的問題進行調查。

11:36AM:Nishant和Victor發布初始同步修復程序。參見PullRequest7012。

2020/8/17

1:51AM:合并拉取7012號PR。一些用戶報告說同步成功。PrysmaticLabs開始將7012部署到出塊節點上。

5:15AM:從commit0be1957c2897909b943b80fdd028f5346ae6cde6開始開發Alpha.22版本

5:33AM:Alpha22版本發布。鏈接:https://github.com/prysmaticlabs/prysm/releases/tag/v1.0.0-alpha.22

5:40AM:通過Discord頻道宣布Alpha22版本上線。Prysmatic的值班團隊繼續監控同步情況,以便進行優化。與此同時,越來越多用戶同步至最新區塊。

12:53AM:Alpha23版本上線,已在Discord頻道宣布該消息。Alpha23版本包含一些同步修復程序,有望解決Medalla測試網的問題。建議用戶在運行時開啟“--dev”標記,以便獲得更好的體驗。

原文鏈接:

https://docs.google.com/document/d/11RmitNRui10LcLCyoXY6B1INCZZKq30gEU6BEg3EWfk/edit#

作者:?PrysmaticLabs

翻譯&校對:?閔敏?&?阿劍

Tags:PRYTIMETIMIMEpry幣行情time幣最新消息CRAZYTIMEtime幣官網下載app

歐易交易所
數字貨幣:全球央行推進數字貨幣研發 多國試水不同方案

全球數字貨幣發展勢頭強勁,包括英國、日本、瑞典在內的多國政府均在持續推進研發央行數字貨幣,與此同時,正在進行封閉試點測試的數字人民幣也引發全球的廣泛關注.

1900/1/1 0:00:00
ISM:8.22凌晨的行情瀑布打破市場的持續動蕩、低點試探帶動市場恐慌、

8.22凌晨的行情瀑布打破市場的持續動蕩,低點試探到底了嗎董主任解幣a2020-08-2210:20:59做投資不論什么品種都是做大局觀,股票、期貨、現貨等等.

1900/1/1 0:00:00
BIKI:關于第二屆BIKI混合合約交易大賽,首次開倉獎勵50BIKI的公告(0821)

尊敬的用戶, BiKi平臺將舉辦“第二屆BIKI混合合約交易大賽,首次開倉獎勵50BIKI”的活動.

1900/1/1 0:00:00
區塊鏈:金色早報|以太坊2.0測試網Medalla已啟動并運行

頭條 ▌以太坊2.0測試網Medalla已啟動并運行以太坊2.0測試網Medalla再次啟動并運行,雖然驗證者參與率雖然提高了很多,但剛剛參與率出現明顯波動.

1900/1/1 0:00:00
LSD:墨菲言幣:8.21 BTC午間行情分析

各位朋友們,你們好,我是墨菲言幣。墨菲本著負責、誠懇、認真的態度用心寫好每一篇分析文章,特點鮮明,不夸張,不含糊,力求能讓大家看懂大的趨勢分析以及小范圍的多空搏殺力度!:4小時看布林通道偏下運行.

1900/1/1 0:00:00
BAY:羅浩天:8.21今日思路不變,多單耐心等待,主要以反彈空為主

尊重市場,跟隨市場,計劃行事,理性思考,踏準節奏,順勢操作。人生不在于拿到一幅好牌,而是怎樣將壞的牌打好,一步一個臺階才能超越更高峰,人生如旅途,一路風景,一路心情,感恩幣圈,你我相行.

1900/1/1 0:00:00
ads