Facebook 正對開放運算計畫 Time Appliance Project (OCP TAP) 進行開源,以符合成本效益的方式,在各資料中心之間提供極為精準的計時和時間同步功能。此解決方案包括採用 NVIDIA ConnectX-6 Dx 網路介面卡 (NIC) 的計時卡,可以將?大多數商用現成 (COTS) 的伺服器變成準確的計時設備,並搭配精確時間協定 (precision timing protocol),與資料中心的其他伺服器共用精準的計時功能。
Facebook 的計時卡結合 NVIDIA 的網路介面卡,為資料中心營運商提供了現代且經濟實惠的時間同步解決方案,不僅開源、具備安全性和可靠性,還能加以擴充。
隨著應用逐步擴大且 IT 營運範圍遍及全球,要將資料中心內的不同伺服器或各大洲的不同資料中心保持資料同步,變得越來越重要也更加困難。如果是分散式資料庫,則必須追蹤事件的確切順序,以保持一致性並顯示因果關係。如果有兩個人試圖購買相同的股票,基於公平性 (與合規性),便需要確切地知道哪一筆訂單先送達。同樣地,當每小時有數千人發佈內容、數百萬名使用者對這些貼文按讚/哈/大心時,Facebook 需要知道每篇貼文獲得讚、回覆或表情符號的實際順序。
保持資料同步的方法之一,是讓每個資料中心在每次交易後,都將其更新傳送給其他資料中心,但是這種方法很快就變得不管用,因為資料中心之間的延遲太高,無法支援每小時發生的數百萬次事件。
更好的方法是讓每個伺服器和資料中心同步至準確的時間,讓彼此之間的誤差少於一微秒。如此一來,每個網站就都能夠追蹤時間,而且在與其他資料中心共享事件資料時,每個事件的順序都已經是正確的。
時間同步越準確,應用程式的效能就越快。最近的一項測試顯示,若將計時的準確度提高 80 倍 (使任何時間誤差降低 80 倍),分散式資料庫的執行速度便能加快三倍,這對於相同的伺服器硬體而言,是令人難以置信的效能提升,僅僅讓時間更準確、更可靠,就能達成如此成效。
OCP TAP 可維持精準、正確的計時,且任何組織皆可取得。來自 Facebook、NVIDIA 和 OCP 的開放計時伺服器和開放式管理工具提供易於採用的方法,讓每個人都可以像超大規模公司一樣使用。
NVIDIA 提供具備精準計時功能的網路介面卡和資料處理器 (DPU),可提供精準計時設備所需的超精確時間標記和網路同步功能。如果使用 BlueField 資料處理器,便能在其 Arm 核心上執行 PTP 堆疊,將時間堆疊與其他伺服器軟體隔開、不斷驗證伺服器內的時間準確性,並持續計算整個資料中心綁定的最大時間誤差。
雲端服務和資料庫已經增加了以時間為基礎的新指令和 API,以便充分利用更好的計時伺服器和時間同步功能。這項解決方案共同開創了更準確的計時新紀元,能夠提升分散式應用的效能,並實現雲端和企業的新型解決方案。