Facebook 正对开放运算计画 Time Appliance Project (OCP TAP) 进行开源,以符合成本效益的方式,在各资料中心之间提供极为精准的计时和时间同步功能。此解决方案包括采用 NVIDIA ConnectX-6 Dx 网路介面卡 (NIC) 的计时卡,可以将?大多数商用现成 (COTS) 的伺服器变成准确的计时设备,并搭配精确时间协定 (precision timing protocol),与资料中心的其他伺服器共用精准的计时功能。
Facebook 的计时卡结合 NVIDIA 的网路介面卡,为资料中心营运商提供了现代且经济实惠的时间同步解决方案,不仅开源、具备安全性和可靠性,还能加以扩充。
随着应用逐步扩大且 IT 营运范围遍及全球,要将资料中心内的不同伺服器或各大洲的不同资料中心保持资料同步,变得越来越重要也更加困难。如果是分散式资料库,则必须追踪事件的确切顺序,以保持一致性并显示因果关系。如果有两个人试图购买相同的股票,基于公平性 (与合规性),便需要确切地知道哪一笔订单先送达。同样地,当每小时有数千人发布内容、数百万名使用者对这些贴文按赞/哈/大心时,Facebook 需要知道每篇贴文获得赞、回覆或表情符号的实际顺序。
保持资料同步的方法之一,是让每个资料中心在每次交易后,都将其更新传送给其他资料中心,但是这种方法很快就变得不管用,因为资料中心之间的延迟太高,无法支援每小时发生的数百万次事件。
更好的方法是让每个伺服器和资料中心同步至准确的时间,让彼此之间的误差少于一微秒。如此一来,每个网站就都能够追踪时间,而且在与其他资料中心共享事件资料时,每个事件的顺序都已经是正确的。
时间同步越准确,应用程式的效能就越快。最近的一项测试显示,若将计时的准确度提高 80 倍 (使任何时间误差降低 80 倍),分散式资料库的执行速度便能加快三倍,这对于相同的伺服器硬体而言,是令人难以置信的效能提升,仅仅让时间更准确、更可靠,就能达成如此成效。
OCP TAP 可维持精准、正确的计时,且任何组织皆可取得。来自 Facebook、NVIDIA 和 OCP 的开放计时伺服器和开放式管理工具提供易于采用的方法,让每个人都可以像超大规模公司一样使用。
NVIDIA 提供具备精准计时功能的网路介面卡和资料处理器 (DPU),可提供精准计时设备所需的超精确时间标记和网路同步功能。如果使用 BlueField 资料处理器,便能在其 Arm 核心上执行 PTP 堆叠,将时间堆叠与其他伺服器软体隔开、不断验证伺服器内的时间准确性,并持续计算整个资料中心绑定的最大时间误差。
云端服务和资料库已经增加了以时间为基础的新指令和 API,以便充分利用更好的计时伺服器和时间同步功能。这项解决方案共同开创了更准确的计时新纪元,能够提升分散式应用的效能,并实现云端和企业的新型解决方案。