人工智慧(AI)是當今最強大的技術,要推動其在各產業發展,就需要新一代電腦的調校和測試,來運行AI與資料分析作業。NVIDIA正與全球頂尖OEM廠商合作,更宣布從今天起,NVIDIA的合作夥伴將協助資料中心取得最新的加速伺服器支援,系統製造大廠將推出首批NVIDIA認證系統,打造出針對現代運算作業負載進行測試的伺服器。
|
Dell Technologies、技嘉(GIGABYTE)、慧與科技(HPE)、Inspur及美超微(Supermicro)等加速伺服器製造商,現已將NVIDIA認證系統準備就緒。 |
這些系統借助最新搭載NVIDIA Mellanox網路的GPU,能加速處理AI作業,從不斷增長的海量企業資料中,挖掘傳統系統遺漏的寶貴資訊,進而提升機器學習技術。Dell Technologies、技嘉(GIGABYTE)、慧與科技(HPE)、Inspur及美超微(Supermicro)今日紛紛推出取得認證的伺服器。
首批採用NVIDIA A100 Tensor 核心 GPU的系統包含:
.Dell EMC PowerEdge R7525 與 R740 機架式伺服器
.GIGABYTE R281-G30、R282-Z96、G242-Z11、G482-Z54、G492-Z51系統
.HPE Apollo 6500 Gen10系統及HPE ProLiant DL380 Gen10伺服器
.Inspur NF5488A5
.Supermicro A+系統AS-4124GS-TNR及AS-2124GQ-NART
以上產品皆附上NVIDIA認證系統的標章,意味著這些系統可以處理機器學習、資料分析等領域中最具挑戰性的任務。
NVIDIA指出,用於篩選海量資料的AI模型數量,在短短五年內成長了近三萬倍,資料中心和網路邊緣流量也呈指數增長,因此推動了加速運算的需求。使用的模型多樣性和作業負載也在不斷增加,企業需要具靈活性的GPU,以及一個安全、可靠、高速且可有效擴大規模的基礎設施。
NVIDIA認證系統可提供企業AI所需的效能、可程式化特性及安全處理能力。這些系統結合了採用NVIDIA Ampere架構的GPU運算能力,以及安全的NVIDIA Mellanox高速網路解決方案。
要取得這項認證,系統需針對各種作業負載進行測試,包含從需要使用多個運算節點的作業,到只需單一GPU的部分運算能力即可完成的任務。
NVIDIA認證系統必須通過以下測試:
.深度學習訓練與推論
.機器學習演算法
.智慧影像分析
.網路與儲存裝置卸載
測試內容著重於實際的使用場景上,並在NGC目錄中取得熱門的AI框架和容器—NGC目錄為NVIDIA針對GPU最佳化的應用程式中樞。這些經過最佳化的系統能運行NGC目錄中的AI應用程式,因此,NVIDIA認證系統讓每間公司都能取得與全球一些強大的AI電腦相同的軟硬體。
NGC也提供持續增加的軟體開發套件,將AI帶入如醫療保健(Clara)和機器人(Isaac)等垂直市場。此外,NGC也提供框架,協助企業開始使用如推薦系統(Merlin)與智慧影像分析(Metropolis)等新興的使用場景。
NVIDIA認證系統包含功能強大的資料中心伺服器,其搭載多達八個A100 GPU和高速InfiniBand或乙太網路介面卡,還包含企業邊緣AI應用的主流AI系統。
OEM廠商使用NVIDIA Mellanox電纜、交換機,以及如ConnectX-6 InfiniBand或乙太網路介面卡和BlueField-2 DPU等網路卡,對系統進行認證。這些網路卡具備低延遲、高處理量,還支援從啟動時的硬體信任根,到應用程式的連接追蹤等多層安全保障。
每套系統皆使用NVIDIA Mellanox 8700 HDR 200G InfiniBand交換機或Mellanox SN3700乙太網路交換機進行認證。
截至目前,已有六個系統製造商的十四台伺服器取得認證,並提供加速運算服務。目前至少有十一個系統製造商的近七十套系統參與這項計畫。