於美國達拉斯舉行的Supercomputing 2022(SC22)前夕,英特爾推出Intel Max系列產品,包含兩款用於高效能運算(HPC)和人工智慧(AI)的尖端產品:Intel Xeon CPU Max系列(代號Sapphire Rapids HBM)以及Intel Data Center GPU Max系列(代號Ponte Vecchio)。新產品為阿貢國家實驗室(Argonne National Laboratory)即將推出的Aurora超級電腦注入動力,並公開其部署的最新情況。
|
英特爾推出Max系列產品。 |
Xeon Max CPU是首款也是唯一一款具備高頻寬記憶體的x86處理器,不需要修改程式碼,即可加速許多的HPC工作負載。Max系列GPU是英特爾密度最高的處理器,將超過千億個電晶體以47個晶片塊的方式整合至單一封裝,具備高達128GB高頻寬記憶體。oneAPI開放式軟體生態系為這兩款處理器系列提供一個單一的程式設計環境。英特爾於2023年推出的oneAPI和AI工具,將能夠釋放Intel Max系列產品的功能。
英特爾企業副總裁暨超級運算事業部總經理Jeff McVeigh說,為確保每個HPC工作負載都能夠被完美執行,我們需要能夠最大幅度提升頻寬、運算能力、開發者生產力,並發揮最大影響力的解決方案。Intel Max系列產品為更廣泛的市場帶來高頻寬記憶體以及oneAPI,讓CPU和GPU之間共享程式碼變得容易,並更快速地解決全球最為重大的挑戰。
高效能運算(HPC)代表著科技先鋒,大量採用最為先進的創新技術,從降低氣候變化的衝擊再到治療全球最為致命的疾病,解決科學和社會的最重大挑戰。
Max系列產品透過可擴展、相互平衡的CPU和GPU滿足此一社群的需求,其融合了突破性的記憶體頻寬,並由開放、基於標準、跨架構程式設計框架的oneAPI聯合在一起。研究人員和企業將利用Max系列產品更快、更永續地解決問題。
Max系列產品預計將於2023年1月推出。為履行對客戶的承諾,英特爾正在出貨配備Max系列GPU的刀鋒式伺服器給阿貢國家實驗室,為Aurora超級電腦注入動力,並向洛色拉莫士國家實驗室(Los Alamos National Laboratory)、京都大學(Kyoto University)和其它超級運算站點提供Xeon Max CPU。
Xeon Max CPU在350瓦的範圍之中,提供多達56個由4片晶片塊所構成的效能核心,並使用英特爾的嵌入式多晶片互連橋接(EMIB)相互連接。Xeon Max CPU包含64GB高頻寬封裝內記憶體,以及PCI Express 5.0和CXL 1.1 I/O。Xeon Max CPU將為每個核心提供超過1GB的高頻寬記憶體(HBM)容量,足以應付絕大多數常見的HPC工作負載。與競爭對手相比,Max系列CPU在實際HPC工作負載可提升高達4.8倍的效能。
‧在相同的HPCG效能下,比AMD Milan-X叢集降低68%功耗。
‧AMX延伸指令集提升AI效能,在使用INT32累積(accumulation)運算的INT8工作中,相較AVX-512提供8倍的峰值吞吐量。
‧提供不同HBM和DDR記憶體組態運作的彈性。
‧工作負載測試:
o氣候建模:僅使用HBM執行MPAS-A時,比AMD Milan-X快2.4倍。
o分子動力學:在DeePMD方面,相較使用DDR記憶體的競品,效能提升2.8倍。
Max系列GPU提供多達128個Xe-HPC核心,這是目標針對最嚴苛運算工作負載的新基礎架構。此外,Max系列GPU還具備以下特色:
‧業界最多的408MB L2快取以及64MB L1快取,提升吞吐量和效能。
‧唯一具備原生光線追蹤加速功能的HPC∕AI GPU,專為加速科學視覺化和動畫製作而設計。
‧工作負載測試:
o金融:Riskfuel選擇權定價方面,相較NVIDIA A100的效能提升2.4倍。
o物理:NekRS虛擬反應爐模擬方面,相較A100提升1.5倍。
Max系列GPU將提供多種外型尺寸,滿足不同客戶的需求。
‧Max系列1100 GPU:一款300瓦的雙槽PCIe卡,具備56個Xe核心和48GB HBM2e記憶體,亦可透過Intel Xe Link橋接器連接多張卡。
‧Max系列1350 GPU:一款450瓦的OAM模組,具備112個Xe核心和96GB HBM。
‧Max系列1550 GPU:英特爾最高效能的600瓦OAM模組,具備128個Xe核心和128GB HBM。
除了單卡和模組之外,英特爾將提供具備4個GPU OAM載板和Intel Xe Link的Intel Data Center GPU Max系列子系統,實現子系統內高效能多GPU通訊。
目前正在阿貢國家實驗室建造的Aurora超級電腦,預計將於2023年成為第一台雙精度峰值運算效能超過2 exaFLOPS的超級電腦。Aurora也將是首款展示Max系列GPU和CPU於單一系統當中相互搭配,以打造強大的超級電腦,其具備超過10,000台刀鋒式伺服器,每台刀鋒式伺服器包含6個Max系列GPU和2個Xeon Max CPU。
SC22前夕,阿貢和英特爾揭曉Sunspot,為具備128台量產型刀鋒式伺服器的Aurora測試開發系統。來自Aurora先期科學計畫的研究人員,將於2022年底開始使用該系統。
Max系列產品將為其它數個對國家安全和基礎研究十分重要的HPC系統注入動力,包含洛色拉莫士國家實驗室的Crossroads,勞倫斯利物浦國家實驗室(Lawrence Livermore National Laboratory)和桑迪亞國家實驗室(Sandia National Laboratory)的CTS-2系?,以及京都大學的Camphor3。
代號為Rialto Bridge的Intel Data Center Max系列GPU,是下一代Max系列GPU,預計將於2024年推出,不僅效能更提升,亦提供無縫升級。英特爾正緊接計畫推出下個主要架構更新,開啟HPC的未來。即將推出代號為Falcon Shores的XPU,將結合Xe和x86核心至單一封裝。這項突破性的新架構還將靈活地整合來自英特爾與客戶的新IP,並採用英特爾IDM 2.0模式進行製造。