上周Supercomputing 21 (SC21) 大會公布了TOP500 排行榜,其355 套系統中超過 70%皆採用NVIDIA的加速技術,在所有新系統的採用比例更超過 90%。相較於六月發表的 TOP500 排行榜中的342套系統 (68%),又進一步增加。
NVIDIA指出,人工智慧 (AI) 為科學運算領域帶來革命性的變化。近年來,利用高效能運算與機器學習進行研究的論文數量激增;從 2018 年大約 600 篇,到 2020 年增長到近 5000 篇。HPL-AI與MLPerf HPC等新基準也強調高效能運算與 AI 作業負載的融合。
HPL-AI 是融合高效能運算與 AI 作業負載的新基準,使用混合精度數學,是深度學習及許多科學和商業工作的基礎,同時仍然提供雙精度數學的完整精度,這是傳統高效能運算基準的標準衡量指標。
MLPerf HPC 則提出一種運算方式,用 AI 加速和增強超級電腦上的模擬作業,這項基準測量了高效能運算中心三大作業負載的執行表現,即天體物理學、氣象 (Deepcam) 與分子動力學 (Opencatalyst)。
NVIDIA指出,運用GPU加速處理、智慧型網路、GPU最佳化的應用程式,還有支援 AI 和高效能運算融合的函式庫,提出完整的堆疊。這個做法加強處理作業負載的能力,創造出突破性的科學研究成果。
NVIDIA強調,GPU 的平行處理能力,加上超過 2,500 個 GPU 最佳化應用程式,讓使用者能夠加快處理其高效能運算作業,在許多情況下從原本需耗費數週的時間,減少到僅需幾小時便能完成。
此外,在高效能運算中加入 AI,有助於研究人員加快模擬速度,同時享有傳統模擬方法所能達到的精度。這便是有愈來愈多的研究人員利用 AI 來加速發現的原因。
HPL-AI 與 MLPerf HPC 等相對較新的基準強調了這股優勢,突顯出高效能運算及 AI 作業負載一直在融合的局面。NVIDIA 上週宣布針對高效能運算推出多項全新先進函式庫及軟體開發套件,更有推波助瀾之效。