上周Supercomputing 21 (SC21) 大会公布了TOP500 排行榜,其355 套系统中超过 70%皆采用NVIDIA的加速技术,在所有新系统的采用比例更超过 90%。相较于六月发表的 TOP500 排行榜中的342套系统 (68%),又进一步增加。
NVIDIA指出,人工智慧 (AI) 为科学运算领域带来革命性的变化。近年来,利用高效能运算与机器学习进行研究的论文数量激增;从 2018 年大约 600 篇,到 2020 年增长到近 5000 篇。 HPL-AI与MLPerf HPC等新基准也强调高效能运算与 AI 作业负载的融合。
HPL-AI 是融合高效能运算与 AI 作业负载的新基准,使用混合精度数学,是深度学习及许多科学和商业工作的基础,同时仍然提供双精度数学的完整精度,这是传统高效能运算基准的标准衡量指标。
MLPerf HPC 则提出一种运算方式,用 AI 加速和增强超级电脑上的模拟作业,这项基准测量了高效能运算中心三大作业负载的执行表现,即天体物理学、气象 (Deepcam) 与分子动力学 (Opencatalyst)。
NVIDIA指出,运用GPU加速处理、智慧型网路、GPU最佳化的应用程式,还有支援 AI 和高效能运算融合的函式库,提出完整的堆叠。这个做法加强处理作业负载的能力,创造出突破性的科学研究成果。
NVIDIA强调,GPU 的平行处理能力,加上超过 2,500 个 GPU 最佳化应用程式,让使用者能够加快处理其高效能运算作业,在许多情况下从原本需耗费数周的时间,减少到仅需几小时便能完成。
此外,在高效能运算中加入 AI,有助于研究人员加快模拟速度,同时享有传统模拟方法所能达到的精度。这便是有愈来愈多的研究人员利用 AI 来加速发现的原因。
HPL-AI 与 MLPerf HPC 等相对较新的基准强调了这股优势,突显出高效能运算及 AI 作业负载一直在融合的局面。 NVIDIA 上周宣布针对高效能运算推出多项全新先进函式库及软体开发套件,更有推波助澜之效。