在人类推动各项改写时代的颠覆性创新项目中,人工智慧(AI)是当中的核心,以前所未有的速度开发新冠病毒(COVID)疫苗及诊断癌症,再到支援自动驾驶车和了解气候变迁。
|
最绿色环保的一代:NVIDIA、Intel及合作夥伴合作助力提高人工智慧运算效率 |
几??各行各业都能受惠於采用 AI,但随着神经网路日渐变得复杂,AI 技术也需要极为庞大密集的资源。为避免因运行这类运算基础设施,而对发电造成需索无度的情况,必须尽量提高底层基础技术的运行效率。
在 NVIDIA GPU 和 NVIDIA AI 平台的支援下,加速运算的效率提高,使资料中心能够持续推动取得更新一代的突破性成果。
现随着 Intel 推出第四代 Xeon 可扩充处理器,NVIDIA 及其合作夥伴已开始为高能效 AI 打造新一代的加速运算系统。这些系统搭载 NVIDIA H100 Tensor Core GPU,能够提供较上一代产品更出色的运行效能、更隹的扩充性及更高的执行效率,每瓦有更亮眼的运算表现及解决问题的能力。
NVIDIA DGX H100 系统及由 NVIDIA 全球合作夥伴推出的六十馀款搭载 H100 GPU 的伺服器产品,都将搭载 Intel 的新款 CPU。
这些即将推出并搭载 NVIDIA 及 Intel 产品的系统,将协助企业运行各项作业负载,其效率比仅搭载 CPU 的传统资料中心伺服器平均高出 25 倍。如此优异的每瓦效能代表完成工作所需的电力更少,这有助於确保让资料中心尽量高效运用电力来完成最重要的工作。
与前一代加速系统相比,新一代的 NVIDIA 加速伺服器将训练速度和推论的能源使用效率提高 3.5 倍,这麽一来便能真正降低成本,AI 资料中心的总持有成本降低 3 倍以上。
全新第四代 Intel Xeon CPU 的特色之一便是支援 PCIe Gen 5 规格,可以将 CPU 到 NVIDIA GPU 及网路的资料传输速率提高一倍。新增的 PCIe 通道让每台伺服器内可以部署更高密度的 GPU 和高速网路。
更高速的记忆体频宽也提高处理 AI 等资料密集型作业负载的表现,而每个连接高达每秒 400 GB(Gbps)的网路速度,则是让伺服器与储存装置之间能更快传输资料。
搭载 H100 PCIe GPU 的 NVIDIA DGX H100 系统及 NVIDIA 合作夥伴的伺服器产品,都有 NVIDIA AI Enterprise 的使用授权,NVIDIA AI Enterprise 是一款采用端对端技术且安全的云端原生 AI 开发和部署软体,为高效开发企业 AI 提供一个完整的卓越平台。
NVIDIA DGX H100 是全球首款专用 AI 基础设施第四代产品,在加速资料中心作业系统 NVIDIA Base Command 软体的支援下,成为一个完全最隹化的平台。
每个 DGX H100 系统搭载八个 NVIDIA H100 GPU、十张 NVIDIA ConnectX-7 乙太网路介面卡及两个第四代 Intel Xeon 可扩充处理器,可提供打造大型生成式 AI 模型、大型语言模型、推荐系统等所需的效能。
这个架构加上 NVIDIA 网路技术,能够大规模提升运算效率,在训练 AI 及处理高效能运算(HPC)作业负载方面,其效能较前一代产品高出 9 倍,比未加速的 X86 双??槽伺服器高出 20 至 40 倍。
要是过去在单纯 X86 架构伺服器丛集上训练一个语言模型要 40 天的时间,在搭载 Intel Xeon CPU 及 ConnectX-7 网路技术的 NVIDIA DGX H100 上训练同一个语言模型,只要短短的一到两天便可完成。
NVIDIA DGX H100 系统是适用於企业的一站式 NVIDIA DGX SuperPOD 的构成单元,其提供高达 1 exaflop 的 AI 运算效能,显着提升大规模部署企业 AI 的效率。对於处理 AI 资料中心的作业负载,NVIDIA H100 GPU 让企业能够更高效地打造及部署应用程式。
华硕(ASUS)、源讯科技(Atos)、思科(Cisco)、戴尔科技(Dell Technologies)、富士通(Fujitsu)、技嘉(GIGABYTE)、慧与科技(Hewlett Packard Enterprise)、联想(Lenovo)、云达科技(QCT)及美超微(Supermicro)等NVIDIA的合作夥伴,即将推出搭载H100 GPU和第四代Intel Xeon可扩充CPU的多款系统组合,将为全球企业带来新一代的执行效能和能源使用效率。
作为未来效率提升的领头羊,Flatiron Institute 搭载 NVIDIA H100 GPU 的 Lenovo ThinkSystem 超级电脑,荣登 Green500 榜单最节能电脑之冠,而在榜单的前三十名超级电脑系统里,有 23 套系统采用 NVIDIA 的技术。Flatiron的超级电脑系统使用的是 Intel 的前一代 CPU 产品,预计目前即将上市的系统会带来更高的效率。
此外,用 NVIDIA ConnectX-7 网路技术及 Intel 第四代 Xeon 可扩充处理器连接伺服器,将提高伺服器的运作效率、减少基础设施的数量及耗电量。
NVIDIA ConnectX-7 乙太网路介面卡支援 PCIe Gen 5 及每秒 400 GB 的 InfiniBand 和乙太网路连线,将伺服器之间及至储存装置的网路输送量增加一倍。这些乙太网路介面卡支援先进的网路、储存装置和安全卸载。ConnectX-7 网路技术减少了所需的电线和交换机连接埠的数量,为大型 GPU 加速的高效能运算和 AI 丛集的网路省下 17% 以上的电力,有助於提高这些新伺服器的能源使用效率。
这些下一代系统还为 NVIDIA AI Enterprise 软体套件进行最隹化调整,大幅提升运作效率。在 NVIDIA H100 上运行的 NVIDIA AI Enterprise 加快推动资料科学工作流,亦让开发和部署预测性 AI 模型的作业变得更简单,自动执行基本流程又快速从资料里获得洞察。
有着完整堆叠软体库的 NVIDIA AI Enterprise,其中包括叁考应用程式、框架、预先训练好的模型及基础设施最隹化的 AI 工作流程,是顺利扩大企业 AI的一个理想基础。