NVIDIA (辉达) 本月3日宣布 NVIDIA GPU 云 (NGC) 已支援微软 Azure 平台,使成千上万的开发者、资料科学家以及研究人员可以立即展开其 GPU 运算计画。NGC 与 Azure 的可立即运作容器让开发者不仅能随时随地使用 GPU 运算资源并针对需求进行扩充,还能消弭软体整合与测试的复杂流程。
加速 AI 与 HPC 计画
打造并测试可靠的软体堆叠来执行如 TensorFlow、Microsoft Cognitive Toolkit、PyTorch 以及 NVIDIA TensorRT 等热门的深度学习软体,不仅困难重重且耗时,还涉及作业系统层级的驱动程式、函式库以及执行时间,且许多套件还会建议采用不同的支援元件。不仅如此,各种框架与应用程式经常更新,意谓着每当释出新版本时就必须再重复作业一遍,并测试新版本以确保它能提供和先前一样好的效能。完成上述所有繁琐工作後,才能真正开始执行计画。
就 HPC 而言,其困难处在於如何将最新软体部署到系统丛集,除了搜寻与安装正确元件以及测试等各项作业外,还必须横跨多个系统并在多租户环境下完成上述作业。NGC 透过提供附有 GPU 加速软体的预先设定容器,消除这些复杂程序。藉由 NVIDIA 持续的研发与投资,确保 NGC 的深度学习容器能发挥最新的 GPU 功能优势。NVIDIA 在各种深度学习容器中针对完整软体堆叠进行测试、调校以及最隹化,并每月定期更新以确保达到最隹效能。
NVIDIA 与 NGC 上其他容器的开发者合作,除了着手优化其应用程式外,还测试其效能与相容性。
NGC 搭配微软 Azure
可以透过 35 种 GPU 加速容器运行各种深度学习软体、HPC 应用程式、HPC 视觉化工具以及 NGC 容器库中各夥伴的应用程式,并使用 NVIDIA GPU 於以下微软 Azure 执行个体类型中运行:
· NCv3 (1、2 或4 颗 NVIDIA Tesla V100 GPU)
· NCv2 (1、2 或4 颗 NVIDIA Tesla P100 GPU)
· ND (1、2 或4 颗 NVIDIA Tesla P40 GPU)
相同的 NGC 容器还能在各种 Azure 执行个体类型中运行,甚至还能搭配不同种类或数量的 GPU。而使用 NGC 容器搭配 Azure 相当简单,首先必须注册取得免费的 NGC 帐号,接着只要连上微软 Azure Marketplace,并找到适用於深度学习与 HPC 的 NVIDIA GPU 云图像,此为预先设定的 Azure 虚拟机器图像,内含执行 NGC 容器所需的所有元件,并在 Azure 上启动相容的 NVIDIA GPU 执行个体,再将想要用的容器从 NGC 库推到运行中的执行个体。
除使用 Azure Marketplace 上 NVIDIA 发表的图像来执行这些 NGC 容器外,还能运用 Azure Batch AI 在 Azure NCv2、NCv3以及 ND虚拟机器上的 NGC 下载与执行这些容器。依照 GitHub 的简单指示即可在 NGC 容器启动 Batch AI。藉由 NGC 支援 Azure,每个人皆能更轻易地在云端环境中开始进行 AI 或 HPC。