NVIDIA (輝達)針對其深度學習運算平台,揭露一系列重大的進展,讓深度學習的工作負載與六個月前的前一世代產品相比,提升10倍效能。
|
首創2 Petaflop深度學習系統的DGX-2,透過全新搭載2倍記憶體、革命性NVSwitch光纖互連技術與綜合軟體堆疊的Tesla V100 32GB GPU所驅動。 |
已被所有大型雲端服務供應商與伺服器製造商所採用的 NVIDIA平台關鍵進展,包括針對效能最強大的資料中心 GPU NVIDIA Tesla V100的記憶體進行2倍升級,並導入全新革命性 GPU 光纖互連技術 NVIDIA NVSwitch,最多可以讓高達16顆Tesla V100 GPU能以每秒2.4TB的紀錄速度同時進行通訊。同時,NVIDIA也推出優化過後的更新版軟體堆疊。
此外,NVIDIA也發表深度學習運算的重大突破NVIDIA DGX-2,其為第一個運算效能可達 2 petaflop的單一伺服器。DGX-2擁有等同於300台佔據 15個機架空間的資料中心伺服器所能提供的處理效能,其佔據空間少了60倍且功耗效率提升了18倍。
NVIDIA創辦人兼執行長黃仁勳在GTC 2018宣布消息時表示:「深度學習非凡的進展揭露更多未來值得期待的部分。這些精進很多是建立在NVIDIA的深度學習平台上,而此平台很快也將成為全球的標準。我們正以遠遠超越摩爾定律的速度提升效能,並達成各種突破性的進展,可以為醫療照護、交通運輸、科學探索與其他無數領域帶來革命性的發展。」
廣為全球領先研究人員所採用的Tesla V100 GPU具有2倍記憶體的提升,以應對記憶體需求最為密集的深度學習與高效運算作業負載。
目前已搭載32GB記憶體的Tesla V100 GPU,將可協助資料科學家針對更深、更大型的深度學習模型,進行準確度更高的訓練。與之前 16GB 版本比較,其也可針對受限於記憶體限制的高效能運算應用,提升高達 50% 效能。
全系列 NVIDIA DGX 系統產品系列皆可馬上取用Tesla V100 32GB GPU。此外,頂尖電腦製造商如Cray、Hewlett Packard Enterprise、IBM、Lenovo、Supermicro與Tyan,都已經宣布將在第二季開始推出全新的Tesla V100 32GB 系統。Oracle雲端設備服務也宣布計劃於今年下半年透過雲端系統提供Tesla V100 32GB。
NVSwitch 與最佳的PCIe交換系統相比頻寬高出5倍,讓開發人員得以透過更多高速連結的 GPU 來打造系統。其也可協助開發人員突破以往系統的限制,處理更大的資料集,並允許處理如神經網路的模型平行訓練等更大、更複雜的作業。
NVSwitch 更進一步透過 NVIDIA 所開發的第一個高速互連技術 NVIDIA NVLink達成創新,讓系統設計師得以打造更先進的系統,能以極具彈性的方式連結任何以 NVLink 為基礎的GPU網路拓墣。
NVIDIA的開發社群可以免費取得針對深度學習與高效能運算軟體堆疊所進行的更新,其目前的註冊使用者總人數已經超過 82 萬,與去年 48萬人相比大幅增加。
更新部份包含 NVIDIA CUDA、TensorRT、NCCL 與cuDNN,以及全新 Isaac 機器人開發人員軟體套件。此外,透過與大型雲端服務供應商的密切合作,每個主要的深度學習框架都將持續進行優化,以便完全發揮 NVIDIA GPU 運算平台的效能。
NVIDIA全新DGX-2系統受惠於其針對各種運算堆疊所開發出領先業界的技術,達成2 petaflop運算的里程碑。
DGX-2是第一套採納 NVSwitch 的系統,可讓系統中 16個 GPU共享相同的記憶空間,開發人員因此具有因應最大型資料集與更複雜深度學習模型所需的訓練效能。
DGX-2整合完整優化的更新版NVIDIA深度學習軟體,是專為一心想要突破深度學習研究與運算極限的資料科學家所打造。其可在兩天內針對最頂尖的神經機器翻譯模型 FAIRSeq進行訓練,而效能則比去年九月發表的Volta DGX-1,足足提升十倍。
Microsoft 語音與文字部門主管暨技術研究員黃學東表示:「Microsoft與NVIDIA過去幾年針人工智慧技術的合作已經取得極大的進展,包括最近中英文翻譯的突破。Tesla V100 32GB GPU將讓我們未來得以更快速地訓練更大、更複雜的 AI 模型 ,協助我們提升語音辨識與機器翻譯模型,達到媲美人類翻譯能力的準確性,並增強如Cortana、Bing與MicrosoftTranslator等產品。」
SAP以色列創新中心副總裁Michael Kemelmakher表示:「我們對即時且具備自動分析影片品牌露出的SAP Brand Impactb軟體應用,導入全新Tesla V100 32GB DGX-1的評估。擴充的記憶體提升了在更大的ResNet-152模型上,應對更高解析度影像處理的效能,並同時降低40%的平均錯誤率。在我們的服務規模下產出精準、即時與有效的服務成果。」
DGX-2是NVIDIA DGX產品系列中最新的成員,其包含三套針對協助資料科學家迅速開發、測試、部署與擴充,所設計的全新深度學習模型與創新的系統。
搭載16個GPU的DGX-2是此產品系列中的旗艦產品。其它成員包括內建 8 個Tesla V100 GPU 的 NVIDIA DGX-1系統,以及搭載 4 顆Tesla V100 GPU、全世界第一台深度學習專用的個人超級電腦 DGX Station工作站。這些系統讓資料科學家得以將複雜的實驗作業拓展至工作站上處理,進而解決更龐大的深度學習問題,協助完成畢生志向的研究。