CTIMES/SmartAuto - NVIDIA Blackwell GPU首次測試結果提高推論效能加倍:GPU,NVIDIA

│新東西市集│東西講座│影音頻道│出版中心│智動化專區│

元件次系統自動控制

最新動態

【文章精選】鍺：綠色回收與半導體科技的新未來

【東西講座】11/29 智慧製造與資訊安全

產業快訊

整合創新X智造未來TIMTOS 2025 聚焦AI新商機

汽配及移動科技產業，參展熱烈報名中!

CTIMES/SmartAuto / 新聞 /

NVIDIA Blackwell GPU首次測試結果提高推論效能加倍

為生成式 AI 樹立全新標準

【CTIMES/SmartAuto 陳玨報導】 2024年08月29日星期四

瀏覽人次：【763】

現今許多企業逐漸採用生成式人工智慧（AI）與陸續推出各項新服務，使得對於資料中心基礎設施的需求大增。訓練大型語言模型（LLM）和即時提供由LLM支援的服務都不容易。在最新一輪的MLPerf 產業基準：Inference v4.1中，NVIDIA平台在各項資料中心測試項目裡領先。即將推出的NVIDIA Blackwell平台由於使用第二代Transformer引擎與FP4 Tensor核心，在處理 MLPerf 最大的LLM工作量Llama 2 70B之際，首次測試的結果顯示其效能較NVIDIA H100 Tensor Core GPU架構高出四倍。

NVIDIA Blackwell 在 MLPerf Inference 的基準測試活動中首次亮相，為生成式AI樹立全新標準。

NVIDIA H200 Tensor核心GPU在資料中心類別的各項測試裡出現，包括基準中最新加入有著467億個參數、每個token有129億個活躍參數的Mixtral 8x7B 混合專家（MoE）LLM。MoE模型能夠在單一部署中回答各式各樣的問題與執行更多不同的任務，讓使用者有更多種部署 LLM 的方式。MoE的效率更高，每次進行推論作業只要啟動幾個專家，代表提供結果的速度比類似的密集模型更快速。

多GPU運算的能力成為滿足當前運行LLM的即時延遲需求，NVIDIA NVLink和NVSwitch可在基於NVIDIA Hopper架構的GPU之間以高頻寬溝通，並為當今即時、具成本效益的大型模型推論作業帶來顯著優勢。而Blackwell平台加上有著72個GPU更大規模的NVLink 網域，將進一步擴展NVLink Switch的功能。

關鍵字： GPU NVIDIA

相關新聞

‧	美國國家實驗室打造超級電腦異構運算架構滿足HPC和AI需求
‧	印尼科技領導者與NVIDIA合作推出國家人工智慧Sahabat-AI
‧	NVIDIA發表新AI工具助力機器人學習和人形機器人開發
‧	NVIDIA AI Blueprint協助開發視覺AI代理以提高效率、最佳化流程並創造空間
‧	AMD攜手合作夥伴擴展AI解決方案全方位強化AI策略布局

comments powered by Disqus

相關討論

»	AI高齡照護技術前瞻以科技力解決社會難題
»	3D IC 設計入門：探尋半導體先進封裝的未來
»	Sony強力加持！樹莓派發表專屬AI攝影機
»	創新更容易！2024年受矚目的Arduino創新產品簡介
»	一次到位的照顧科技整合平台

｜

｜

｜

｜

｜

｜

	︱	Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3 v3.20.2048.3.147.82.252
		地址:台北數位產業園區（digiBlock Taipei） 103台北市大同區承德路三段287-2號A棟204室電話 (02)2585-5526 #0 轉接至總機 / E-Mail: webmaster@ctimes.com.tw