账号:
密码:
最新动态
产业快讯
CTIMES/SmartAuto / 新闻 /
用 NVIDIA Blackwell GPU首次测试结果 提高推论效能加倍
为生成式 AI 树立全新标准

【CTIMES / SMARTAUTO ABC_1 报导】    2024年08月29日 星期四

浏览人次:【158】

现今许多企业逐渐采用生成式人工智慧(AI)与陆续推出各项新服务,使得对於资料中心基础设施的需求大增。训练大型语言模型(LLM)和即时提供由LLM支援的服务都不容易。在最新一轮的MLPerf 产业基准:Inference v4.1中,NVIDIA平台在各项资料中心测试项目里领先。即将推出的NVIDIA Blackwell平台由於使用第二代Transformer引擎与FP4 Tensor核心,在处理 MLPerf 最大的LLM工作量Llama 2 70B之际,首次测试的结果显示其效能较NVIDIA H100 Tensor Core GPU架构高出四倍。

NVIDIA Blackwell 在 MLPerf Inference 的基准测试活动中首次亮相,为生成式AI树立全新标准。
NVIDIA Blackwell 在 MLPerf Inference 的基准测试活动中首次亮相,为生成式AI树立全新标准。

NVIDIA H200 Tensor核心GPU在资料中心类别的各项测试里出现,包括基准中最新加入有着467亿个叁数、每个token有129亿个活跃叁数的Mixtral 8x7B 混合专家(MoE)LLM。MoE模型能够在单一部署中回答各式各样的问题与执行更多不同的任务,让使用者有更多种部署 LLM 的方式。MoE的效率更高,每次进行推论作业只要启动几个专家,代表提供结果的速度比类似的密集模型更快速。

多GPU运算的能力成为满足当前运行LLM的即时延迟需求,NVIDIA NVLink和NVSwitch可在基於NVIDIA Hopper架构的GPU之间以高频宽沟通,并为当今即时、具成本效益的大型模型推论作业带来显着优势。而Blackwell平台加上有着72个GPU更大规模的NVLink 网域,将进一步扩展NVLink Switch的功能。

關鍵字: GPU  NVIDIA 
相关新闻
NVIDIA在日本与台湾推出用於生成式AI的NIM微服务
英特尔携手生态系合作夥伴 加速部署商用AI PC平台
茂纶使用NVIDIA Omniverse及Epson机械手臂实现生成式AI瑕疵检测自动化
趋势科技与NVIDIA AI Enterprise合作强化AI部署
英飞凌与光宝科技签订合作备忘录 助台欧新创企业?化双边链结
comments powered by Disqus
相关讨论
  相关文章
» 机器视觉与电脑视觉技术的不同应用
» 从软体洞察与案例分析塑造的 NPU IP 架构
» 您需要了解的五种软体授权条款
» 不只有人工智慧!导入AR与VR,重塑创客的自造方式
» Linux核心修补程式让第五代树莓派增速18%


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK88U07UUO4STACUKL
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw