账号:
密码:
CTIMES / 文章 /   
GPU运算加速实现AI新时代!
快速跃升的绘图处理能力

【作者: 王岫晨】2018年06月29日 星期五

浏览人次:【3563】
  


随着物联网的蓬勃发展,预期到了2035年,全球将会有超过1兆台连网装置,这些装置并将大量运用於医疗、汽车、灯具及道路等领域。而连网装置数量的大幅成长,也将顺势带领终端及云端运算的持续发展,将驱动IoT和AI,并带来全新的运算世代。


在不久的未来,终端和云端都将由巨量的资料搜集与分析所组成。这些资料搜集成本几??为零,影响着所有的产业。智慧运算将持续推动物联网时代,带领人工智慧变革,促使物联网智慧运算无所不在。


AI能带来前所未有的改变和益处,例如AI医疗影像,让诊断阿兹海默症得以比使用传统方法提早十年,这等於让专家有多10年的机会去研究和早期预防该疾病。不过,人工智慧在为人类生活带来精彩机遇的同时,也伴随着隐??。根据Arm於 2017年的一份调查指出,有85%的受访者认?人工智慧会造成个资外泄或滥用,57%的人则相信在未来人工智慧将会取代人类,而AIG在2017年也调查发现,75%的人担心无人车会遭骇客侵入。至於另一份研究则证实,60%的受访者担心人工智慧会被作为犯罪用途,AI能比人类更迅速的在社交网站上执行网路的钓鱼攻击。


Arm:行动装置必须拥有机器学习的能力!

也因此,如何定义社会与人工智慧之间的关系,减少社会大?对人工智慧技术与应用的疑虑,变得至关重要。Arm IP产品事业群总裁Rene Haas提出,我们应从「微小时刻」来改变人们的认知,进而赋予AI人性。举例来说,根据世界卫生组织的数据发现,每年有高达25万人死於气喘或相关疾病,Arm也因此开发了Respiro智慧模组,小巧的吸入器装置具备机器学习技术,可以紧密连结病患和医生,医生能够透过病患回传的数据提供适当的治疗方法,让病患不再饱受气喘之苦。



图1 : Arm IP 产品事业群总裁Rene Haas畅谈AI的人性化发展
图1 : Arm IP 产品事业群总裁Rene Haas畅谈AI的人性化发展

藉由AI来驱动更多的这些「微小时刻」,从家庭温控、无人机侦测、耳机即时翻译到自驾车等,机器学习将导入更多终端装置,与云端运算相比,终端运算在频宽、耗电量、可靠性、安全性及隐私性等方面,都能带来更有效率的运算模式。终端可驱动AI的各种微小时刻,包括:


· 家庭温控能够持续有效调节、控制温度


· 无人机自动侦测周遭


· AI陪伴老人保持活力和叁与感


· 耳机即时翻译


· 改进驾驶行为的装置或自驾车,能降低90%的车祸死亡率


· 摄影机及时侦测并提醒火车驾驶小心预防在铁轨道上的动物


智慧手机是世界上最普及的AI终端装置,现今有超过95%由AI驱动的装置都是应用在手机、智慧家庭以及IoT领域,当中超过90%已出货的AI装置则是基於Arm的架构,这提供了广大的软硬体平台以及强大的生态系统,催化终端AI的拓展。90%的AI应用在手机上运行,包含语音辨识、数位助理、扩增实境、指纹辨识、脸部追踪、预测字等。


运算处理能力AI演算法的进展已经驱动应用、训练与推论到终端装置上,这些作业无法完全仰赖云端,除了因云端功能有限外,使用者亦希??其装置上资料能够有隐私以及安全。终端装置上的智慧具有反应快、可靠、安全的特性,同时资料不用离开装置就能受到保护。至於为何要将机器学习与AI的能力移植到终端上,这牵涉到以下原因:


1.频宽:云端上来回传输资料往往造成延迟,对具时效性作业处理是一大问题,且所费不赀


2.耗电量:传输资料的电量可观,建造更多的资料中心或伺服器并无法治本


3.可靠性:手机失去讯号或是网路断线都会是问题


4.安全:使用者更注重安全性


5.隐私:越来越多使用者对於其资料要求隐私以及可控制性。虽然越多个人资讯分享对AI的发展更有利,但使用者仍然希??他们的资料更多是存在本地,以保有安全和隐私


Arm整合产业生态系统的AI及机器学习应用、演算法及框架,与针对Arm硬体优化的软体函式库,加上Arm专为AI打造的硬体IP产品,提供平台解决方案,让各式装置及平台都能支援最常使用的机器学习框架。这些解决方案包含:


Arm Cortex-A76及Mali-G76:机器学习效能已经成为手机上重要功能,而A76、 G76能够提供这些的功能。Arm持续为其CPU和GPU产品进行优化,以提升在各个不同装置种类上ML应用的效能,其中手机将会是一大重点。


Project Trillium:这包含了机器学习和物件侦测处理器,专为在终端装置上提供高效能、高效率的机器学习功能重新打造,提供Arm合作夥伴更多的选择。相较於独立CPU、GPU与加速器,不仅大幅提升效率,其效能并远远超越传统DSP的可编程逻辑。


以人脸辨识为例,物件侦测处理器侦测到所需要的图像部分,作预先筛选,并以每秒超过1TOPS的效率处理full HD的影像,分割出图中物件或人像;机器学习处理器检视这些部分,专注於更快速辨识与分析人物。使用者只会看见高解析度、即时的人脸分析。这种方法提供了快速的处理能力,同时维持装置在终端运作的效率。这将实现如智慧相机市场等新的应用和服务,预期在未来十年成长达到超过10亿台装置数量。


NVIDIA:GPU实现AI运算的关键时刻

事实上,在AI当道的今日,GPU加速运算也已经来到关键点,世界正在加入这个快速运算的行列。不止相关开发者在五年内成长了10倍,全球前50大超级电脑中的GPU FLOPS(浮点运算)也在五年内成长15倍,比摩尔定律更快,这意味着GPU运算时代已经来临。


在未来十年,每年的运算需求将成长100倍。NVIDIA执行长黄仁勋指出,超级电脑是现代科学的重要工具。在过去10年来,该公司开发了一整套用於超级运算的函式库、系统管理和编程工具。针对分子建模、量子化学和力学、天气预报、气候研究、能源探索、物理模拟、资料科学以及人工智慧等,超过550种高效能运算应用了CUDA加速。未来,每台超级电脑也都必须在务实的成本与能耗的考量基础上,加速实现百万亿次级和百亿级性能。


而GPU运算正是AI发展的加速引擎。根据一家AI研究机构OpenAI最近公布的一份研究报告显示,培训AI模型的运算将在五年内成长30万倍。这比摩尔定律还要快上3万倍。透过增加数据和GPU效能,机器可以编写非常复杂的软体,不需要人工编写,并可解决近期无法解决的问题。



图2 :  NVIDIA执行长黄仁勋指出,GPU运算已经来到关键点,世界正在加入这个快速运算的行列。
图2 : NVIDIA执行长黄仁勋指出,GPU运算已经来到关键点,世界正在加入这个快速运算的行列。

这个世界比起以往,更需要大型的GPU运算效能。研究人员和开发者需要巨大的GPU来开发更强大的模型,目前GPU已经处於制造的极限。黄仁勋说,我们发明了一种突破性开关,可以将多个GPU连接并编程为单个GPU。NVSwitch是一种新型高频宽交换器,其协议可扩展跨16个Volta Tensor核心GPU的单晶片内建记忆体。程式设计师可看到具有2 PFLOPS性能的单一512GB GPU。


未来的运算将融合模拟和机器学习方法。电脑可以透过学习数据中的重要特徵,模拟物理定律或预测结果。例如NVIDIA所创造的Tensor Core GPU,就是融合了HPC与AI运算的新架构。Tensor Core GPU具有多种精度,支持高运算量FP64、FP32、FP16、Int8和单周期4x4矩阵乘法累加来进行深度学习。


在今年,资料中心消耗约2000万个CPU,若以每个处理器0.5TF来算,将共会有1000万TF。随着摩尔定律减缓,10年内成长百倍的1000万TF,将会以替代方式运作。而NVIDIA的CUDA GPU运算是延展摩尔定律最主要的方法。到2028年,全球的需求将达到相当於1000万NVIDIA Volta的GPU数量。Volta是第一款Tensor Core GPU,并采用125张Tensor TFLOPS来增强AI,比起以往的GPU快上10倍。


全球大厂都正全面拥抱AI以强化社会、增加生产力及全球竞争力,台湾也不例外。制造方面,富士康正在使用AI大幅超越人类的检测效率;医疗方面,中国医药大学附设医院已使用AI协助医师做出更快、更精准的癌症肿瘤转移预测。台湾大学则用AI来更快速区别鼻咽癌危急器官;公共安全方面,台湾人工智慧实验室用AI来协助台南市政府监测桥梁结构,预防台风损害;交通方面,桃园市政府预计在2020年前,让30%行驶固定路线的公车,配备L3自动驾驶功能。


台湾是PC及云端运算的中心,而现在台湾正要进行AI运算革命。全球最重要的伺服器制造商在每个城市都采纳了GPU加速伺服器。包括广达、云达、富士康、英业达、纬创、纬颖、华硕、技嘉、华擎、泰安、宏??等,在过去十年,这些厂商的伺服器出货量总和达1亿台,占全球伺服器90%。而全球最大的IT公司也采用NVIDIA平台,包括IBM、DELL、HPE及Supermicro等,他们都预见了这波由GPU运算所带起的AI商机。


黄仁勋强调,庞大的系统、基础架构,以及软体生态系统正围绕着NVIDIA的平台而建立。未来NVIDIA将持续强化GPU运算能力,而这些庞大的终端市场商机,都将与NVIDIA的软体平台共同合作运作。


Intel:将人工智慧融入到各种新型装置

英特尔过去深耕PC,而现在随着一系列广泛新技术的问世,将可??协助人们以及全球产业体系实践未来。其中一项就是将PC从单纯的电脑,转化成为驱动每个人得以创造无限可能与伟大贡献的平台。


目前多数人已将PC视为日常生活的重心,超过八成的人使用PC完成各种事务。除此之外,工作的场所、方式、以及动机也不断改变,人们彼此连系的方式也有所改变,而科技就是推动这些变化的关键。在此情况下,彻底改善PC使用经验将能因应现今面临的各种需求,并协助人们专注在最重要的事务上。然而,欲摇身一变跃升为打造个人无限可能的平台,则需要针对效能、连网性、电池续航力、可调适性、以及智慧性等五个关键层面去推动PC创新。


英特尔致力提供最隹效能,发表最新行动平台专用第8代Intel Core处理器系列,包括内部代号为Whiskey Lake U系列以及Amber Lake Y系列,除了具有双位数的效能提升,还内建gigabit Wi-Fi功能。此外,英特尔也十分关注5G的领先优势及重要性,已有许多合作夥伴出货内含英特尔处理器的5G连网电脑。而行动装置上最耗电的非萤幕莫属,英特尔达成提供全天电池续航力的途径,就是进行全新Intel低功耗显示技术研发,这项技术已被夏普以及群创所生产的1瓦功耗面板所采用,让液晶萤幕耗电降到一半。至於人们希??PC能依我们的生活形态及所在位置而调整,这也促成像是双萤幕等各种新型规格,以及针对特定使用情境所设计的平台。


智慧性将是现代PC经验中一个不可或缺的环结。英特尔计画将人工智慧导入个人电脑,为开发者社群提供各种工具与资源,并与OEM厂商合作,将各种人工智慧功能融入到新型装置。英特尔推动AI on PC开发者计画,为开发者提供各种工具与培训资源,包括OpenVINO toolkit以及Windows ML,让他们充分发挥硬体功能,释放在人工智慧创新的潜力。目前英特尔已经展示名为Project Precog的新概念PC,一款主打兼具多功能性与生产力、并具备智慧型功能的可变形双萤幕笔记型电脑。另还有客户打造出针对各项最新应用所研发之人工智慧新机种。



图3 : 英特尔资深??总裁Gregory Bryant宣布透过提供开发者社群各种工具与资源,将AI注入个人电脑。
图3 : 英特尔资深??总裁Gregory Bryant宣布透过提供开发者社群各种工具与资源,将AI注入个人电脑。

AMD:全新制程提供更高运算效能

为了提供更高效能的CPU与GPU,AMD也不遗馀力,陆续推出7奈米制程Radeon Vega GPU产品,以及12奈米制程32核心的AMD第2代Ryzen Threadripper处理器。此外,也针对Ryzen桌上型处理器持续扩展并精进AM4桌上型产业体系,发表AMD B450晶片组的主机板。第2代Ryzen桌上型处理器进行优化的B450晶片组,设计旨在提供兼顾功能、效能以及价值的完美平衡,包括华擎、华硕、映泰、技嘉、微星等合作夥伴厂商都将推出搭载B450晶片组的产品。


AMD发表的32核心64执行绪的第2代Ryzen Threadripper处理器,为AMD 12奈米制程产品阵容的第二款产品,在着色、後制以及编码等工作负载展现更高的性能。全球各地OEM厂商夥伴都已经开始采用Ryzen APU、第2代Ryzen桌上型处理器以及Radeon绘图核心来推出新产品。


AMD更计画让这些CPU与GPU产品阵容在未来几个月持续精进得更家强悍。除了7奈米与12奈米制程产品基於Ryzen、Radeon以及EPYC处理器的动能持续推进之外,AMD也将由旗舰装置与游戏至机器学习与资料中心等市场,带领新一代高效能运算效能应用更为蓬勃。



图4 :  AMD全球资深??总裁暨运算与绘图事业群总经理Jim Anderson展示12奈米制程的第2代Ryzen Threadripper处理器。
图4 : AMD全球资深??总裁暨运算与绘图事业群总经理Jim Anderson展示12奈米制程的第2代Ryzen Threadripper处理器。

结语

不论是智慧型手机、IoT装置或是车子,这些人类和终端装置上的AI应用,在各种微小时刻都建立了观念,并逐渐形成社会规范。人工智慧带来如此大的影响,不仅是因?社会对科技抱持着信心,更是因?科技在人类日常生活中扮演了重要的角色。身处在科技产业,每一个人都必须努力去协助AI的发展,并小心检视、考量各种可能的影响,最重要的是,不让AI对社会或人类造成伤害。


AI的应用与装置数量都正在持续成长中,新型装置和新兴应用也会有更创新的方式去运用这项技术。这些互动方式都改善了人类的能力,影响人类生活并为AI建立正面的社会共识。


相关文章
3D封装成显学 台积电与英特尔各领风骚
低价刺激消费需求 SSD强势跃居主流
SSD市场前景艳阳高照
2025年产业环境应用下 高容量硬碟储存技术现况
家庭小帮手:新创公司的机器人可以收拾凌乱的房子
comments powered by Disqus
相关讨论
  相关新品
EM500EV 测试/开发板
原厂/品牌:集博
供应商:集博
產品類別:IDE
  相关新闻
» NVIDIA即时对话式AI突破语言理解的AI训练、推论效能
» 保险金融与AI智慧健康区块链黑客松跨域实战
» Arm将自动化导入物联网连接管理
» 社会课题最囹100关注 全方位系统解析
» 趋势科技率先利用 AWS Transit Gateway 提供高效能在线式网路资安防护
  相关产品
» 技嘉发表最新支援新世代AMD Ryzen处理器的主机板BIOS
» Arm全新Mali-D77显示处理器 强化VR性能
» AMD发表适用於Blender 2.80 Beta、AI加速降噪的Radeon ProRender外挂程式
» TYAN发布伺服器及主机板支援第二代Intel Xeon
» 英特尔全新 10 奈米 Agilex FPGA 家族 推动打造以资料为中心的世界

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2019 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw