账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
高效能运算当道 低功耗设计为虎添翼
低功耗已是必要

【作者: 王岫晨】2020年08月31日 星期一

浏览人次:【3982】

无论行动装置或者工业生产设备,一致的发展趋势都是高效能运算。


但高效能运算能否再往更高的目标发展,取决于能否有效降低功耗。


功耗增加会影响散热成本与电池续航力,严重更将影响使用者经验。



从随身行动装置到工业生产设备,高效能的运算技术已经普遍应用于生活中的各个层面。而在追求高效能运算的背后,低功耗设计往往却是能否降低发热量的重要关键。目前无论是随身行动装置、工业生产设备,或者任何介于两者之间的装置,其一致的发展趋势都是『高效能运算』,亦即数据吞吐量更大、运算更快、判断越来越正确、反应更即时等。但同时,高效能运算也代表更高的功耗。因此高效能运算能否再往更高的目标发展,在5G时代实现AI Everywhere的愿景,取决于能否有效而显著的降低功耗。



图一 : 低功耗设计往往都是能否降低发热量的重要关键。
图一 : 低功耗设计往往都是能否降低发热量的重要关键。

事实上,高效能运算的应用在不同装置与应用场景上,不外乎以电池供应电源或者接市电,因此对功耗增加的忍受度不同。功耗增加对工业应用带来的是电费及散热成本增加,对行动装置来说其冲击则表现在电池使用的时限上,电池续航力不足,将影响使用者经验,例如智慧手机就是一个最好的例子。


低功耗设计的重要性

由于人工智慧物联网等高效能运算技术,得益于神经网路技术的进步,机器学习不再局限于超级电脑的世界了。如今智慧型手机应用处理器可以执行AI推论,用于实现影像处理和其他复杂的功能。这些边缘运算装置有许多是采用电池供电,因此对于系统的功耗有很高的要求,用来延长系统的工作时间。


对现今许多设计而言,功耗是选择元件最重要的标准,因为可携式产品的电池寿命越长,对消费者越有吸引力。在基础设备应用中,低功耗也是一项重要规格,因为较低功耗代表晶片将产生较少热量,过高的热量可能会限制系统产品的通道密度,或使得设计团队无法增加新的功能。此外,有些较着重电源成本的设计,例如以通用序列汇流排(USB)供电的产品,或由汽车电瓶供电的汽车修配零件产品等,其电力预算亦相对有限。


以恩智浦半导体(NXP)为例,其在打造更低功耗的运算解决方案时,除了在晶片设计上有许多创新,电源管理软体的精密度亦大幅提升外,晶片制程方面也采用更先进制程生产。目标是让系统设计人员不用于设计系统时为任一项功能迁就妥协。然而,没有装置十全十美,设计人员必须仔细考量系统需求,检视目前不断推出的低功耗处理器,以了解哪一项产品最符合应用需求。


低功耗运算关键需求

Arm主任应用工程师张维良指出,降低功耗的方式除了透过半导体制程之外,也可以透过IP本身设计达到降低平均功耗的效果。若以Arm的Cortex-M系列处理器为例,原本就针对嵌入式系统设计一系列低功耗运算技术,包括Multiple Power Domain支援架构级的Sleep Mode、Wake-up中断控制器、架构级Power Gating技术。此外Cortex-M0+额外优化减少了程序存取,来保持系统层级的低功耗。


除了过往Cortex-M处理器针对低功耗技术来设计,Arm在新款的Cortex-M55处理器上,也针对高效能低功耗运算打造了一个ML引擎,这个名为Helium的向量运算引擎(MVE)可以有效率的降低运算与功耗比,意即Helium能在单位时间内处理约15倍以往Cortex-M系列的ML运算能力,但是功耗方面只略微增加几成。透过Cortex-M55搭配Helium技术能更符合IoT装置搭载AI运算的需求。


运算效能与低功耗的平衡点

对现今许多设计而言,功耗是选择元件最重要的标准,因为可携式产品的电池寿命越长,对消费者越有吸引力。

在半导体业界中,经常会提到PPA(power、performance、area),三者互为影响。高运算效能(Performance)通常代表需要的面积(Area)要增加,面积增加相较之下其功耗(Power)也会增加,通常面积与功耗都会以正比的比例来增加或减少,这三个元素很难面面俱到。因此需要透过架构设计来解决这些挑战,如此就可以不必在追求高效能的同时,还必须对于面积与功耗方面妥协。在实际的设计上,可以参考下列的一些案例。


优化每单位面积的效能:


在面积高度受限的前提下,就该思考如何增加每单位面积的效能密度。例如在M55上引进的Helium向量处理器即是透过架构上的改变,用增加不到一单位功耗的单位,来换取十多倍的效能提升。


搭配NPU大幅提升运算效能:


以ML在IoT的运算方面,Arm研发了另一个利器,即用来搭配Cortex-M的类神经网路处理器(NPU)Ethos-U55。类神经网路处理器是一款专用于ML运算的加速器,Ehtos-U55的面积与Cortex-M55相近,但是提供的是相较于Cortex-M55有32倍ML效能上的提升,透过这类架构上的变革带给AIoT应用更多的可能性。


电源控制设计:


以多重电压域设计(Multiple Power Domain),设定不同指令启动不同的功能框(Functional Block),例如P-Channel控制Core的电源,以Q-Channel 控制Cluster的电源,或者以非同步设计与FMA,调配顶层与核心的用电,以节省电力的消耗。



图二 : 要降低整体发热,异质运算多核心处理器以及记忆体等的配置也至关重要。
图二 : 要降低整体发热,异质运算多核心处理器以及记忆体等的配置也至关重要。

至于恩智浦,很早就预见到运用最新应用处理器架构和设计理念来制造高效能跨界处理器需求。 2017年推出i.MX RT系列跨界处理器,兼顾功耗与性能。如今,不只推出i.MX RT1170突破GHz主频限制,为更多应用开启边缘运算的大门。


恩智浦在近期也发表eIQ机器学习(ML)软体对Glow神经网路(Neural Network;NN)编译器的支援功能,针对恩智浦的i.MX RT跨界处理器,实现占用较低记忆体并更高效能的神经网路编译器应用。 Glow编译器由Facebook开发,能整合特定目标的最佳化,恩智浦利用这种能力,使用适用于Arm Cortex-M核心和Cadence Tensilica HiFi 4 DSP的神经网路运算元库(NN operator libraries),最大化提升处理器的推论效能。


低功耗设计考量

以Cortex-M55为例,Arm的架构设计还考量了以下几个因素:


‧ Designed for efficient compute:以最优功耗效率为设计前提;


‧ Increased DSP/ML performance:提升数位讯号处理器(DSP)及机器学习的表现;


‧ Incremental scalar performance:增进纯量效能;


‧ Advanced power management:更先进的电源管理方式;


‧ Robust security with TrustZone:以TrustZone架构的安全防护;


‧ Additional features for advanced debug: 更先进的侦错工具。


要降低整体晶片发热,除了晶片的低功耗设计之外,异质运算多核心处理器以及记忆体等的配置至关重要。


以跨界处理器i.MX RT1170为例,它的特色包含双核心架构,其中Arm Cortex-M7核心运行频率高达1GHz,Cortex-M4核心运行频率高达400MHz。双核心系统将高性能内核与独立的工作电源区域结合在一起,使开发人员可以同时运行应用程式,或者依据应用需求关闭核心以降低功耗。例如,高效能的Cortex-M4核心可专门针对时间要求严格的应用,像是电机控制;而Cortex-M7核心可进行更复杂的运用。至于双核心可并行运作边缘运算相关应用程式,像是机器学习、语音处理、人脸辨识等。


同时,针对边缘运算应用,工作频率高达GHz的Cortex-M7核心也显著强化了ML的性能、语音/视觉/手势识别的边缘推论,还有自然语言理解、数据分析和数位讯号处理(DSP)等功能。


结语

晶片的低功耗已经不再只是一种需要,而是成为了一种必要。先不谈延长满街跑的行动装置电池续航力,低功耗对于近年来强调环保节能的产品设计理念,也十分能符合时代的需求。随着电路技术与半导体制程的精进,未来更高效能且更低功耗的各种晶片,将会更进一步结合在你我的生活当中。


**刊头图(source:pxhere.com)


相关文章
将意图转化为行动:走进嵌入式语音控制新时代
低功耗MCU释放物联网潜力 加速智慧家庭成形
AI赋能智慧边缘 行动运算处理器的时代革命
针对应用对症下药 Arm架构在车用领域持续亮眼
晶背供电技术的DTCO设计方案
comments powered by Disqus
相关讨论
  相关新闻
» Arm发布车用技术及运算子系统路径图 将加速AI车辆上市时程
» 亚湾2.0以智慧科技领航国际 加速产业加值升级
» Ceva加入Arm Total Design 加速开发无线基础设施的端到端5G SoC
» Arm扩展全面设计生态系 加速基础设施创新
» 高通执行长Cristiano Amon於COMPUTEX 2024 分享智慧装置上的生成式AI运算


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK83JB92LYISTACUKM
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw