账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
量身订制的DSP组件设计策略
满足低功耗需求

【作者: Nat Seshan】2005年08月05日 星期五

浏览人次:【2312】

许多嵌入式处理器都宣称它们的功耗最低。但是事实上没有一颗组件能在所有的应用中保持最低功耗,因为低功耗的定义与应用环境习习相关,适合某种应用的芯片设计很可能会给另一种应用带来难题。可携式应用多半是根据电池寿命来定义低功耗,这类应用的功能相当广泛,操作模式也千变万化。电信系统组件若要满足应用电源需求,就必须在功率预算范围内处理所要求的信道数目,同时透过封装和电路板将功耗散逸,以确保组件保持在额定温度范围内;另外,这些基础设施应用也很重视最大负载条件下的功耗。因此,为了达到功耗要求,DSP供货商会针对目标应用选择最合适的组件制程、电路设计、电压和频率操作点以及整体架构。


省电技术

DSP供货商有许多技术可以用来降低功耗,并且达成效能目标,包括:


  • ●选择适当制程;


  • ●晶体管设计技术;


  • ●选择正确的操作频率和电压;


  • ●选择正确的架构,包括整合度、内存架构和运算处理单元;


  • ●采用散热效率很高的封装,确保组件保持在特定操作温度范围内。



功耗来源

无论应用为何,组件功耗都包含下面几种来源:


漏电功耗(leakage power)

组件的漏电功耗为固定值,不受处理器动作或操作频率影响,但会随着制程、操作电压和温度而改变。低精密度(low geometry)制程的漏电功耗多半会跟着电压和温度而呈指数增加。


频率功耗(clocking power)

组件的频率功耗与频率频率成正比。高整合度组件的芯片面积多半用于内存或缓存器等同步组件,如果频率架构设计不良,那么无论组件实际工作量多寡,其功耗都会保持不变。


操作功耗(active power)

与组件当时所执行的实际系统功能有关。


除了上述来源之外,组件功耗还会受到两大因素影响:


组件电流

组件电流越高,电池电力的消耗速度就越快,有时还会超出功率预算范围而导致供应电压下降,使组件脱离正常操作区而造成错误。


组件/系统温度升高

组件若无法有效散热,其温度就可能超出额定范围而造成操作错误。


下列优化技术会以不同方式解决前述各种功耗问题。


选择适当制程

为了使不同应用的效能和功耗达到优化,德州仪器(TI)能提供各种制程类型,例如TI的130奈米低漏电制程在1.5V操作时几乎没有漏电流,对于DSP多半处于闲置状态的可携式应用而言,这种低漏电制程就能帮助它们节省功耗。另一种高效能制程的漏电流较大,却能在1.2V下操作,采用该制程的组件可以达到低漏电制程的两倍MHz效能。在较重视最大操作功耗(fully-active power)的基础设施应用里,这种高效能制程的竞争力还胜过低漏电制程,原因有两点:首先,低漏电运算处理单元的操作频率只有高效能制程的一半,这表示其数量必须加倍才能提供同样效能,但这会导致组件成本提高。其次,由于功耗与电压平方成正比,故在其他条件相同的情形下,高效能制程的操作功耗只有低漏电制程的(1.2V/1.5V)2或是64%。由于低操作功耗对于基础设施应用的重要性通常会超过低漏电功耗,因此高效能制程就成为这类应用的最佳选择。


晶体管设计

同样制程的晶体管也可以有不同的开关临界电压(VT),例如低VT晶体管的切换速度较快,高VT晶体管的漏电流则较小,芯片只需在会影响速度的部份使用低VT晶体管,其它电路则采用高VT晶体管以节省电力。设计人员的组件数据库应包含高VT和低VT晶体管所构成的基本逻辑闸(NAND、NOR和INVERT等),他们有时还会使用中间临界电压(middle-VT)的晶体管。一般说来,除非为了满足重要的效能要求,否则应尽量使用高VT晶体管组成的逻辑闸。


组件操作点:电压和频率

数种组件频率供应方式可以节省功耗:


  • ●多频率域(multiple clock domain);


  • ●动态频率调整(dynamic frequency scaling);


  • ●频率闸控(clock gating)。



除了频率,调整电压也能降低功耗:


  • ●静态电压调整;


  • ●动态电压/频率调整;


  • ●多电压域(multiple voltage domain)。



多频率域

频率域是组件中使用同一个频率频率的部份。将芯片电路分成多个频率域可以让每个部份以最适当的速度操作,进而节省电力。例如高效能DSP可能需要以1GHz操作,但连接至立体声编码译码器界面的串行埠却只需12MHz的速度。虽然多频率域设计还需要同步电路和桥接电路让讯号跨越不同的频率域,其能大幅降低整体功耗。


频率调整

组件的某些频率域在不同时间可能会有不同的操作需求,例如处理器若在某段时间只有10%的运算需求,那么将频率频率减为平常的1/10就能大幅降低频率功耗。动态频率调整电路的设计必须非常小心,以确保同步逻辑电路收到稳定而不会跳动的最小负载周期频率。频率调整对于使用电池的应用最有帮助。


频率闸控

频率闸控会切断闲置电路的频率,其中又以睡眠模式的做法最简单,它让用户利用软件关掉芯片部份电路。其它技术则自动将组件某些部份的频率关掉,直到有需要时再启动,例如以太网络的媒体访问控制器(MAC)平常可处于睡眠模式,等到它侦测到网络后才开始工作。频率闸控也和频率调整一样适合所有使用电池的应用。


静态电压调整

若应用的效能需求较低,组件也可在较低电压下操作。举例来说,若DSP是在1.2V电压下以720 MHz速率工作,它也能使用1.1V电压并以600MHz频率操作。由于功耗与电压平方成正比,在1.1V电压下以600MHz速率操作的功耗只有720MHz功耗的(1.1V/1.2V)2,大约是84%左右。另外,操作功耗也会因为频率频率降低而减少两成。


动态电压/频率调整

这种技术让电压随着频率而减少以进一步节省功耗。频率的切换同样必须非常小心,组件应先将频率切断,然后才改变操作电压。动态电压/频率调整技术非常适合可携式应用。


电压域

多域的观念同样适用于电压,设计人员可以根据效能需求将芯片分成多个部份,而每个部份使用不同的电压。由于不同的电压域必须以隔离电路分开,保护它们不受其它电压域的损害,因此这种技术用于设计时必须相当谨慎。它们还必须提供转换电路,用来转换跨越不同电压域的讯号。多电压域需要多组电源,然而芯片内建稳压器的效率通常都比不上电路板层级的电源供应器,因此这类设计多半需要由电路板供应多组电源,这正是多电压域技术的缺点之一:因为电路板需要增加多个电源层,使得设计复杂性大幅提升。


电源闸控(power supply gating)

电源闸控又比频率闸控技术更进一步,它会直接切断芯片闲置电路的电源。由于这种技术更复杂,又需要隔离电路,因此通常会用于比频率闸控技术(以个别电路为单位)还大的范围(多半以模块为单位)。这种技术和多电压域技术也有所不同,其隔离电路会内建于芯片,避免增加电路板设计的复杂性。


操作点技术的应用范围

上述技术是否有用,端赖用户是根据电池寿命或最大功耗来评断应用系统的优劣。某些技术几乎对所有应用都有帮助,例如多频率域和多电压域技术只需用到频率频率和电压,所以任何应用系统都可以采用这两种技术。域的数目只会受到这些技术所带来的设计复杂性限制,多电压域还可能受到电路板复杂性的影响。同样地,多数组件的电路并非都是在最大负载条件下操作,因此频率闸控技术(尤其采用自动控制方式的技术)在许多应用都能发挥作用。静态电压调整对所有应用都有好处,因为组件只会在提供所需效能的必要电压下操作。


应用系统若以电池为电源,并提供多种操作模式,那么频率调整和动态电压/频率调整技术就能发挥最大作用;另一方面,这些方法对于重视最大功耗的应用却没有太大用处。除此之外,电源闸控对于这些类似于基础设施的应用可能也没有帮助,因为这类应用的组件很少会有大片电路处于闲置状态。


选择适当架构

调整应用功耗的另一种做法是选择最适当的功能整合度、运算处理单元和内存架构。


外围和内存的整合

组件和外部零件需要透过电路板互传讯号,有可能是系统功耗的主要来源,因为经由电路板传送讯号需要比芯片功能整合还高的电压,电路板讯号线的寄生电容也会造成功耗。


运算处理单元的调整

以系统单芯片为主的现代组件可以选择不同类型的运算处理单元:


DSP

专门执行讯号和图像处理算法的处理器,内建多组应用优化硬件运算逻辑单元和乘法器,能以极高效率执行标准讯号处理算法。这类组件具备完整的可程序能力,可以轻松支持未来出现的新标准。


通用处理器

ARM处理器就是例子,其主要用来执行一般性功能,例如图形化用户界面、网络堆栈(network stack)和整体系统控制。由于它们不必整合DSP功能所需的运算处理单元,所以执行一般性功能时功耗就比较小。


特殊用途硬件协同处理器

只包含特定功能所需的算术单元和控制电路。如果应用功能的定义很明确,又不太可能改变,即可将该功能整合到硬件协同处理器。举例来说,整合了Viterbi和Turbo处理器的DSP,便可专门执行3G基地台标准所要求的前向错误更正(FEC)。


今日的系统单芯片多半会整合前述多种运算处理单元。有些架构会采用多种不同类型的运算处理单元,然后将不同的功能交给最适当的核心执行。DSP可以高效率执行讯号处理,RISC则适合处理系统控制和用户界面等工作。由于每个运算处理单元都以实际所需的速度执行最擅长的工作,故能将功耗减至最小;相形之下,若只用一个运算处理单元执行所有功能,其频率频率就必须更高,同时还要包含更多硬件,其中有些部份可能经常处于闲置状态。换言之,这类设计的工作效率必然较低,而在工作效率就等于电源效率的情形下,其功耗必然更高。


内存系统的选择

组件若想避免存取外部内存,也可将应用所需的内存全部整合至芯片内。然而视讯或影像系统之类的应用却需要极为庞大的内存,将它们全部整合至芯片所需的成本可能远超过直接在电路板上增加DRAM的费用。这类应用可以利用快取架构来减少外部内存的存取次数,进行降低系统总功耗。


就算组件包含全部所需的内存,快取也能帮助它们降低功耗。这类组件可以将少量的第一层高速缓存直接联机到处理器,使其储存主存储器中最常用的内容。主存储器则是第二层内存,其速度通常较慢,所用的内存方块也比第一层快取更省电。由于处理器的多数存取动作都会命中第一层高速缓存,这些内存又采用电容值较小的结构,所以每次存取动作的功耗就变得更低。


封装与功耗

前述所有省电技术都能帮助组件减少产生热量,封装则能透过高效率散热进一步加强它们的效果。传统的风扇、散热空间或散热片都不适合空间有限的可携式应用,它们的高度或成本也可能超过插入式模块或汽车应用所能接受的范围;相形之下,金属散热盖或散热层虽会增加组件成本,却能提供更高散热效率。有些组件还将散热锡球连接到组件的散热接地面,由它透过电路板来达成更良好的散热效果。


选择适当技术

电池供电型应用

可携式或掌上型应用最重视电池寿命,但可携式应用使用电池的方式却有极大差异。可携式产品有许多不同的操作模式,设计人员必须将这些模式列入考虑才能让电池享有最长寿命。


MP3播放器

由于歌曲下载时间只占播放少部份的时间,这类产品的电力多半用于歌曲播放。为了将待机功耗减到最少,它们还会在一段时间后自动关机。MP3播放器必须将音乐实时解压缩,避免数据流失造成各种杂音。MP3播放器的效能需求远小于视讯处理或宽带通讯等其它应用,所以最适合使用低功耗DSP。这类组件通常会采用低漏电制程,因为漏电仍是主要功耗来源。它们还能采用频率调整技术,以便根据歌曲所需的译码效能来降低组件的频率频率。


数字相机

这类产品有多种操作模式,包括:


  • (1)自动关机的待机模式;


  • (2)预视模式(等待拍摄相片);


  • (3)拍照模式(实际拍摄相片以及处理和压缩影像);


  • (4)录像模式(部份相机具备此功能)。



数字相机的屏幕有时会开启很长的时间,但DSP真正执行影像压缩的时间却很短。数字相机在预视模式和拍摄模式都必须执行许多实时处理作业,在预视模式必须不断显示最新画面,在拍摄模式则要尽快完成相片的处理和压缩,以便继续拍摄下一张照片,进而将两次拍摄之间的延迟时间缩到最短。这种DSP包含多种不同的运算处理单元:


  • ●ARM7核心,负责系统控制功能和用户界面;


  • ●TMS320C54x处理器;


  • ●SIMD图像处理引擎(iMX),提供可程序图像处理功能;


  • ●可变长度编码和译码(VLC/VLD)协同处理器,负责影像和视讯的压缩与解压缩;


  • ●预视引擎,实时显示预视画面以及数字变焦。



它还具备很高的功能整合度,可以缩小产品体积和减少系统功耗:


  • ●多用途的OSD功能;


  • ●彩色液晶屏幕的数字界面;


  • ●CompactFlash、SmartMedia、Secure Digital以及Memory Stick记忆卡界面;


  • ●多信道10位数字模拟转换器,负责提供NTSC/PAL复合视讯输出;


  • ●多信道串行音频Codec界面(McBSP);


  • ●芯片内建USB 1.1功能控制器。



这类装置可以选定某些很少使用的功能,然后在它们处于闲置状态时切断频率讯号。举例来说,预视和待机模式可能不需要iMX和VLD/VLC功能方块,相机未连接至个人计算机时则可将USB界面的电源关掉。


光无线

这类装置可以选定某些很少使用的功能,然后在它们处于闲置状态时切断频率讯号。举例来说,预视和待机模式可能不需要iMX和VLD/VLC功能方块,相机未连接至个人计算机时则可将USB界面的电源关掉。


  • 标准移动电话有两种电源模式:


  • (1)等待电话的待机模式;



(2)实际拨打电话的通话模式。先进手机还增加数字相机、MP3和录像功能,所以其操作模式也变得更多。为了支持这些操作模式,移动电话通常会采用不同类型处理器所组成的异质架构,由DSP和各个操作模式专用的硬件加速器来执行调制解调器和相机等应用所需的讯号处理功能,再由DSP搭配负责用户界面和系统控制功能的RISC处理器。如果某个模式不会用到加速器功能,系统也可切断它们的电压或频率,例如待机模式不需要用户界面时,可将RISC核心的电源关机。


可携式应用会视需要采取各种省电技术,以便将重要操作模式的功耗减到最低。


基础设施系统

封包语音(VoIP)或基地台收发器等设备所用的无线和有线基础设施虽属于「插入式」应用,却仍须在不同的功耗限制下操作。有些系统会在电源供应和系统散热能力已经固定的机架上,增加新的功能单元或信道容量,这些系统通常必须在室内空调系统故障时继续正常操作。每个机架的总功耗都不能超过现有电源供应的供电能力,电源供应会将电源提供给机架上的电路板,每张电路板再将电源分配给电路板上的不同组件。随着半导体组件日益精密,芯片还能提高操作频率或内建多颗DSP处理器来支持更多信道。另一方面,不断缩小的电路结构却让芯片产生更多功耗,因此透过封装提高散热效率也变得更重要。由于这些系统必须非常可靠,所以在分析其电源和散热需求时,应将所有处理器都在最大负载下工作的情况列入考虑。


为了降低满负载的操作功耗,这类系统多半会采用在较低电压下操作的高效能制程,并且搭配对于任何应用都有帮助的多频率域和频率闸控技术。这些系统不会利用多电压域技术降低功耗,因其包含大量而密集的处理器,此时若采用多电压域技术会造成电路板设计复杂性大幅增加。静态电压调整有助于节省功耗,由于功耗会随着操作电压的平方而改变,所以这些设计会选择较低的操作电压。这些组件还能整合更多核心,以弥补某些核心在较低频率下操作所不足的效能,例如与其使用四个在1.2V下操作的300MHz核心,还不如使用6个在1.0 V下操作的200MHz核心,因为两种解决方案的MHz效能(和信道处理能力)都是1200MHz,但后者功耗却只有前者的(1.0V/1.2V)2,大约是69%。这些组件的芯片面积大都用于内建内存,其中又以数据存储器为主。由于在特定的信道处理密度下,每颗芯片所需的数据存储器也是定值,而且其中多数内存又会直接分配给各个核心使用,所以增加核心并不会造成芯片总面积等比例增加,所带来的低功耗优点则足以弥补额外增加的成本。


功耗优化必须符合应用需求

不同的DSP应用设备需要不同的策略来满足其需求,例如基础设施系统希望降低最大负载条件下的功耗,可携式应用则希望将电池的电力消耗减至最少,它们的需求显然就有极大差异。事实上,就算同类型的应用都可能有着极为不同的要求,例如不同的可携式应用必须采取不同的电源优化技术来满足各自的操作需求。半导体厂商想要服务各种市场,就必须掌握多种制程、设计和架构技术,才能针对目标应用提供最合适的组件。


(作者为TI DSP Catalog and Emerging End Equipments Device Architecture Manager;本文原文刊载于Portable Design 7月号)


[2] D.A. Smolyansky, Time Domain Network Analysis:Getting S-parameters from TDR/T Measurements - Infiniband PlugFest, 2004>

(作者为TI DSP Catalog and Emerging End Equipments Device Architecture Manager;本文原文刊载于Portable Design 7月号)如果说IT(Information Technology;信息技术)界要颁发最速黯淡奖,那么笔者可能会提名InfiniBand,理由是InfiniBand的规格及标准规范自1999年开始起草,2000年正式 发表,之后主力业者纷纷退出。(作者为TI DSP Catalog and Emerging End Equipments Device Architecture Manager;本文原文刊载于Portable Design 7月号)InfiniBand:还会有多少人想起我?

自上而下直到物理实现的DSP设计流程你可在「对于DSP与通讯工程师而言,时间是越来越紧迫了!面对着高效能、低成本与快速交货的需求不断升高,如何整合各领域、各阶段、与各工具平台的设计,是目前研发设计团队急需突破的当务之急,这也是为什么需要更快速、整合性更高、且能有效压缩设计周期的研发工具。」一文中得到进一步的介绍。

压缩DSP与通讯产品的设计周期在「DSP广泛应用于许多小型移动产品中,并成为其必不可少的部分,最新一代DSP必须具有极低功耗从而最大程度延长电池寿命并减小芯片尺寸。本文以两个公司之间的合作为案例,说明多个IP供货商与代工供货商的合作以及交流对DSP芯片项目的开发成功起到至关重要的作用。」一文为你做了相关的评析。

市场动态
超低功耗DSP设计中IP供货商与代工厂商所扮演之角色如果说IT(Information Technology;信息技术)界要颁发最速黯淡奖,那么笔者可能会提名InfiniBand,理由是InfiniBand的规格及标准规范自1999年开始起草,2000年正式 发表,之后主力业者纷纷退出。大赛采用自由命题形式,凡基于TI任一型号DSP芯片所设计的应用系统或算法实现,均可以 参赛。竞赛分成系统应用和算法实现两个大组,其中参赛“系统应用组”的队最终成果是包括 硬件和软件的完整演示系统,参赛“算法实现组”的队参赛题目可以是在商业化硬件仿真。InfiniBand:还会有多少人想起我?
2005年德州仪器中国区DSP设计大奖赛拉开帷幕你可在「随着MPEG-4应用与无线应用的融合,无线设备的处理器结构开始变得庞大不堪。本文介绍了一种解决方法,利用可定制VLIW DSP内核来减小设备处理器的体积。」一文中得到进一步的介绍。
随着MPEG-4应用与无线应用的融合,无线设备的处理器结构开始变得庞大不堪。本文介绍了一种解决方法,利用可定制VLIW DSP内核来减小设备处理器的体积。在「Nallatech公司近日推出Virtex-4 XtremeDSP开发工具包,使得设计师能立即在新的FPGA设计中充分运用Xilinx新款Virtex-4 SX FPGA,此款FPGA可提供丰富的DSP性能。」一文为你做了相关的评析。
相关文章
以爆管和接触器驱动器提高HEV/EV电池断开系统安全性
低 IQ技术无需牺牲系统性能即可延长电池续航力
以霍尔效应电流感测器简化高电压感测
以固态继电器简化高电压应用中的绝缘监控设计
以半导体技术协助打造更安全更智慧的车辆
comments powered by Disqus
相关讨论
  相关新闻
» 美光32Gb伺服器DRAM通过验证并出货 满足生成式AI应用要求
» Cadence结合生成式AI技术 开创多物理场模拟应用新时代
» AMD公布2024年第一季财报 成长动能来自AI加速器出货增长
» 调研:2027年超过七成笔电将是AI PC 并具备生成式AI功能
» 新唐科技MA35D0 微处理器系列适用於工业边缘设备


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK858DSW66USTACUKU
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw