账号:
密码:
CTIMES / 文章 /   
嵌入式处理器技术发展之分析
 

【作者: Markus Levy】2004年02月05日 星期四

浏览人次:【1241】
  

尽管高科技产业发展起伏不定,但嵌入式产业却始终维持强劲地发展,不论在精密度、复杂度及实用性上都到达前所未有的里程。随着嵌入式应用领域日益扩展至手机、磁盘驱动器、PDA、网络交换机、打印机等广泛市场中,要为「嵌入式」这个概念找寻其适当定义就变得越来越困难。不过,可以肯定的是嵌入式领域内的各项应用在性能、价格、功耗等指针都有着不同的需求。为了适应这些不同需求,直接驱动各种应用的处理器亦同时迅速发展。举例而言,在过去十年中,ARM处理器已经从简单的ARM7TDMI核心发展到了最新的ARM11EJ-S核心。


成功要素

基本上,一款处理器是否能在市场上生存与成功取决于客户的满意度,而客户满意度又由许多数量及质量上的因素决定。质量因素包括客户关系、技术支持、客户服务、新品开发、公司稳定性及丰富的产品线等等。尽管很难用这些指针具体衡量与比较不同处理器供货商,但可以确定的是多数的处理器供货商(包括硅智产供货商)在上述各项上都表现得差强人意。特别对IP供货商来说,要满足这些需求似乎更加困难,因为他们必须先试着了解客户的各种需求。举例而言,一个IP供货商要能同时针对具有丰富芯片制造经验的大厂,或者没有任何制造经验的新兴设计公司,甚至无工厂的半导体制造商提供足够的技术支持及服务。


性能分析

虽然某些定量指针能够帮助用户在不同处理器间进行比较,但是一次详尽的分析比较仍然非常重要。这些需要仔细衡量的因素包括:性能分析、功耗和效率分析、开发工具支持以及价格(必须从设备和系统角度全面考虑)。


嵌入式领域中有许多用来分析处理器性能的标准,例如测量开处理器执行一段指定程序的速度。原则上,最理想的测试向量应该是应用程序本身,在选择处理平台时,能够满足工作效能,且价格最低、功耗最小的处理器即为客户首选。但是此种性能分析法实际上很难应用,因为将用户程序在各种硬件平台上进行移植和优化的过程相当繁复,而这样的过程却是使应用能有效运作的必要条件。尤其在众多的处理器当中进行初选的时候,此种方式更不可行。


目前,一般消费者能够使用的测试向量非常多,问题是如何正确选择最为接近目标应用的测试向量。换句话说,要先明确预期最终应用程序在待选平台上的运行情况和测试目的,然后再挑选符合要求的特定测试向量。


市面上最普遍适用的测试向量是Dhrystone,但EEMBC验证实验室(EEMBC Certification Labs; ECL)的最新研究指出,Dhrystone不仅不适于作为嵌入式系统的测试向量,甚至在其他大多数场合下都不适合进行应用。Dhrystone有许多漏洞,例如:易被非法利用、人为痕迹明显、代码长度太短、缺乏验证及标准的运行规则等等。


现在新兴流行的测试向量则是业界统一标准的EEMBC测试向量。EEMBC (Embedded Microprocessor Benchmark Consortium)是一个非营利性组织,致力于帮助设计人员快速有效地选择处理器。该组织到目前为止共发布了四十六个性能测试向量,分别应用于电信、网络、消费性产品、办公室设备和汽车电子这五大领域。 EEMBC另外一个重要的功能是为所有测试向量发布一个正式的测评结果认证,以有效地确保组织的权威性。


EEMBC 一般使用两种测评模式:标准型(out-of-the-box)和全定制型(full-fury)。标准型模式允许用户使用各种代码编译程序选项设置,但不可改变测试向量的源代码,其主要目的是为测试处理器和响应编译程序的能力。相反的,全定制型模式则允许修改测试向量的代码,用户可从性能最优的角度考虑,使用汇编、专用库函数、硬件加速程序等各种可能有效的手段,目的是测试该处理器的最大性能指针。如果用这两种模式测试的结果相差很大,就表示系统设计者在使用该处理器时,移植工作量将会很大。反之,如果两者的差别很小,那么就表示细微的代码改动(甚至可能只需要作一些编译程序优化设置)就可能带来大幅度的性能提升。


结构分析

分析测试向量和比较处理平台既是一门科学,也是一门艺术。其特色在于该分析讲究求实事求是的同时又充满变数。举例来说,(图一)比较了几种不同处理器的性能。乍看之下,摩托罗拉MPC7455显然是效能最好的一款处理器,不过仅针对苹果计算机或高阶网络路由器应用而言。假若是应用在手机或其他手持式设备时,单位功耗下各处理器的性能比较又成为选择的关键。在这种情况下,ARM1020E很明显是最好的选择。



《图一 以EEMBC的Telemark比较各种处理器的性能及功耗》
《图一 以EEMBC的Telemark比较各种处理器的性能及功耗》

有时采用将测试向量加以标准化为共同频率的方式来比较各种处理器的效能会比较容易。此外,还能够以每MHz处理器完成的循环或更迭次数来进行比较,此种方式能协助统计系统每次指令花费的平均周期数(CPI )或每个周期能够完成的指令数(IPC)。IPC以处理器每个时钟周期内可完成的工作量衡量该处理器的效率,这对于用电池供电的应用来说十分有效。当然,将测试向量标准化进行比较可能抹杀一些处理器架构系统上的特性。设计各种不同架构系统的目的在于面对特定应用时,处理器能有更高的效率。例如,某些核心为提高频率性能,而设计成扁平电缆较长及复杂的内存控制系统。



《图二 ARM核心的扁平电缆结构演变过程》
《图二 ARM核心的扁平电缆结构演变过程》

ARM处理器微架构的演变

ARM处理器在客户响应、制程进步及技术创新基础上不断长期演进。但若只将焦点放在IPC上,则无法看到此一系列演变所带来的进步。(图二)说明了ARM处理器架构发展的过程,从一个简单的三级扁平电缆演进到先进的八级扁平电缆架构。令人讶异的是,若仅用单一时钟为基础进行处理器的比较,则性能差别非常的小。然而,在现实应用中,ARM11显然是ARM家族中性能最强的系列产品。这是因为ARM7通常只能在200MHz以下频率运行,而在0.13微米制程下,ARM11的运行频率高达500~700MHz,自然就带来更强大的性能。


ARM处理器在增加扁平电缆级数的同时,更进行其他结构设计方面的改进。例如在ARM1026EJ-S核心中,利用一个返回堆栈减少子程序返回时的扁平电缆刷新时间,从而大幅度地提高了系统性能。


EEMBC的测试结果显示此种返回堆栈平均能够提高1.1%的效能,在某些特殊应用上,效能提升的更为明显。事实上,EEMBC大多数测试向量并不使用太多子程序,因此某种程度上低估了返回堆栈的作用。


ARM11中另一个重要的结构改进,是静、动态组合转换的预测功能。ARM11包含一个64埠、四种状态的地址转换缓存区,用来存储最近使用过的转换地址。静态转换预测用来处理动态转换预测无法在地址缓存区中找到的地址。透过EEMBC的测试结果分析,使用静态转换预测能够正确判断出77%的转换地址,使用动态转换预测功能则可达到88%的正确率,而若将静态和动态转换预测功能合并使用,则可达到92%的转换预测准确度。如此一来将会大幅提高IPC指针的可信度,尤其是针对那些存在许多条件转换指令的测试向量或应用程序。


发展持续中

除了继续发展架构及微架构技术外,还有许多方法能够应用在提高处理器的性能上,例如新的ARM11支持单指令多数据(SIMD)指令,能够使某些算法的指令周期提高二到三倍。通过AMBA总线加入的特殊协处理器甚至能够使系统性能提高更多。Amphion最新的JPEG2000编码器使用通用的ARM处理器,即能够满足实时压缩尺寸超过电视标准图像的需求。(作者为EEMBC总裁)


相关文章
安全的乘车体验仰赖安全防护
从台湾心 走向世界心
comments powered by Disqus
相关讨论
  相关新品
Lattice ECP3 Video Protocol Board
原厂/品牌:Lattice
供应商:Lattice
產品類別:FPGA
CWFA205: WiFi+BT
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
GPS SiP Module
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
  相关新闻
» 提升电源系统功率密度 TI推新款LLC控制器
» ST:全方位MCU产品线才能满足智慧工厂各层面需求
» 诺基亚Future X网路架构有效提供5G效能
» 从游戏绘图到人工智能 GPU成为AI新时代要角
» ST:智慧工厂需兼具生产效率与供应链灵活性
  相关产品
» 智原推出新款最小面积的USB 2.0 OTG PHY IP
» 创惟发表快速读取的UHS-I读卡机控制晶片
» 群联提供UFS 3.0矽智财授权 因应异质整合需求
» 芯原Vivante VIP8000神经网路处理器IP每秒可提供超过3 Tera MAC
» 实现下一代除错与追踪功能 ARM推出CoreSight SoC-600

AD