桌面计算机和笔记本电脑中的3D rendering效益快速增加,其中内存带宽扮演着关键性的角色。过去五年来,高阶绘图系统的内存带宽每年以30%的速度成长。绘图内存系统的带宽远远超过PC主存储器的带宽。为能满足此种对带宽的高度需求,必需要定义出特定的绘图内存I/O标准。2005年,在绘图市场上,全新的GDDR3标准有了突破性的发展。
绘图内存之发展史
最早期的绘图内存和标准的通用DRAM有很大之差异性。这些早期的绘图内存包括了一些特别的功能,用来支持3D rendering和可视化过程的种种操作。一代一代下来之后,绘图内存逐渐整合成标准的通用DRAM。逻辑的处理部份完全被放在GPU中,而绘图内存则专门负责DRAM的核心功能。因此,使得绘图内存的带宽需求大为增加。
在90年代末期,标准的通用内存不再能够提供绘图处理器所需的带宽。内存变成系统的一个瓶颈,因此诞生了x32 GDDR内存。英飞凌(之前的西门子半导体)是第一家推出双倍数据传输率RAM的公司。该公司所提供的32Mbit DDR-SGRAM 是全球最快的绘图内存。在2001年,英飞凌又推出了后续的设计,一项128Mbit(4Mx32)的绘图DDR。
推出128Mbit GDDR之后,英飞凌制作了绘图内存的第一个BGA(Ball Grid Array)封装方式。一个BGA封装,和TSOP或TQFP封装相比较,具有两个内在优势,第一个是它的几何优势,和之前所使用的TQFP封装相比较,新的BGA封装在绘图卡上只需要占用一半的电路板空间。在笔记计算机绘图系统上,这个优势是非常理想也很成功的。BGA封装的第二个优势是它在所有讯号和地址在线大量的降低了电性寄生的状况。在增加数据传输率上,降低电性寄生是一项必需的条件。
在128Mbit GDDR方面,GDDR标准的时代已经过去了,因为它无法满足对带宽增加的需求。绘图产业需要一个新标准,一项更为先进与最优化的标准,以适用于更高的数据传输速度。而GDDR2是没有实际被应用的,此标准从来没有进入量产过。GDDR3则是替代GDDR的一项标准。
在2004年,256Mbit GDDR3产品正式出现在市场中,接着在2005年又再推出一个512Mbit GDDR3产品,其clock频率高达800MHz,又是采用最小的FBGA封装。
GDDR3绘图内存标准
GDDR3标准从通用的DDR2标准借用了许多的功能特性,并且将这些功能最优化以达到更高的数据传输速度和更低的功率消耗。
和GDDR相较,GDDR3的主要创新所在是在操作电压上,从2.5V降至1.8V,芯片上的讯号也有终端电路,不再像GDDR中没有终端设计的讯号线,还有一个动态控制的阻抗输出驱动器,一个4bit prefetch和一个单向单端式之数据strobe。所有这些功能都是更高数据传输率、改善的讯号完整性以及更低功率消耗所必需的。有了这些改变,GDDR3内存便能够比GDDR和DDR2标准达到更高的数据传输率。
在传送频率愈来愈高的状况下,讯号线必需在其端点加上电阻,以防止因反射造成在讯号在线的干扰,降低讯号的质量。在GDDR中,讯号线必需以外加的电阻达到终端连接,这些电阻都是被焊接在内存附近的印刷电路板上。在GDDR上外加终端电阻,可以稍微增加频率范围,不过,此种终端连接法无法支持在GDDR3中高达800MHz或甚至更高的频率范围所需要之讯号完整性。因此,GDDR3采用了芯片上之讯号终端方式,其终端电阻被整合入内存芯片当中。
另一项支持可靠的高速点对点传输之重要功能特性是采用阻抗的Vddq终端方式。GDDR3的I/O接口是一种虚构的开放drain逻辑,其总线的两端都有终端连接。其中的一端,接了一个动态控制的驱动器,具有40Ohm的阻抗,另一端的接收器则接了60Ohm的讯号线终端。
(表一)是GDDR和GDDR3以及DDR2标准的比较。
表一 GDDR和GDDR3以及DDR2标准的比较
|
GDDR |
GDDR3 |
DDR2 |
工作电压
Vdd/Vddq |
2.5V |
1.8V |
1.8V |
内存架构 |
x32 |
x32 |
(x4, x8) x16 |
Clock 频率 |
200~400MHz |
500~800MHz |
300~500MHz
在绘图上的应用 |
封装型式 |
TQFP和BGA |
BGA |
BGA |
Prefetch |
2 |
4 |
4 |
终端连接 |
没有终端连接 |
芯片上有终端连接 |
芯片上有终端连接 |
芯片上有终端连接 |
2、4和8 |
4和8 |
4和8 |
Data strobes |
4和8 |
单端双向 |
单端单向
差异式双向或单端单向 |
3D Rendering系统中的基本功能和工作负荷之分配
在一个交互式的3D游戏中进行画面的计算,可用一些基本的步骤来形容。第一步,3D的景象是由玩游戏的人下指令所产生的计算结果。3D景象是指所有对象在虚拟三度空间的安排和定位方式。这个部份的计算是由PC的CPU所进行的,之后CPU将3D景象交给GPU。GPU的工作是将3D景象转至一个二度空间的画面,可以在显示器上播放。这个部份的GPU工作称为3D rendering。此时必需考虑几个特效以达到画面的真实性,这些特效包括颜色、纹路、多重延伸式的灯光源、阴影、反射、透明性、光线之吸收、不透明材料等等。所有这些特效都需要强大的记算能力以及特别快速和宽广的内存接口,以能随机性的存取内存,而只需最少的等待时间。内存带宽和大小主要是由参数的值来驱动,必需将此值储存好并快速的取出使用,高度来回重复计算的中间结果亦必需储存起来。所有这些计算都是以实时的方式进行,每一秒钟超过40个图框。
整合式和独立式之绘图应用
一般来说,可以将各种绘图系统分成两大类别,一个是整合式绘图系统,另一个是独立式绘图系统。
在整合式绘图系统方面,绘图处理器是内建在PC芯片中,该芯片则是被焊接在笔记计算机或桌上计算机的主板上。这些整合式的系统使用PC的主存储器做储存及caching的动作,因此,在两方面会限制住3D rendering的效能。第一,内存的最大带宽会被限制在标准的主存储器带宽;第二,绘图系统必需同时和CPU以及其他在PC上使用内存的各个部份共同分用此带宽。采用Toms Hardware Page(www.tomshardware.com)进行的Benchmark测试很清楚的显示出整合式系统无法提供足够的rendering能力给高阶的3D游戏使用。
独立绘图系统包括一个独立工作的绘图处理器,加上一个专用的绘图内存,直接连接到独立的GPU。此类独立绘图系统经由标准的PCI-E(之前为AGP)总线连接至PC芯片组。此类独立式GPU的3D效能会远远超过整合式绘图处理器之效能,在内存带宽的需求亦是如此。这些Benchmarks显示出独立式绘图系统之效能超过整合式绘图系统效能之比例为3对20之比。在达到此卓越的效能上,内存I/O技术和记体带宽扮演主导的角色。
玩家级以及高阶绘图卡都使用特定的x32架构之绘图内存。此类系统目前都采用GDDR3内存,具有512MB之图框缓冲区,其clock频率为500至800MHz。此类架构可提供高达410Gbps内存带宽给GPU,是高阶PC主存储器的12倍。目前高阶笔记计算机绘图系统具备256MB图框缓冲区,采用的是500MHz GDDR3内存,提供给GPU的内存带宽是此类笔记计算机主存储器带宽的五倍。
主流式的绘图系统一般采用x16架构的内存组件。大部份新主流绘图系统都采用DDR2 I/O技术,其频率频率大约为400MHz。此类系统比整合式绘图系统的效能还是好很多。
整合式和独立式绘图系统之市场
根据Mercury Research,在PC系统中独立绘图方式所占的比例在过去几年有稍微的波动,大约为40%~45%。在3D操作系统方面,像是Windows Vista就被预期会增加一台一般性的PC在3D rendering效能方面的需求,因此,很可能会影响到采用独立式绘图系统的比例。在2005年,Mercury Research预测在独立式绘图系统方面,将有105mio之市场,而将会有160mio PC系统装置整合式绘图系统。其中,22mio之独立式绘图系统会被装入笔记本电脑,而83mio装入桌面计算机。
展望
未来对于内存带宽之需求持续增加,新的技术将持续改善画面质量,这是推动增加带宽需求的推手。即将到来的高画质显示将提高分辨率以及每一图框的画素。Rendering之技术,例如HDRR(High dynamic range rendering),是一个制作非常强的光源之光环效果的技术,会增加在每一画素计算上的复杂度。
除了PC绘图之外,还有其他现有的以及即将到来的绘图DRAM市场。所有新世代的主要游戏机都将使用绘图GDDR3内存。即将进入住宅客厅的媒体中心和媒体网关(gateways)将会具备重要的绘图功能,以及绘图内存。新的3D操作系统,例如Windows Vista,对3D rendering 效能之需求将扩展至每一台PC。(作者为Infineon英飞凌绘图DRAM营销经理)