PC绘图内存技术架构与发展

│新东西市集│东西讲座│影音频道│出版中心│智动化专区│

元件次系统自动控制

最新动态

产业快讯

叁观登记┃10/2-4能源周与净零永续展

不要错过2024台北国际电子展！

2024 TaipeiPLAS热烈徵展中

CTIMES / 文章 /

PC绘图内存技术架构与发展

GDDR3将3D应用推向极致

【作者： Christoph Bilger】2006年05月02日星期二

浏览人次：【6071】

桌面计算机和笔记本电脑中的3D rendering效益快速增加，其中内存带宽扮演着关键性的角色。过去五年来，高阶绘图系统的内存带宽每年以30％的速度成长。绘图内存系统的带宽远远超过PC主存储器的带宽。为能满足此种对带宽的高度需求，必需要定义出特定的绘图内存I/O标准。2005年，在绘图市场上，全新的GDDR3标准有了突破性的发展。

绘图内存之发展史

最早期的绘图内存和标准的通用DRAM有很大之差异性。这些早期的绘图内存包括了一些特别的功能，用来支持3D rendering和可视化过程的种种操作。一代一代下来之后，绘图内存逐渐整合成标准的通用DRAM。逻辑的处理部份完全被放在GPU中，而绘图内存则专门负责DRAM的核心功能。因此，使得绘图内存的带宽需求大为增加。

在90年代末期，标准的通用内存不再能够提供绘图处理器所需的带宽。内存变成系统的一个瓶颈，因此诞生了x32 GDDR内存。英飞凌（之前的西门子半导体）是第一家推出双倍数据传输率RAM的公司。该公司所提供的32Mbit DDR-SGRAM 是全球最快的绘图内存。在2001年，英飞凌又推出了后续的设计，一项128Mbit（4Mx32）的绘图DDR。

推出128Mbit GDDR之后，英飞凌制作了绘图内存的第一个BGA（Ball Grid Array）封装方式。一个BGA封装，和TSOP或TQFP封装相比较，具有两个内在优势，第一个是它的几何优势，和之前所使用的TQFP封装相比较，新的BGA封装在绘图卡上只需要占用一半的电路板空间。在笔记计算机绘图系统上，这个优势是非常理想也很成功的。BGA封装的第二个优势是它在所有讯号和地址在线大量的降低了电性寄生的状况。在增加数据传输率上，降低电性寄生是一项必需的条件。

在128Mbit GDDR方面，GDDR标准的时代已经过去了，因为它无法满足对带宽增加的需求。绘图产业需要一个新标准，一项更为先进与最优化的标准，以适用于更高的数据传输速度。而GDDR2是没有实际被应用的，此标准从来没有进入量产过。GDDR3则是替代GDDR的一项标准。

在2004年，256Mbit GDDR3产品正式出现在市场中，接着在2005年又再推出一个512Mbit GDDR3产品，其clock频率高达800MHz，又是采用最小的FBGA封装。

GDDR3绘图内存标准

GDDR3标准从通用的DDR2标准借用了许多的功能特性，并且将这些功能最优化以达到更高的数据传输速度和更低的功率消耗。

和GDDR相较，GDDR3的主要创新所在是在操作电压上，从2.5V降至1.8V，芯片上的讯号也有终端电路，不再像GDDR中没有终端设计的讯号线，还有一个动态控制的阻抗输出驱动器，一个4bit prefetch和一个单向单端式之数据strobe。所有这些功能都是更高数据传输率、改善的讯号完整性以及更低功率消耗所必需的。有了这些改变，GDDR3内存便能够比GDDR和DDR2标准达到更高的数据传输率。

在传送频率愈来愈高的状况下，讯号线必需在其端点加上电阻，以防止因反射造成在讯号在线的干扰，降低讯号的质量。在GDDR中，讯号线必需以外加的电阻达到终端连接，这些电阻都是被焊接在内存附近的印刷电路板上。在GDDR上外加终端电阻，可以稍微增加频率范围，不过，此种终端连接法无法支持在GDDR3中高达800MHz或甚至更高的频率范围所需要之讯号完整性。因此，GDDR3采用了芯片上之讯号终端方式，其终端电阻被整合入内存芯片当中。

另一项支持可靠的高速点对点传输之重要功能特性是采用阻抗的Vddq终端方式。GDDR3的I/O接口是一种虚构的开放drain逻辑，其总线的两端都有终端连接。其中的一端，接了一个动态控制的驱动器，具有40Ohm的阻抗，另一端的接收器则接了60Ohm的讯号线终端。

(表一)是GDDR和GDDR3以及DDR2标准的比较。

表一 GDDR和GDDR3以及DDR2标准的比较

	GDDR	GDDR3	DDR2
工作电压 Vdd/Vddq	2.5V	1.8V	1.8V
内存架构	x32	x32	（x4, x8） x16
Clock 频率	200～400MHz	500～800MHz	300～500MHz 在绘图上的应用
封装型式	TQFP和BGA	BGA	BGA
Prefetch	2	4	4
终端连接	没有终端连接	芯片上有终端连接	芯片上有终端连接
芯片上有终端连接	2、4和8	4和8	4和8
Data strobes	4和8	单端双向	单端单向差异式双向或单端单向

3D Rendering系统中的基本功能和工作负荷之分配

在一个交互式的3D游戏中进行画面的计算，可用一些基本的步骤来形容。第一步，3D的景象是由玩游戏的人下指令所产生的计算结果。3D景象是指所有对象在虚拟三度空间的安排和定位方式。这个部份的计算是由PC的CPU所进行的，之后CPU将3D景象交给GPU。GPU的工作是将3D景象转至一个二度空间的画面，可以在显示器上播放。这个部份的GPU工作称为3D rendering。此时必需考虑几个特效以达到画面的真实性，这些特效包括颜色、纹路、多重延伸式的灯光源、阴影、反射、透明性、光线之吸收、不透明材料等等。所有这些特效都需要强大的记算能力以及特别快速和宽广的内存接口，以能随机性的存取内存，而只需最少的等待时间。内存带宽和大小主要是由参数的值来驱动，必需将此值储存好并快速的取出使用，高度来回重复计算的中间结果亦必需储存起来。所有这些计算都是以实时的方式进行，每一秒钟超过40个图框。

整合式和独立式之绘图应用

一般来说，可以将各种绘图系统分成两大类别，一个是整合式绘图系统，另一个是独立式绘图系统。

在整合式绘图系统方面，绘图处理器是内建在PC芯片中，该芯片则是被焊接在笔记计算机或桌上计算机的主板上。这些整合式的系统使用PC的主存储器做储存及caching的动作，因此，在两方面会限制住3D rendering的效能。第一，内存的最大带宽会被限制在标准的主存储器带宽；第二，绘图系统必需同时和CPU以及其他在PC上使用内存的各个部份共同分用此带宽。采用Toms Hardware Page（www.tomshardware.com）进行的Benchmark测试很清楚的显示出整合式系统无法提供足够的rendering能力给高阶的3D游戏使用。

独立绘图系统包括一个独立工作的绘图处理器，加上一个专用的绘图内存，直接连接到独立的GPU。此类独立绘图系统经由标准的PCI-E（之前为AGP）总线连接至PC芯片组。此类独立式GPU的3D效能会远远超过整合式绘图处理器之效能，在内存带宽的需求亦是如此。这些Benchmarks显示出独立式绘图系统之效能超过整合式绘图系统效能之比例为3对20之比。在达到此卓越的效能上，内存I/O技术和记体带宽扮演主导的角色。

玩家级以及高阶绘图卡都使用特定的x32架构之绘图内存。此类系统目前都采用GDDR3内存，具有512MB之图框缓冲区，其clock频率为500至800MHz。此类架构可提供高达410Gbps内存带宽给GPU，是高阶PC主存储器的12倍。目前高阶笔记计算机绘图系统具备256MB图框缓冲区，采用的是500MHz GDDR3内存，提供给GPU的内存带宽是此类笔记计算机主存储器带宽的五倍。

主流式的绘图系统一般采用x16架构的内存组件。大部份新主流绘图系统都采用DDR2 I/O技术，其频率频率大约为400MHz。此类系统比整合式绘图系统的效能还是好很多。

整合式和独立式绘图系统之市场

根据Mercury Research，在PC系统中独立绘图方式所占的比例在过去几年有稍微的波动，大约为40％～45％。在3D操作系统方面，像是Windows Vista就被预期会增加一台一般性的PC在3D rendering效能方面的需求，因此，很可能会影响到采用独立式绘图系统的比例。在2005年，Mercury Research预测在独立式绘图系统方面，将有105mio之市场，而将会有160mio PC系统装置整合式绘图系统。其中，22mio之独立式绘图系统会被装入笔记本电脑，而83mio装入桌面计算机。

展望

未来对于内存带宽之需求持续增加，新的技术将持续改善画面质量，这是推动增加带宽需求的推手。即将到来的高画质显示将提高分辨率以及每一图框的画素。Rendering之技术，例如HDRR（High dynamic range rendering），是一个制作非常强的光源之光环效果的技术，会增加在每一画素计算上的复杂度。

除了PC绘图之外，还有其他现有的以及即将到来的绘图DRAM市场。所有新世代的主要游戏机都将使用绘图GDDR3内存。即将进入住宅客厅的媒体中心和媒体网关（gateways）将会具备重要的绘图功能，以及绘图内存。新的3D操作系统，例如Windows Vista，对3D rendering 效能之需求将扩展至每一台PC。（作者为Infineon英飞凌绘图DRAM营销经理）

延伸阅读

	1.0吋硬盘机的空间密度已达到1.8吋机种的水平，有效扩展此机种的市场版图至包括像高阶笔记本电脑的市场。（作者为Agere Systems杰尔系统储存部门资深技术经理）相关介绍请见「Polycom宣布，国际电信联盟（ITU）已批准Polycom Siren 14技术为14kHz超宽带音频编码新标准。同时将进入由ITU-T建议的G.722.1 Annex C标准的最后征求意见（Last Call）阶段。该技术现正以免版权费（royalty-free）方式提供授权，可提供接近CD音质的音频质量，不但声音更清晰，且减少了用户因视频会议所带来的听觉疲累。」一文。
	Siren14音频技术成国际标准你可在「iPod热卖持续发烧，台湾MP3芯片设计厂商亦期望能赶上这个风潮。目前来说，台湾投入MP3芯片的厂商包含凌阳、联阳、扬智与合邦等厂商。至于在2005年的表现，根据初步估计约不到5％的市场占有率，可见得台湾IC设计厂商仍旧有很大的发挥的空间，尤其是MP3芯片报价已被压到2美元以下。」一文中得到进一步的介绍。
	MP3芯片是台湾IC设计厂商可发挥的空间在「MP3芯片是台湾IC设计厂商可发挥的空间」一文为你做了相关的评析。

市场动态

	让PC成为家庭剧院相关介绍请见「瑞昱半导体（Realtek）发表新一代HD音效芯片ALC882。该新芯片具有高音质、多音源独立输出入技术、全新杜比高效能立体环绕音效功能等优势特点，在新一代数字家庭（Digital Home）的个人计算机平台应用上，将提供多声道、高音质音效的完整解决方案。」一文。
	瑞昱发表新一代HD音效芯片ALC882你可在「英特尔发表适用于计算机的新一代PC音频格式High Definition Audio（HAD）。HDA是产品代号名为Azalia的音频格式，现今版本为0.9。Intel计划公开其最终版本。同时，英特尔将于2004年上半年推出支持HDA的计算机专用chip set（芯片组）Grantsdale。」一文中得到进一步的介绍。
	Intel下一代音频格式HDA将出炉取代WMA？在「MP3数字音乐风潮方兴未艾，看好MP3、WMA（微软特有的音乐压缩格式）音效芯片市场扩增可期，多家IC设计业者纷纷投入开发工作，希望或多或少抢占一杯羹。」一文为你做了相关的评析。

‧	以雷达感测器大幅提高智慧家庭的能源效率
‧	为绿氢制造确保高效率且稳定的直流电流
‧	打通汽车电子系统即时运算的任督二脉
‧	运用软硬体整合成效保护网路设备安全
‧	IoT应用无缝连结 eSIM扮演关键

comments powered by Disqus

4和8

单端单向