MCPLive > 杂志文章 > 板卡上的元器件逐个数(4) 显卡的核心

板卡上的元器件逐个数(4) 显卡的核心

2010-03-20Skyline《微型计算机》2010年2月下

GPU作为显卡的“心脏”,在显卡中扮演了很重要的角色,如同电脑里的CPU一样,GPU决定了显卡的档次和大部分性能,那它究竟是如何构成的?GPU是不是只负责图形处理?想要弄明白这GPU究竟为“何物”的朋友就接着往下看吧!

GPU是英文Graphic Processing Unit(图形处理器)的缩写,大家会发现它与中央处理器CPU仅有一字之差。如果从字面意思理解,中央处理器就好比中央政府,主管电脑中的大大小小事务;而GPU则是一个地方政府,专门负责与图形渲染相关的事情。换言之,大家在显示器上看到的各种画面,包括酷炫的Windows玻璃效果,漂亮的风景照以及美轮美奂的3D游戏场景,其实都是通过GPU计算而来的。和CPU一样,GPU也会按照性能的好坏分成三六九等,而且每隔一年到一年半的时间就会升级换代——从这个意义上来讲,GPU也是主机内部更新速度很快的硬件之一。

若论晶体管数量,CPU并不是老大?


GPU晶圆

大家知道GPU与CPU都是半导体工业的宠儿,往往集业界各种先进的技术于一身。新的AMD Radeon HD 5000系列使用40nm的生产工艺,仅次于Intel近才推出的32nm生产工艺。和我们在前面提及过的CPU生产工艺一样,更先进的生产技术代表着更低的功耗、更小的芯片面积以及更高的性能(包括频率、晶体管数量等等)。

对应显卡型号 Radeon HD 5870 Radeon HD 5850  Radeon HD 4870 GeForce GTX 285 
GPU代号  RV870  RV870  RV770  G200
生产工艺  40nm  40nm  55nm  55nm
着色器数量 1600 1440 800  240
纹理单元数量  80  72  40 80
核心频率 850MHz  725MHz  750MHz  648MHz 
DirectX版本 11  11  10.1  10

表1:目前常见顶级GPU规格列表

所谓不比不知道,一比吓一跳。AMD的Cpress核心(Radeon HD 5870)集成了21.5亿个晶体管,同时期强的Core i7 975 Extreme处理器内部才集成有7.31亿个晶体管,GPU内部的复杂程度可见一斑。

细心的朋友们会发现,示意图中GPU的晶圆上有很多对称的设计—这是因为在GPU内部,往往需要设计大容量的缓存单元,而那些规整的区域就是高速缓存;GPU内部还包含有很多同时运作的流处理器,以及其它一些运算和功能单元,这些单元在功能和晶体管布局上都是非常相似的,所以我们才会在晶圆上看到很多形状非常类似的“片区”。除了晶体管数量的多寡,芯片的封装面积也是影响成本的另一大因素。在晶圆横截面相同的情况下,单颗芯片所需要的面积越小,那么同样一片晶圆就可以切割出更多的芯片。

并行计算能力,CPU不是对手!

如果从更深层次的角度上来解析GPU与CPU,就可以发现二者执行工作的效率不尽相同,而且侧重点也有很大的差异。首先CPU负责的是各种各样、“长短”不一的应用任务,所以在指令集以及执行效率方面需要高度的灵活性;而GPU的工作特点则是,同时处理多个并发的任务,负载很重,但每个任务却相对简单和单一。

以Radeon HD 5870为例,其核心代号为RV870,内部拥有1600个着色器和80个纹理单元,庞大的硬件规格能让其在一秒钟内执行2.72TFLOPs的指令处理任务(理论值),而在一年前的Radeon HD 4870处理器仅能够执行1.2TFLOPs。GPU在计算能力方面的优势不仅让它在图形渲染方面游刃有余,同时也为其开发了很多新的应用渠道。比方说现在我国计算能力强的天河一号超巨型计算机,就是使用若干片Radeon HD 4870X2所搭建而成的。

PS:如何查看你的GPU信息


GPU-Z的监测信息

在正确安装了显卡驱动程序之后,点击我的电脑(或者是“计算机”)→右键→属性→设备管理器→显示适配器,大家就可以看到当前计算机的GPU是哪一个型号的。当然上面方法比较粗糙,如果你想了解更多关于GPU的信息,可以使用GPU-Z这款软件,打开网页www.techpowerup.com/gpuz/之后下载GPU-Z的安装文件或者压缩包,运行GPU-Z.exe就可以看到GPU的详细信息。例如GPU芯片的型号、版本步进、工作频率、接口规格、显存容量与位宽等等。GPU-Z能够帮助大家更好的了解图形处理器的详细信息,需要注意的是,Intel、AMD与NVIDIA不时会有新产品发布,而GPU-Z的信息也需要一个更新过程,所以当你的显卡核心不能够被软件正常识别,到上述网站去下载新版本的GPU-Z软件即可。

多卡互联:你不是一个人在战斗


更高阶的游戏应用催生了双卡乃至多卡互联技术

尽管现在单颗GPU的运算能力已经非常强了,但对于很多极限玩家而言仍然不够用。例如在一些大型3D游戏中,我们将画面调节到1920×1080甚至更高的分辨率,开启高倍抗锯齿功能之后,即便是顶级显卡也不一定能够独力承担下来。

俗话讲“一个好汉两个帮”,当一个GPU顶不住的时候,还可以为它找到志同道合的伙伴来帮忙。NVIDIA的多路显卡技术叫做SLI,而AMD的多路显卡互联技术叫做CrossFire。目前二者的驱动程序多可以支持4个GPU核心参与运算,但具体到主板端,支持NVIDIA SLI技术的主板可以使用3块显卡(3×1模式),或者使用两块双“芯”显卡组成Quad SLI(2×2模式),但是不能支持4×1模式;AMD的CrossFire组件方式更加灵活,可以是4×1模式,也可以是2×2模式。一般来讲双路SLI和CrossFire并不能达到,两倍于单卡的效果,而是要乘以一个系数,如1.8倍或者1.6倍;多卡互联的情况也是类似的,随着显卡数量的增加,性能的增加并不与成本的增加值成比例。

并不安于现状的GPU

上面我们说到,GPU除了能用作图形渲染任务之外,还有余力去做一些其它用途。套用《蜘蛛侠》里的一句话:“能力越大,责任也就越大”,GPU并不满足于现状,于是便打起了从CPU、声卡哪里分得更多“蛋糕”的主意。

说起这段故事,还得追溯到NVIDIA GeForce 8800 GTX年代,那时候NVIDIA发布了一个名为“CUDA”的程序开发包。简单来讲,就是利用CUDA这个平台,让更多以前需要CPU来处理的任务,包办给GPU去运算。随着开发进程的加速,支持CUDA的应用越来越多,软件也逐渐丰富起来,其中对于PC用户来讲主要的两个用途就是压缩文件和CUDA解码高清视频的应用。CUDA发布后,AMD方面也发布了Stream通用加速技术,究其原理与CUDA非常相似,但二者之间没有办法融会贯通。为了解决两者通用的问题,2009年初,不少IT巨头牵线组成了OpenCL通用计算联盟,共同致力于推动CPU、GPU、DSP(数码设备的专用处理器)以及其它一些专用设备的通用化进程。

除此之外,GPU也在扮演一些其它的角色,例如在搭配了HDMI接口之后,GPU甚至能够对高清视频中所包含的声音信号进行处理,而这在以前是音效芯片的专利,现在GPU的用途正在进一步扩大。

分享到:

用户评论

共有评论(1)

用户名:

密码: