随着AMD HD4800系列的正式发布,AFan们终于扬眉吐气了一回,被压抑了许久的怨气终于在这一刻迸发,从HD4850评测文章超高的人气足以见得民心所向!HD4850是追求性价比的产物,而刚刚上市的HD4870,则代表着RV770核心的真正实力,有了全新GDDR5显存助阵,HD4870的对手已经不再是NVIDIA上代的9800GTX(+)了,而是直接将矛头对准最新的GTX260。
● 800个流处理器!R600架构终于开花结果
从DX10时代开始,AMD就因R600核心架构问题和延期上市付出了惨重代价,导致HD2000系列高中低端全线产品处于被动局面,直到HD3000系列上市才稍微有些起色。但实际上RV670的架构相对于R600没有本质改进,只不过是通过先进的工艺降低了制造成本,提高了产品性价比,对于高端玩家来说,HD3800低下的执行效能和拙劣的AA性能显然是无法交待的。

而新一代的RV770核心则是卧薪尝胆之作,它将R600的超标量流处理器架构发挥到了极致——ATI只花费了43%额外的晶体管就将流处理器规模扩充了2.5倍!不仅如此,RV770的纹理单元、光栅单元、显存控制器都作了不小的改进,在上代显卡中所发现的问题都被及时修正。通过之前HD4850的评测就可以发现,G92核心最强者9800GTX已不是它的对手,NVIDIA引以为傲的抗锯齿效能在RV770面前简直不堪一击,很多专为N卡优化的TheWay游戏也被一一攻克……
● 避其锋芒以柔克刚!HD4800欲称霸1000-2000元价位
无论AFan还是NFan,都应该为HD4850/4870的上市而拍手叫好,因为在HD4850面市之前,同级别的9800GTX还要卖2000块以上,HD4850发布当天就迫使NVIDIA将其瞬间降价1000块;而HD4870的出现,则让刚刚摆上柜台的GTX260自降1000元,这种举措在历史上都是极为罕见的。看来一贯保持强势风格的NVIDIA开始感觉到了压力,那么GTX260能否扛住HD4870的攻势呢?
实际上,从HD3800系列开始,AMD的产品设计思路就发生了改变,将中端显卡作为研发的重中之重,然后通过双GPU打造高端产品。上一次的HD3800仅仅是探路之作,现在的HD4800在吸取了经验教训后,将性能价格比和性能功耗比放在了第一位,努力将晶体管数控制在了10亿之内,这样无论芯片成本还是显卡制造成本都要低很多,HD4850就是严格控制成本的产物,上市价格仅为1399元,为消费者提供了千元价位最高性价比的产品!
而NVIDIA则一如既往地通过暴力堆积晶体管的方式,打造出至高性能的旗舰显卡,然后再通过阉割的方式降低产品定位。完整规格的GTX280性能自然十分强大,但价格也是高高在上,阉割版的GTX260价格还不错,可是性能损失也不少。此消彼长之后,这就把9.56亿晶体管的HD4870与14亿晶体管的GTX260这两款看似不是同一重量级的产品放在了一起,那么作为挑战者的HD4870在性能上能否带来惊喜呢?
对于55nm工艺制造的RV770核心来说,HD4850默认625/1986MHz的频率其实是很低的,即便如此,HD4850已经击败了675/2200MHz的9800GTX,而且比起同为55nm频率高达740/2200MHz的9800GTX+都毫不逊色。看来800个流处理器的RV770核心的确拥有强大的实力,如果继续提升频率,性能还会有不小的提升空间。


HD4870正是代表了RV770核心的最高性能,ATI将默认频率提高到了750MHz,这与55nm的9800GTX+差不多,而显存方面则首次使用下一代的GDDR5颗粒,默认频率从3600MHz(这是等效频率,实际频率为900MHz)起跳,在显存位宽保持不变的情况下,单纯通过频率将带宽提高了近一倍,也就相当于1800MHz 512Bit的水平!
● HD4870显卡全部规格表:

仔细观察以上规格表就能发现以下几个重要问题:
同为55nm工艺,G92核心的晶体管数比RV770少,但是芯片面积反而更大!(原因参见架构解析部分)
虽然HD4870只有256Bit显存位宽,但有了GDDR5助阵,其显存带宽理论值比448Bit的GTX260还要高!
G92核心与GTX200核心的规格差距很大,但55nm的9800GTX+拥有非常高的流处理器频率,因此浮点运算能力已经能接近于GTX260了!
由此可见,虽然RV770与GTX200核心不是同一重量级的产品,但HD4870和GTX260两款显卡的规格却是不相上下,那么最终性能表现如何呢,今天我们就通过详尽的测试来展现给大家。
首先来详细分析下RV770的核心架构,它源自于R600,但青出于蓝而胜于蓝,
ATI对核心几乎所有的模块都进行了改进,而且规模和数量方面大大加强。HD4850/4870令人惊讶的性能表现就是源自于核心架构。
● RV770核心架构图:
基本上,RV770和RV670的整体结构是相同的,RV670身上所有的模块都得到了沿用,但很多模块都经过了重新设计或者优化设计:
1。SIMD阵列扩充为10组,每组SIMD绑定专属缓存及纹理单元;
2。纹理单元数量扩充为10组,寄存器容量增加;
3。继续提升几何着色的效率,适应未来DX10游戏的需要;
4。改进可编程镶嵌单元,使之更适合于动画游戏实时渲染;
5。改进显存控制器,率先支持GDDR5,并加入显存读写缓冲区,增强数据读写命中率。
● RV770核心规格全面翻倍:

翻倍的规格是最容易理解的,但数字部分往往比较抽象,下面就详细介绍各个模块的具体含义。
RV770核心最显著的特点就是将流处理器提升到了空前的800个,达到了RV670的2.5倍!实际上除了流处理器之外,纹理单元、光栅单元都得到了大幅增强。

RV670是4组SIMD,每组16个Shader,每个Shader 5个流处理器
RV770是10组SIMD,每组16个Shader,每个Shader 5个流处理器
在SIMD和Shader规模扩大的同时,Ultra-Threaded Dispatch Processor(超线程分配处理器)也变得更加复杂。由于每组SIMD所包括的Shader数量增多,阵列内的Arbiter(仲裁器)和Sequencer(定序器)数量同比增加至20个,因此扩充规模后的RV770单个Shader执行效率并不会下降。
● 纹理单元翻2.5倍:

RV770的纹理单元数量相比R600/RV670翻了2.5倍,从4组增加至10组,这样RV770总共就是40个纹理单元,Shader和TMU的比例达到了4:1。
每组纹理单元内部包含了4个纹理寻址单元(黄色,共40个),16个32位浮点纹理采样单元(橘黄色,共160个),和4个纹理过滤单元(深红色,共40个)。
● 光栅单元数量不变,规格翻倍:
RV770还是保持4组后处理单元,也就是通常所说的16个。但这次
AMD重新设计了光栅单元的内部结构,以改善R600/RV670那低下的AA效能。
R600/RV670每组后
处理器单元内部包括了8个Z/模版采样,而RV770将采样数量提高至16个,多重采样(MSAA)速度直接翻倍,
AMD声称RV770可以提供几乎免费的2xMSAA效能,并且4x/8xMSAA效能相比上代提升非常显著。
RV770的AA算法最终还是交给Shader部分来处理,好在RV770的流
处理器高达800个,多数情况下都处在性能过剩状态。2倍的Z/模版采样率再加上2.5倍的Shader规模,RV770的抗锯齿性能将会有一个质的飞跃,详细大家请参阅游戏测试部分。
[
本帖最后由 笑容 于 2008-7-18 18:40 编辑 ]