Hi!请登陆

Radeon RX 6800 XT / 6800天梯榜首发评测: AMD完美突破

2020-11-19 43 11/19

NVIDIA的RTX 30系列显卡已经在今年9月份正式发布了,作为GPU市场弱势的一方,AMD当时在高端市场并没有什么新产品进行应对。不过千呼万唤始出来,A粉们的耐心等待得到了回报。在“RDNA 1”架构显卡上小试牛刀,大幅度提升能耗比略有成果之后,AMD在10月份正式发布了基于“RDNA 2”架构的RX 6000系列显卡,在发布会上我们看到新架构的表现比很多人的预期要好得多,在RDNA
1架构的基础上继续大幅度提升了能耗比与性能,核心面积也从之前的小核心变成了大核心,在诸多方面都有着显著的提升,这次AMD来真的了。

同时,我们也准备了视频版的评测,欢迎前往观看。

RDNA 2架构解析:更快频率、更高能耗比、更强性能

RDNA 2架构三大改进点:

· 高频率设计:RDNA 2架构相比RDNA 1架构实现了同功耗下30%的MAX频率提升;

· 无限缓存设计:可以消除带宽瓶颈,极大的提升了等效带宽并降低功耗,有助于提升能耗比;

· 支持DX12U、DS API:紧随时代潮流,让A卡支持光追等高级API特性。

RDNA 2架构是一个强大的游戏架构,它这次相比RDNA 1代架构主要有三个大改进。首先AMD在RDNA 2上实现了突破性的高频率设计,在拥有高频率的同时维持较好的能耗表现。其次AMD专门为RDNA 2研发了革命性的AMD Infinity Cache无限缓存技术,多达128MB的无限缓存在提供非常可观的等效带宽的同时还更节能,能耗表现更上一层楼。第三个改进点就是支持了DX12
Ultimate的高级特性,包括DXR、DirectStorage等API,让AMD的显卡也加入到支持DX12 Ultimate的大家族中。

改进1:唯快不破,RDNA 2架构主打高频设计

我们先来看频率改进,RDNA 2实现了突破性的高频率设计,虽然与RDNA都是相同的7nm制程工艺但是进步巨大。通过这张图表我们可以看到,以每个计算单元CU为例RDNA 2架构实现了相同功耗30%的频率提升,而如果是相同的频率则功耗只有RDNA的一半还少一些,也就是能耗比提升50%以上。

注意图片,此时的能耗比计算频率被定在了RX 5700 XT的公版Boost频率,也就是1905MHz左右,这也是上一代公版显卡的峰值频率,RDNA 2在这个频率下功耗大大降低,因此在功耗可控的范围内,借助能耗比的提升AMD在RDNA 2上有信心提高显卡的核心频率上限,突破2GHz自然也是水到渠成了。

改进2:消除带宽瓶颈,引入“Infinity Cache”技术

RDNA 2的成功源自于RDNA 1的研发经验,在RDNA 1代架构上AMD在两组CU单元组成的Dual Compute Unit中添加了L0级缓存,全新设计的L1缓存及减少拥塞的4MB共享L2缓存,让RDNA架构提升了缓存带宽、减少了缓存的延迟及功耗。最终通过256-bit位宽14Gb/s显存速率的GDDR6显存达到了448GB/S的显卡带宽,看起来还是很不错的。

但后来AMD发现这种设计有一个致命的缺点,那就是L2缓存在游戏中命中率很低,这也导致RX 5000系列显卡的性能表现没能发挥到极致。AMD GPU研发团队看到了这一点并着手改进,针对缓存进行调整,他们同时还要完成一个挑战,那就是在翻倍CU单元、提高核心频率的同时解决掉带宽紧缺的问题。

那么这个挑战如何解决呢?AMD给出了自己的解决方案——“Infinity Cache”中文译名“无限缓存”,还记得"ZEN"架构中的“Infinity Fabric”总线吗?AMD特别喜欢“Infinity”无限这个单词,这次既然缓存不够用、命中率也低,那我直接搞一个大缓存也就是所谓的“无限缓存”不就完了吗?

咳咳,说回正题,这项技术的实现多亏了CPU部门的研发经验,AMD解决思路其实就是把原本用于EPYC霄龙服务器处理器上的高密度SRAM专门为GPU加以优化, 并且为其加上AMD在Zen架构上大获成功的“Infinity Fabric”无限总线, 两者合二为一就成为了“Infinity Cache”无限缓存这个新一代带宽利器。

“无限缓存”技术的使用最终给RDNA 2架构带来了丰厚的收益,首先是在带宽方面,256-bit的GDDR6显存配合128MB的无限缓存相比于传统的384-bit GDDR6显存可以实现2.17倍的等效带宽,同时功耗仅为对方的90%,这样的表现是值得称赞的。高等效带宽的加入也显著的提升了游戏性能,并降低了大约34%显存延迟,提升了缓存的命中率,让RDNA 1架构在缓存上的缺陷得以解决。

OK,让我们把之前的优化都放到一起,就能看到RDNA 2通过“无限缓存”大带宽,低功耗的帮助实现了IPC的提升、同时提高工作频率,完成每个时钟指令的功耗也下降明显。最后把三项提升综合到一起,就可以让RDNA 2架构在RDNA 1架构的基础上能耗比继续大幅度提升,多达54%。

改进3:紧随时代潮流,全面支持DX12U、DS API

我们再来看RDNA 2架构上第三个改进点,支持更多的高级特性。AMD在RDNA 2上终于全面支持了DirectX 12 Ultimate、DirectStorage API等高级特性,让A卡也可以使用诸如DirectX光线追踪、可变速率着色、网格着色器、采样器反馈等技术。

· 光线加速器 Ray Accelerator

实时光线追踪是一个能让游戏画面更真实、提高玩家沉浸感的重要技术。它的优点相信大家都知道,这里不再赘述。实时光线追踪最大的缺点就是对显卡的计算能力要求极高,传统的CU单元运行实时光线追踪的效率非常低,为了让实时光线追踪的画面更为流畅,AMD在RDNA 2架构的每一个CU计算单元里都放入了一个"Ray Accelerator"光线加速器, 由此可推断CU计算单元越多,RDNA
2架构显卡的实时光线追踪性能就越强大。

"Ray Accelerator"光线加速器是用于处理光线相交计算的专用硬件。与软件方案相比,其相交计算性能可提高10倍。AMD还提到实时光线追踪性能也可以吃到“无限缓存”带来的增益,并且由于RDNA 2覆盖市场的全面性,PC与主机都能享受到实时光线追踪的技术。

· 可变速率着色 Variable Rate Shading

可变速率着色(Variable Rate Shading)是DirectX 12 Ultimate的加速着色特性。简单来说,VRS的原理是通过改变单次像素着色器操作所处理的像素数量,来改变屏幕不同区域的着色质量。简单来说,它可以改变同个画面中不同部分的渲染精细度,它的用处是提高画面帧数。

在不开启VRS的情况,也就是正常情况下,一帧画面的所有像素都是独立着色的;而开启VRS之后,原本独立的像素被分成了一个个像素块,它们会共享着色结果,此时GPU会根据程序员设定的重要性分级为所有像素块分配不同的着色精细度。拿上面的图片为例,车辆和远景部分的像素仍然是独立着色的,但快速变动的道路和路边的像素块就是区块共同着色的,此时由于显卡的计算资源得到了节约,所以游戏的帧数会有所提高。此前的RDNA
1代架构不支持这项技术,但在RDNA 2架构上,AMD加入了VRS可变速率着色的支持。

· 网格着色器 Mesh Shaders

在过去的二十年中,传统的几何图形处理管线已经增加了好几个阶段了,不过它的核心理念仍然基于传统的光栅化预着色方法的,放在今天已经过于复杂,并且拖累处理效率。硬件和软件开发者都希望改变这一现状,于是,DirectX 12 Ultimate引入了Mesh着色器,它为开发者提供了前所未有的可编程能力。

原本的管线中,GPU硬件的并行能力被隐藏,或者说是被自动化了,硬件会帮助打包操作然后并行执行它,这很高效,但也存在问题——灵活性不够。Mesh着色器就完全改变了这一过程,它不再是针对单一顶点或图元的单一函数,而是工作在整个计算线程组中。在某一阶段中,Mesh着色器的每个线程都是针对一个顶点,而在另外一个阶段,每个线程针对着一个图元。整个线程组的内存是共享的,访问灵活度很高,同时开发人员对硬件的控制权也更大,甚至还能启发新的技术,节约内存使用量和内存带宽。

由于现在游戏场景很复杂、规模也很宏大,如果用原本的方式生成三角形,会消耗太多的CPU draw call,而Mesh Shaders引入了一种更灵活的模型,可以让开发人员能够规避CPU性能瓶颈并使用更高效的算法来生成三角形,本质上就是Mesh Shader生成三角形给光栅器,不用CPU慢慢跑三角形。补全之前的遗憾,AMD的RDNA 2架构显卡正式支持了网格着色器 Mesh
Shaders这项技术。

· 采样器反馈 Sampler Feedback

采样器反馈 Sampler Feedback是允许游戏引擎去跟踪纹理采样器的使用方式,让后者向引擎提供反馈,方法是生成“反馈图(Feedback Map)”,它会记录不同纹理区域的不同驻留等级,然后程序可以根据这些反馈信息来做决策——包括该如何使用纹理采样器和要在显存中保留哪些资源等。这比原先的流程更为精确,可以更好地分配计算资源。简单来说它的实际效果就是用更少的显存渲染更大、更详细的纹理。

另外,采样器反馈还允许了一项新技术——纹理空间着色。它可以在不栅格化对象的情况下进行对象着色,其中心目的就是缓存和重用着色结果,减少GPU的计算量。采样器反馈的使用可以让游戏拥有更好的视觉质量、更短的加载时间和更少的卡顿。它的核心思想实际上就是让程序只加载必要的纹理,把资源交给更有需要的地方。

Adrenalin新驱动解析

AMD这次在驱动软件层面继续给玩家们带来新的功能,其中一些功能在RX 5700系列显卡上已经展示过但并没有大规模使用,AMD承诺他们将与游戏厂商继续深度合作,把Adrenalin驱动中的“好功能”带给更多的玩家。考虑到一些同学对之前的A卡特性不是特别熟悉,在讲解完新功能之后还会对老功能回顾一下。

· Radeon Rage Mode:狂暴模式一键提升性能

AMD这次提供了三种超频选项供玩家选择,驱动自动超频与手动超频是之前就拥有的,AMD专门为RX 6800 XT与RX 6900XT提供了一个“Rage Mode”狂暴模式,用户仅需在驱动软件中轻轻点击即可进入“狂暴模式”,在该模式下你的显卡会被提高最多6%的TGP功耗上限,从而提升性能,并且也无需担心显卡的安全问题,该模式并不影响显卡保修,关于狂暴模式的性能提升我们下面的性能测试中会提到。

自动超频模式则是显卡自动进行小幅度的频率提升,但是可能会因为芯片体质的差异造成黑屏掉驱动的问题,是一个老的超频方案,相比起“狂暴模式”来说稳定性稍微低一些。而对于“高玩老司机来说”,手动模式依旧是最值得信赖的模式,你可以非常精确的调整非常多的显卡参数,根据自己显卡的芯片体质进行摸索,挖掘出显卡的最大潜能。

· AMD Smart Access Memory:智能寻址显存技术

AMD是目前唯一一家能同时提供顶级CPU与GPU的厂商,多年以来A粉一直期盼着CPU、GPU两个领域能进行“联动”,3A平台神秘加成的故事一直在流传但从未实现过。现在,未来已来,AMD在发布会上隆重介绍了AMD Smart Access Memory智能寻址显存技术,这是AMD借助PCIe4.0的高速带宽实现的一项新技术。

在传统基于Windows的PC系统中,CPU处理器一次只能同时访问GPU的一部分显存(VRAM)并非整个显存,这限制了性能的发挥。PCIExpress技术的Base Address
Register基址寄存器可以定义映射多少个离散的GPU内存空间,一般来说,处理器只能访问显存的一小部分,通常仅限于256MB大小的映射内存,这个大小放在今天是远远不够用的,由于数据传输效率较低,CPU与GPU的性能并没有完全发挥出来。

现在AMD Smart Access Memory技术可以凭借PCIe4.0的高速带宽扩展数据通道,一次访问所有的内存,大大提升了数据传输效率,消除了之前的传输瓶颈以提升性能。AMD提早布局CPU、主板芯片组、显卡的PCIe4.0支持终于收到了成效。

这项技术的使用是有一定要求的,首先你需要一个AMD Ryzen 5000系列的处理器,其次一块AMD Radeon RX 6000系列显卡也是必不可少的,最后是一块芯片组为X570/B550的主板。这项功能在显卡发售时,主板厂商就会更新一版可以支持AMD Smart Access Memory 的BIOS,只需要在BIOS中开启即可享受到平均6%的性能提升,算是这次AMD RDNA
2架构显卡一个锦上添花的好技术,我们在下面的实际测试中也会针对性的看看AMD Smart Access Memory在游戏中能带来多少帧数提升。

· FidelityFX:开源工具包,提供多种游戏优化技术

大型游戏开发通常是一项大工程,需要在一定的时间内程序、美术、等人员多方面的通力合作,因此在整个开发周期中难免会存在一些问题。此外各家游戏厂商使用的游戏引擎不同,开发人员对游戏引擎的熟练度也不同,游戏的帧数优化也是很让人头疼的。为了更好的画面表现,GPU开发商会与游戏厂商进行合作,为游戏进行专属优化,增强游戏画面表现。不过这项工作通常比较繁琐,需要花费很多精力。

AMD为了帮助开发者提升游戏画面保真度,推出了FidelityFX SDK(软件开发程序包),帮助开发者提高游戏画质,AMD FidelityFX 是基于RDNA架构优化的解决方案,可供开发人员在游戏中部署。 FidelityFX让游戏开发者能够以超低的系统性能开销实现卓越的视觉质量,释放更多显卡资源帮助玩家畅玩游戏。

需要说明的是FidelityFX本身是一个开源工具包,自己并不是某一种技术,而是一个总称。FidelityFX
里面有很多技术,打个比喻就是AMD盖了一个叫“FidelityFX”的“少林寺”,少林寺里面有很多独门武功,AMD现在免费邀请进寺庙学武的游戏开发商学习,多种武艺任游戏开发者挑选,可以学习其中一种,也可以都学,AMD表示他们正在增加并优化FidelityFX的功能,让开发者可以轻松的实现各种游戏画面优化技术。

在RX 5700系列显卡发布的时候,AMD发布了FidelityFX中的一种功能——高对比度自适应锐化功能(Contrast Adaptive Sharpening,CAS),可以让原本由于抗锯齿技术导致的模糊画面更加锐利、对比度更高。同时自适应锐化功能还支持在动态分辨率的情况下使用。AMD称这项技术是由FXAA抗锯齿开发者开发的,可以轻易集成并且支持任何GPU。

这项技术的使用效果还是非常明显的,我们看到上方F1赛车的轮胎以及赛道细节,明显开启了CAS技术后的画面更锐利,诸如《F1》《古墓丽影:暗影》《无主之地3》等游戏其实已经加入了CAS技术的支持。除了CAS之外,AMD
FidelityFX目前还拥有屏幕空间反射技术(SSSR)、自适应环境光遮蔽(CACAO)、HDR贴图技术(LPM)、单通采样器技术(SPD)等5种开源画面优化技术供游戏开发者使用。

此外,为了缓解实时光线追踪技术带来的帧数下降,竞争对手利用AI张量单元推出了深度学习超采样抗锯齿技术作为一种缓解策略,而AMD也不想落入下风,他们正在紧锣密鼓的与游戏开发人员进行合作研发一种名叫“FidelityFX Super Resolution”的技术,只不过现在没有任何细节透漏出来,我们也只能期待一下后面的驱动更新了。

· Radeon Anti-Lag:优化调度,减少输入延迟

在我们玩游戏时,我们点击键鼠或手柄时向电脑输入操作指令,而电脑根据我们发送的指令来渲染游戏画面。从我们点击鼠标/键盘/手柄到显示画面的时间成为“输入延迟”。对于一些玩家尤其是电竞选手对降低输入延迟有着极高需求。

具体来说,显卡完成画面渲染需要CPU调用,CPU向显卡发送指令渲染游戏画面。所以在这种情况下,优化CPU调用效率、提高GPU负载就成为解决如数延迟的关键。而这也可以通过软件的指令调度优化。显卡与CPU之间的软件媒介是驱动,通过驱动对CPU指令调度GPU渲染进行优化,可以降低输入延迟,响应更快,提升体验。AMD Radeon
Anti-Lag技术最大的特点是你只需要一块AMD显卡就能使用,相比竞争对手的降低输入延迟技术要显示器鼠标显卡都要进行认证来说,它的使用门槛更低,关于它的效果我们之后有时间会单独进行测试。

· Radeon Boost:动态调整分辨率,智能提升帧数

在推出Radeon Anti-Lag之后,为了照顾一些显卡性能较差的老用户,AMD又推出了Radeon Boost技术,这项技术其实没什么特别的,简单说就是当年静止不动时画面会渲染原生的分辨率,当画面出现剧烈变化时,Radeon Boost就会开始工作,自动降低游戏的渲染分辨率,由于人眼对高速移动的模糊物体不是特别敏感,所以这个技术在一定程度上能“欺骗”你的大脑。

由于渲染分辨率降低,因此帧数在画面剧烈变化会有一定提升,只不过这毕竟是低分辨率渲染,画面表现其实是比较差的,所以除非是显卡性能是真的不够用,一般情况下不推荐大家开启这个功能。即便是开启也要找那些针对Radeon Boost深度优化的游戏,比如《无主之地3》,美漫风格的画面降低一些分辨率渲染效果还算是能让人接受,这个时候Radeon Boost还是有一定价值的。

· Radeon Imaging Sharpening:更通用的锐化技术

AMD Radeon Imagining Sharpening(RIS)是一个经常被大家忽略的功能,事实上它可以通过算法对玩家的游戏画面进行锐化,在一些老游戏或者贴图质量相对模糊的游戏中的表现非常令人印象深刻,在诸如《地下城与勇士》《命运2》等游戏中开启RIS都会让原本比较模糊的画面更加清晰,视觉效果提升明显。

早前多年前为了消除画面中的锯齿,从硬件开发商到游戏厂商都在想方设法解决这个问题,于是推出了如TAA、FXAA等抗锯齿技术。虽然这些技术让画面边缘更加平滑,但也不可避免的导致了边缘模糊。玩家现在已经可以通过更高的分辨率获得锐利的画面,只不过不是所有人的显卡都能在高分辨率下保持高帧率,为了缓解玩家们的“尴尬”,AMD适时的推出了Radeon Imaging Sharpening锐化技术。

AMD在2019版的Adrenalin驱动中添加了Radeon Imaging Sharpening功能,通过这个功能锐化画面、恢复游戏清晰度。而且AMD让这项技术更具普适性,在首发时即可在DirectX 9、DirectX
12以及Vulkan图形API中使用,同时基于AMD的算法,RIS技术几乎可与所有抗锯齿技术同时开启,在保证效果的同时不会产生过度锐化产生的振铃效应。到了2020年,之前不能开启RIS的DirectX 11游戏也得到了支持,这让RIS技术大大提升了实用性,毕竟很多老游戏只有DX 11模式,他们的画面表现可以通过RIS技术再上一层楼,因此RIS是一个足够低调但也足够实用的技术。

· Radeon Chill:智能动态调节功耗

显卡在渲染画面时几乎一直处于高负载运行,即使是在画面静止时显卡也一直以高帧率渲染画面,这浪费了很多电能。所以AMD在软件层面添加了Radeon Chill功能,在画面静止时以低帧率渲染画面,当驱动监测到画面变化后,会迅速调用GPU重新以高帧率渲染画面,实现了流畅游戏与节能之间的平衡。

这个技术我自己使用过很多次,你可以自己设定Chill时的最低帧与最高帧,当过场动画、菜单、或者你临时有事没有移动画面的时候,Radeon Chill就开始工作降低到你预设的帧数,从而降低功耗。此外,由于你还设置了一个最高帧数,这种办法也可以用来限制游戏帧数上限,从而节约功耗降低显卡发热。最后无论玩家的显示器是否支持FreeSync技术,Radeon
Chill功能都会显示器刷新率自动设置帧率目标,保证画面流畅顺滑。

Radeon RX 6800 XT/6800规格介绍

下面是Radeon RX 6800 XT/6800两张新显卡与Radeon RX 5700 XT/5700的规格对比表:

我们看到今年的两张RDNA 2架构新显卡与之前的RDNA 1架构显卡一样,都是采用了TSMC的7nm制程工艺,只不过核心面积则是从251平方毫米增加到了519平方毫米,足足翻了一倍。与此对应的晶体管数量也从RDNA 1代的103亿暴增到268亿,数量翻了一倍多,这样计算下来AMD的RDNA 2架构的晶体管密度是有提升的。

在RDNA 2架构上AMD继续沿用了CU计算单元,每个CU计算单元内拥有64个流处理器。之前GCN时期CU单元的数量由于功耗问题始终无法突破64组,但在RDNA 2架构大幅度提升能耗比的情况下,AMD终于可以突破这个限制了,在RX 6800 XT上AMD拥有72组CU计算单元,4608个流处理器,而RX 6800也拥有60组CU计算单元,3840个流处理器。相比之下一代RDNA
1架构的CU数量就是“小巫见大巫”了,最高规格的RX 5700 XT也不过40组CU计算单元,2560个流处理器而已,因此在硬件规格层面,RDNA 2架构显卡提升巨大。

实时光线追踪对计算单元压力极大,为了缓解这种压力,AMD为RDNA 2架构引入了专门的硬件加速单元“Ray Accelerator光线加速器”。在RDNA 2中每一个CU计算单元内部都具备一个RA光线加速器单元,因此RX 6800 XT具备72个RA单元,RX 6800具备60个RA单元,RDNA 2架构中CU计算单元的数量越多,RA单元也就越多,实时光线追踪性能也就越强大。而RDNA
1架构则不具备RA单元。AMD这次还提升了负责抗锯齿与传统光栅能力的ROP单元与纹理单元,其中RX 6800 XT具备128个光栅单元,288个纹理单元;RX 6800具备96个光栅单元,240个纹理单元。这些单元的数量提升相比上一代显卡都很大,可以极大的加强RDNA 2架构显卡的传统光栅能力以及抗锯齿性能。

在频率上RDNA 1代架构引入了游戏频率这个概念,这个指标的含义就是指显卡在重度负载游戏下的最低工作频率,也就是游戏时频率的“低保线”。而根据之前RX 5700系列显卡的经验来看,RDNA 1代架构玩游戏时的频率是远高于游戏频率的,甚至是可以超过Boost频率。在频率方面,RDNA 2架构显卡进步明显,RX 6800
XT基础频率为1825MHz,游戏频率2015MHz,Boost加速频率达到了2250MHz!这个数字在之前的RDNA 1代显卡上如果想要出现是非常困难的,RDNA 2在频率上的突破会成为它能大放光彩的重要基础。而定位稍低一些的RX 6800表现也不错,虽然基础频率与游戏频率都是1815MHz,但是Boost频率达到了2105MHz,也是突破了2GHz的大关,这个时候上一代的RX 5700
XT 1905MHz的Boost频率就有点不够看了,RDNA 2在频率上的提升不可谓不大。

频率的提升反映到了单精度浮点性能上,这个参数在一定程度上可以反映显卡的游戏性能,与竞争对手直接翻倍FP单元造成的单精度浮点性能“虚高”不同,AMD这边是实打实的单精度浮点性能。在RX 5700 XT上单精度浮点性能为9.75TFLOPS,还不到10TFLOPS,而RX 6800 XT的单精度浮点性能直接达到了20.74TFLOPS,翻了一倍还要多!而RX
6800也有16.17TFLOPS的单精度浮点性能,这些数字都可以间接说明RDNA 2的游戏性能是多么强大。

显存方面,RDNA 2架构依旧采用GDDR6显存,只不过容量翻倍到16G,显存速率也从14Gb/s升级到16Gb/s,显卡的带宽也从448GB/s提升到了512GB/s,提升并不大。为了缓解带宽不足的问题,RDNA 2架构显卡引入了“AMD Infinity Cache”,RX 6800 XT/6800均配备128MB大小的“Infinity Cache”。

最后是功耗方面,由于规格的大幅增加,功耗相比之前有所提升。RX 6800 XT的TGP功耗为300W,RX 6800的TGP功耗为250W,且两者均采用双8PIN标准供电接口。建议零售价RX 6800 XT为5099元人民币,RX 6800为4599元人民币,两者差距仅为500元。

Radeon RX 6800 XT/6800公版显卡外观

两张新A卡的外观设计语言趋于一致,都放弃了之前的涡轮散热方案,改用开放式的三风扇散热,这种设计最大的好处就是提高散热效果,同时更为静音。正面有亮银色、灰色两种颜色进行搭配,两张显卡实际的观感比图片中还要高级不少,3个带有“R”标志的80mm风扇周围的边框会随着光线转变的角度折射光芒。

RX 6800公版显卡

RX 6800 XT公版显卡

虽然设计语言十分相像,但两张显卡还是有区别的,图中左侧的就是RX 6800它中间风扇的周围并没有任何额外设计,而右边的RX 6800 XT中央风扇的周围有一个“X”字样的贴片设计,宣示着自己属于“XT”系列显卡。

在背板的设计上两张卡都是一样的,中间大面积的银白色配合上下两条灰色的条状设计,有一种当年VEGA 64 LC的味道,不过实话实说VEGA 64 LC的颜值可能是历史上公版显卡的巅峰了,其他显卡很难超越。

我们再把镜头转向侧面,两张卡如出一辙,只不过“Radeon”的信仰LOGO颜色并不相同,不过别担心,上机之后都会变成红色的。

值得一提的是,AMD在公版显卡的供电设计上并没有跟随竞争对手的激进设计策略,而是继续使用了常见的标准双8PIN供电,并且供电的位置位于显卡最右侧,没有放在中间,这对机箱的理线美观度会有一定的帮助。

在接口方面,两张显卡都是一样的,均配备了一个HDMI2.1接口、两个DisplayPort1.4接口和一个USB Type-C接口。其中前两种接口比较常见,这里就不赘述了,USB Type-C接口是一个非常方便的接口,它可以做到“一线通”,即一根线同时完成显示器的供电与信号传输,非常的实用,它甚至还可以给你的手机充电,让这个地球真正“环保”。

顺带一提,AMD这次还提升了显卡的视频输出以及解码编码能力。RDNA 2架构显卡支持VP9格式的4K 90帧、8K 24帧解码;H.264格式的1080P 600帧、4K 150帧的解码,1080P 360帧、4K 90帧的编码;支持H.265格式1080P 360帧、4K 90帧、8K 24帧的解码,1080P 360帧、4K 60帧的编码;以及AV1格式的8K 30帧解码能力。

在尺寸方面,两张显卡的长度完全一致,RX 6800 XT与RX 6800两者的长度均为267mm,高度均为120mm。厚度上RX 6800 XT为2.5槽设计,RX 6800则为双槽设计,这两张显卡的尺寸可以兼容绝大多数机箱,AMD也在官网表示这是有意为之,他们希望自己的公版显卡可以更轻松的安装在更多人的机箱中。

显卡拆解

RX 6800 XT公版显卡拆解

RX 6800 XT公版 PCB正面

RX 6800 XT公版显卡用料非常扎实,标准的双8PIN供电位于PCB右侧,显卡共计15相供电。6相供电位于PCB左侧,9相供电位于PCB右侧。

RX 6800 XT公版 PCB背面

RX 6800 XT公版核心背面的陶瓷电容

RX 6800 XT公版采用了8颗2GB容量的GDDR6显存,总容量16GB,显卡位宽256-bit、显存速率16Gbps,显卡带宽512GB/s,显存制造商为三星。

RX 6800 XT公版的供电MosFET来自英飞凌,型号为TDA21472,单个最大电流为70A。

RX 6800 XT公版的供电PWM共有三颗芯片,分别是IR35217、英飞凌的XDPE132G5D、CYPD5137-40LQXI,正面一颗,背面两颗。

RX 6800 XT公版采用真空腔均热板进行散热,这相比铜管散热更为高效,在显存、供电MosFET上均配备导热贴,方便散热器快速的带走这些关键零部件的热量。此外核心散热并没有采用硅脂,而是与RX 5700系列公版一样的石墨烯散热片方案,理论上这种设计的热传导效率会更好一些。

RX 6800 XT公版背板

RX 6800公版显卡拆解

RX 6800公版 PCB正面

RX 6800公版显卡用料也非常扎实,在长度上与之前的RX 6800 XT公版PCB保持一致,同样的标准双8PIN供电,显卡共计15相供电。6相供电位于PCB左侧,9相供电位于PCB右侧。

RX 6800公版 PCB背面

RX 6800公版核心背面的陶瓷电容

RX 6800公版同样采用了8颗2GB容量的GDDR6显存,总容量16GB,显卡位宽256-bit、显存速率16Gbps,显卡带宽512GB/s,显存制造商为三星。

RX 6800公版显卡的供电MosFET型号为5470QE,这款MosFET的具体信息在网上还没有查到。

RX 6800公版的供电PWM共有三颗芯片,并且与RX 6800 XT完全相同,分别是IR35217、英飞凌的XDPE132G5D、CYPD5137-40LQXI,正面一颗,背面两颗。

RX 6800 XT公版散热同样采用了真空腔均热板散热器,只不过厚度比RX 6800 XT要小一些,在显存、供电MosFET上同样具备导热贴,方便散热器快速的带走这些关键零部件的热量。此外核心散热并没有采用硅脂,而是与RX 5700系列公版一样的石墨烯散热片方案,理论上这种设计的热传导效率会更好一些。

RX 6800公版显卡背板

测试平台与说明

AMD最新发布的5000系列处理器在游戏方面有重大提升,并且原生支持PCIe4.0以及AMD Smart Memory功能,因此我们今天选择的CPU是AMD Ryzen 7 5800X处理器。显卡我们找来了在发布会上AMD为RX 6800 XT/6800“钦点”的两位对手RTX 3080/2080 TI显卡,让我们看看在实际的测试中两张A卡是否能对竞争对手占据优势。

注意本次测试A卡均开启SAM技术,关于这项技术的关闭影响会在后面单独讨论,故如无特殊说明跑分、帧数等成绩都是默认开启SAM技术的。

3DMark理论性能测试

我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Port Royal以及DirectX七个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike
Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal以及DirectX是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。

在传统项目理论测试中,两张A卡的表现都很不错。在传统的优势项目Fire Strike系列跑分中,RX 6800 XT与RX 6800都双双领先竞争对手15%-19%不等。而在N卡的传统优势项目Time Spy系列跑分中,RTX 3080仅仅是在4K下取得了略微的优势,在2K的Time Spy中甚至被RX 6800 XT反超,RTX 2080 Ti则是在任何传统测试中都不敌RX 6800。

但是光追理论测试就大反转了,竞争对手毕竟是发展了两代的RT Core,在光追测试中优势十分明显,Port Royal理论跑分里RX 6800 XT勉强达到了RTX 2080 Ti的水平,3DMark最新推出的DirectX测试中两张A卡则是完全处于下风,帧数表现均不敌RTX 2080 Ti。

我们同时还开启了狂怒模式进行测试,从结果上看理论跑分确实相比默认有一点提升,不过并不大,这个模式提升的性能十分有限。

实际游戏性能测试

因为AMD Radeon RX 6800
XT/6800两张显卡的主要目标是在2K、4K分辨率下进行游戏,因此本次的测试重点放在了2K、4K的光追与传统光栅化游戏的测试,所有游戏测试时均开启最高特效(地铁:离去为Ultra模式),并且图形API均选择游戏支持最新的API。现在随着次时代主机的发布,我特意挑选了几款“次时代”游戏进行测试,这些游戏对显卡的要求极高,更能体现显卡在新游戏中的表现。考虑到买3A平台回家的玩家没有理由不开启SAM,故下面的测试中如无特殊说明,均开启了SAM技术进行测试。

注意:以下测试AMD显卡均开启了SAM技术,关于SAM开关对比我们会单列出一个对比表格。

2K游戏性能测试

传统光栅化游戏性能测试

在传统光栅化游戏的测试中,比拼的就是显卡的硬实力了。在这些项目中两张A卡优势明显,在大多数游戏中RX 6800 XT与RX 6800均分别对位领先RTX 3080以及RTX 2080 Ti。RX 6800 XT的领先幅度为0%-32%不等,在传统游戏中大幅度领先了RTX 3080显卡。而RX 6800的领先幅度也是达到了2%-26%,大幅度领先了RTX 2080
Ti显卡,这与之前的理论性能跑分趋于一致,在2K分辨率下A卡的传统游戏性能十分强悍。A家的两张显卡内战差距符合了两者硬件规格的差距,仅需500块钱就有近20%的提升,RX 6800 XT的性价比毋庸置疑。

此外,狂怒模式的表现聊胜于无,这毕竟是集成在驱动内的“小超”模式,在性能的提升上并不明显。

光追游戏性能测试

注意:以下游戏测试中支持DLSS1.0技术的开启DLSS,支持DLSS2.0技术的开启DLSS质量模式。

光追游戏的结果也跟之前的理论跑分趋于一致,竞争对手第二代的光追性能领先了AMD不少。大多数情况下RX 6800 XT的光追性能会领先RTX 2080 Ti,只不过还不能跟RTX 3080展开竞争。RTX
3080的光追性能不但领先所有参测显卡,更重要的是凭借DLSS深度学习超采样抗锯齿技术,在画面质量最大保留的DLSS质量模式下,NVIDIA的两张显卡还能继续提升帧数,让游戏体验更加流畅。考虑到这毕竟是AMD的第一代光追显卡,对这样的表现我还是保持

相关推荐