www.hj8828.com 5

www.hj8828.com年度GPU架构回看 显示世界的二〇一三(一)

同样属于架构革新的2012

HotChips半导体大会上,AMD不仅介绍了Steamroller、Jaguar两大处理器架构的一些细节,还首次公开了GCN
Radeon HD 7000系列显卡所用三大核心的内核照片,它们分别是Southern
Island家族的Tahiti、Pitcairn、Cape Verde。

AMD发布新锐龙处理器的时间大概是在台北电脑展,而Navi显卡则有可能在两星期后的E3大展上,反正最近关于这两样东西的泄露不断,现在RX
3080的规格也泄露出来了。

过去的2012年里,无论是AMD还是NVIDIA都在图形架构技术层面上锐意进取,为我们带来了Compute
Unit以及GPU
Boost等等先进的技术,这些技术对于显卡产品的推动和促进作用是显著的。但对于我们以及整个业界来说,光有这些技术的进步还远远不够。

在过去几年中,AMD一直不肯公布此类照片,很大程度上是因为他们总是提前NVIDIA发布新产品,自然不想让对手很快就近距离看到自家GPU的设计图,外界自然也就无从得知AMD
GPU的物理布局细节了。

www.hj8828.com 1

如果孤立存在,即便再优秀再精妙的技术,也无法转变成任何对我们有益的结果。只有将这些技术系统的融合在一起,调整好彼此的关系并令其发挥最佳的效果,技术的进步才能为我们带来切实的好处。所以对技术融合在一起所形成的架构进行回顾,也就变得有意义了。

注意下边几张照片主要是给工程师、设计师等专业人士看的,不是拿来宣传的那种经过艺术加工的照片,因此看上去有些粗糙,但却是最真实的。

这消息是@KOMACHI_ENSAKA在推特上曝出来的,这款产品是中段Radeon显卡所用的,预计将与RTX
2070和RTX
2060相竞争,至于这款显卡的命名是啥其实没有定论的,不过为了便于说明暂时把它称作Navi
10核心和RX 3080显卡。

技术的进步带动了AMD及NVIDIA在GPU架构层面的进步,让2012年不仅是技术进步年,更是GPU架构进步年。先后出现的GCN和开普勒(Kepler)体系都是双方技术进步的集大成者,它们成功地将双方全部的技术进步转化成了产品性能的提升,但细化到架构内部,双方的表现却并不都是积极向好的。同样的甚至是彼此一一对应的各种先进技术所组成的Tahiti和开普勒,最终却并没有一起收获成功。

www.hj8828.com 2

www.hj8828.com 3

胜利者从不缺乏赞美,赞美本身对胜利者以及旁观者都没有任何意义。只有找到导致问题的本源,并从由此探究更深层次的问题,我们才能明白图形界在过去的2012年里究竟经历了些什么。友站ZOL今天就带我们一览了2012年里出现在我们面前的所有图形架构,并揭示了决定AMD/NVIDIA架构之战结局的原因。

Tahiti:Radeon HD
7900系列核心,可以清楚地看到分列左右的每一组CU,下方的逻辑控制单路(包括PCI-E控制器和UVD视频解码引擎等等),左右和上方的显存控制器单元、二级缓存。两个ACE应该在中间,但是ROP光栅单元实在找不出来。

Navi架构带来了全新的着色器引擎设计,以提高计算单元的利用率和更高的像素吞吐量,Navi
10芯片拥有40个CU单元,每单元拥有64个流处理器,也就是一共2560个流处理器,比现在的Vega
64与56都要少,根据此前的消息这个核心拥有8个着色引擎,这些引擎每个包含5个CU单元和一个光栅后端,现有的GCN架构中每个光栅后端包含16个ROP,现在不清楚Navi
10是否会有128个ROP,或者AMD已经减少了Navi架构每个光栅后端的ROP数量。

www.hj8828.com 4

www.hj8828.com 5

www.hj8828.com,实际上着色器引擎数量是Navi架构的一个重要细节,因为此前AMD的GCN架构一直无法突破4个着色器引擎,这也导致大型GPU的流处理器利用率不足,这也是目前以来GCN架构的最大限制。

令人眼前一亮的Tahiti

Pitcarin:Radeon HD
7800/7900M系列核心,看起来很像Tahiti,只不过小了一号,计算单元、显存控制器都更少了。

如果这个问题解决了,AMD就能提升大型GPU的流处理器利用率问题,并且我们可能会看到有超过4096个留处理器的GPU的诞生,此外ROP数量也有可能超过64个,从而提升高分辨率的吞吐量,这也是此前AMD的大GPU的另一个限制。