AMD发布下一代GPU架构Vega


在12月的AMD技术峰会上,记者、合作伙伴和分析师简要了解了AMD即将推出的产品; 今天我们终于可以谈论目前所知道的一切。我已经谈论了很多关于Zen / Ryzen的信息,但对于玩家来说更值得关注的消息是Vega。AMD给出了去年的计划图,罗列了他们对GPU架构的计划:首先是Polaris,然后是Vega,之后是Navi。Polaris针对主流游戏观众,具有良好的性能和效率,但Vega配置更高,计划于“2017年上半年”发布 - 根据AMD的习惯,可能是6月。

 

除了工作芯片之外,AMD已经发布了Vega的第一个官方详细信息,将与大众面世。

 

Vega建立在比Polaris更好的配置上,但它不是一个大型多核芯片。AMD没有提供Vega的核心数或时钟频率,但可能有4,096个内核,运行速度在1.5-1.6GHz左右。我可以了解这么具体的原因是因为AMD还推出了一系列新的机器智能加速器,称为Radeon Instinct MI6、MI8和MI25。MI25使用Vega,将提供高达25 TFLOPS(FP32的一半)。这意味着Vega的基线比Fury X快45%。考虑到它比Fury X快45%,所以应该高于GTX 1080的性能水平,甚至可能超过Titan X(逼近1080 Ti性能)。



然而,这不仅仅是TFLOPS的改变。AMD已经改造了GCN架构的几个关键元素,主要关键元素是内存子系统。Vega将8GB(可能是16GB)的HBM2内存放入两个堆栈中,可以提供与斐济的四个HBM1堆栈相同的512GB / s带宽,但是使用两个堆叠,硅中介层就不需要那么大,并且HBM2密度允许AMD将内存量翻倍(可能是四倍)。我们已经知道许多4GB限制性能的情况,所以Vega解决了这个问题。



但AMD不仅仅是调用这个HBM或VRAM; 它现在是一个“高带宽缓存”(HBC),并且还有一个新的“高带宽缓存控制器”(HBCC)。这一区别是重要的,因为HBCC在存储器访问中起着更加显着的作用。AMD称之为“全新的内存层次结构”。 这可能有点夸张,但该想法的目的是让GPU能够与大数据协作,这点很难解决。

 

这个例子解释了为什么HBCC如此重要,AMD分析了用于《巫师3》和《辐射4》的VRAM。在这两种情况下,VRAM分配量在游戏中比实际“触摸”(访问)的VRAM的量大2-3倍。HBCC考虑到这一点,允许GPU使用更多的数据集,提供512TB的虚拟地址空间。

 

AMD使用超过600GB数据展示了许多实时物理渲染图像,其中在8GB Vega卡上运行。如果HBCC工作正常,4GB卡可能表现得更像一个8-12GB VRAM卡,而8GB卡等于16-24GB卡。



Vega还有一个全新的几何管道。与使用VRAM类似,AMD指出,场景中的多边形与屏幕上可见的多边形之间可能存在100X差异。与AMD以前的架构相比,全新的几何引擎将拥有超过两倍的吞吐量。计算单元也得到改进,因为对包FP16操作的支持,这也证明对其机器学习应用程序非常有用。AMD的Mike也表示:“我们花了大量的时间进行调整和改进,使频率明显提高,功耗下降,”即便是Radeon MI25仍然拥有“<300W”TDP。



最后,AMD改进了像素引擎,采用了全新的Draw Stream Binning光栅化器,帮助剔除在最终场景中不可见的像素。所有的渲染后端现在也是高速缓存的客户端,减少了存储器访问的数量(例如,当像素和着色器管线都访问相同的纹理时)。 这将提升延迟渲染引擎的性能,也是许多现代游戏正在使用。

 

基于原始性能数据,Vega的表现令人印象深刻,但是根据其他改变的因素和AMD目前卓越的DX12 / Vulkan性能,我们正在期待这一令人兴奋的显卡年。GTX 1080将Fury X提升了30%(小于4K),因此45%的提升将使Vega领先。如果架构改进可以再提升10-15%,Vega甚至可以匹配或超过Titan X。AMD以4K ultra和65-75 fps(在Ryzen系统上)演示了Doom运行,支持性能预估。

 

下面是AMD Vega完整的幻灯片:




发表评论

评论