AMD的首个高带宽存储卡出现了几个月

一种新型的内存旨在提供更高的性能。


根据AMD本身,该公司多年来为图形加速器定义了新的内存类型,并且该行业的其余部分一直在追赶。这给AMD产品带来了竞争优势,例如,当时GDDR5形式的创新使Radeon HD 4870在性能上处于领先地位。结果,GDDR5成为标准,但是自首次出现以来已经过去了七年,并且从根本上未发生新的变化。下一个突破是提供高带宽内存标准。第一个基于它的视频加速器可能会在几个月后问世。

关于HBM的工作始于七年前,即GDDR5完全准备就绪的同时。 AMD员工乔·麦克里(Joe Macri)说,同样的工程师也在研究这项技术。即使到那时,他们也开始担心个人计算机的总计算能力对内存的依赖性越来越大,并且开始怀疑功耗会逐渐成为一种威慑力量。



现在一切都从GDDR5中挤出来了。为了获得额外的带宽,您必须添加额外的芯片和通道,从而消耗电路板空间和能量。一切都有其局限性,最新一代的视频卡以其512位接口演示它们。通常的GDDR5加速停止工作-今年三星开始以8 Gb / s的速度生产芯片,仅比之前的最大值(7 Gb / s)提高了14%。随着频率的增加意味着功耗的急剧增加,AMD已经开始遇到进一步加速的问题。



解决此问题的方法之一是制造商在过去的几十年中一直在努力降低成本和能源并提高生产率:集成。例如,中央处理器包括很多元素,从数学协处理器到内存控制器,在每种情况下都有优点。 Macri解释说,但是将内存和GPU结合起来并不是一个简单的过程。它们的生产过程是如此不同,以致于它们在一个芯片上的组合变得太昂贵了。解决方案是将内存靠近GPU,但放在单独的芯片上。 HBM涉及以3D配置(或更准确地说是2.5D)放置多层。







HBM由三个主要部分组成:它是主芯片(CPU,GPU或片上系统),一个或多个内存列以及它们所在的硅层-中介层(中介层)。中介层是常规的硅芯片,目前使用较旧的65 nm工艺技术制造。 Macri解释说,插入器的作用是完全无源的,它没有有源元件,因为它的唯一任务是电连接内存和处理器之间的轨道。由于它是硅芯片,因此与常规电路板相比,它可以连接更多的元件。中介层是高带宽内存的关键细节。插入器下还有其他传统元素,但它们的任务是与PCI Express总线交换,输出到监视器和其他接口。视频处理器和内存之间的所有通信都使用插入器进行。



插入器非常有趣,但是另一个重要的新功能是分层存储器。实际存储器的四层堆叠在逻辑控制层上。使用硅衬底(TSV)中的互连层将五层相互连接。根据Macri的说法,这些层非常薄,厚度达到约100微米。如果您握住一只手,它会像纸一样弯曲弯曲。

每个存储层都包含一种新型的存储器,专门针对HBM的工作条件而创建。内存使用相对较低的电压-1.3伏(GDDR5为1.5伏),较低的工作频率(500 MHz代替1750)和较低的带宽(1 GB / s代替7)。所有这些都被非常宽的界面所抵消。在第一个HBM实现中,每个存储层在两个128位通道上进行通信,也就是说,每个堆栈都有一个1024位总线。结果是巨大的4096位内存,带宽约为128 GB / s。



高带宽内存没有从头开始出现。 2011年,AMD宣布了与Hynix内存制造商(现为SK Hynix)合作开发和实施下一代内存标准的计划。 AMD已创建连接,插入器和新型内存。 Hynix生产内存,并且第一个中介层样本是在联合微电子公司的设施中创建的。新标准已被JEDEC行业法规存储器批准。这意味着高带宽内存可以得到各种公司的广泛支持。经过一段时间的延后,HBM也加入了英伟达的计划。



甚至第一代高带宽存储器的实现都比GDDR5具有许多优势,这不仅是峰值带宽。根据Macri的说法,GDDR5允许您每瓦传输10.66 GB / s,而使用HBM时,该数字为35。内存的能源效率是一个重要的指标,因为R9 290X的能源消耗为15-20%。切换到HBM将使该指标降低两次以上。



存储器不仅更加节能,而且结构紧凑。 1 GB的HBM需要35平方毫米,而四个相同大小的GDDR5芯片则占用672平方毫米的电路板面积。因此,HBM将允许创建更紧凑的设备。中介层的组织非常有效,从而减小了整体晶体的尺寸。甚至有可能改善图形卡内的数据流。总的来说,所需的电路板面积大约减少了两倍,这将简化具有两个视频处理器的卡的结构。 后GDDR时代的内存不仅将改变视频加速器,还将改变APU。更多的频道保证更少的随机访问时间。简化的时钟系统和其他较小的变化意味着响应时间的潜在减少。 Macri期望HBM能够渗透到计算机市场的许多领域。





第一代HBM实现有一个重要的缺点:总内存大小只能达到4 GB。如果您还记得Titan X 拥有三倍的内存,即12 GB的内存,而当前一代的R9 290X具有相同的4 GB,这有点。甚至旗舰级限制也很容易达到4K分辨率。但是Macri声称AMD将以某种方式应对这一局限性。他认为,当前一代的视频卡不能非常有效地处理内存。内存量增长迅速,因此在AMD之前,他们对使用情况并不怎么想。

HBM还存在其他“童年”问题。例如,视频处理器微电路的尺寸正在增长,插入器应该更大,其生产成本可能达到令人望而却步的高值。 HBM的体积小将意味着R9 290X某些早期实例中已经存在的冷却问题。根据Macri的说法,尽管插图另有说明,但内存堆栈的高度与视频处理器的高度相同,因此它们增加了散热的总面积。最后,新技术必须得到回报,并且必须大量生产和销售这种新解决方案。根据泄漏,第三个系列将在6月18日发布,R9 390X将在6月24日发布。照片中的泄漏暗示可能有液体冷却。




Macri说高带宽内存的第二个版本已经在开发中。它的吞吐量是第一代的两倍,并且存储层的数量将跃升到八层。通过使用新的工艺技术,体积将增加四倍。Macri相信有一天内存层的数量可以增加到16个

。HBM将首次出现在下一代AMD显卡中。关于其未来特性的各种假设给出了一些可能的估计。

AMD Radeon R9 290X英伟达GeForce GTX Titan X未来旗舰-媒体猜测
记忆4GB12 GB4GB
内存芯片带宽5 Gbps7 Gbps1 Gbps
筹码数十六244
每芯片吞吐量20 GB /秒14 GB /秒128 GB /秒
记忆体汇流排512位384位4096位
总吞吐量320 GB /秒336 GB /秒512 GB /秒
估计的内存消耗30瓦31.5瓦14.6瓦

基于技术报告ExtremeTechAnandTech

All Articles