AMDs erste Speicherkarten mit hoher Bandbreite erscheinen seit wenigen Monaten

Ein neuer Speichertyp soll weitere Leistungssteigerungen ermöglichen.


Laut AMD selbst hat das Unternehmen seit Jahren neue Speichertypen für Grafikbeschleuniger definiert, und der Rest der Branche hat aufgeholt. Dies verschaffte AMD-Produkten einen Wettbewerbsvorteil. Die Innovation in Form von GDDR5 verschaffte der Radeon HD 4870 zu dieser Zeit eine führende Leistung. Infolgedessen wurde GDDR5 zum Standard, aber seit seinem ersten Erscheinen sind sieben Jahre vergangen, und es sind keine grundlegend neuen Änderungen eingetreten. Der nächste Durchbruch besteht darin, den Speicherstandard für hohe Bandbreite bereitzustellen. Der erste darauf basierende Videobeschleuniger kann in wenigen Monaten herauskommen.

Die Arbeiten an HBM begannen vor sieben Jahren, also ungefähr zur gleichen Zeit, als GDDR5 vollständig fertig war. Dieselben Ingenieure haben an der Technologie gearbeitet, sagt AMD-Mitarbeiter Joe Macri. Schon damals machten sie sich Sorgen über die zunehmende Abhängigkeit der gesamten Rechenleistung von PCs vom Speicher, und sie begannen zu vermuten, dass der Stromverbrauch allmählich abschreckend wirken würde.



Jetzt ist alles aus GDDR5 herausgepresst. Um zusätzliche Bandbreite zu erhalten, müssen Sie zusätzliche Chips und Kanäle hinzufügen, die Platz und Energie auf der Platine verbrauchen. Alles hat seine Grenzen und die Grafikkarten der neuesten Generation demonstrieren sie mit ihren 512-Bit-Schnittstellen. Die übliche GDDR5-Beschleunigung funktioniert nicht mehr - in diesem Jahr begann Samsung mit der Produktion von Chips mit 8 Gbit / s, was einer Verbesserung von nur 14% gegenüber dem vorherigen Maximum (7 Gbit / s) entspricht. AMD hat bereits Probleme mit der weiteren Beschleunigung, da eine Erhöhung der Frequenz einen starken Anstieg des Stromverbrauchs bedeutet.



Eine Lösung für dieses Problem ist das, was Hersteller in den letzten Jahrzehnten unternommen haben, um Kosten und Energie zu senken und die Produktivität zu steigern: Integration. Zum Beispiel enthielten Zentralprozessoren viele Elemente, von mathematischen Coprozessoren bis zu Speichercontrollern, und in jedem Fall gab es Pluspunkte. Das Kombinieren von Speicher und GPUs ist jedoch kein so einfacher Vorgang, erklärt Macri. Die Herstellungsprozesse sind so unterschiedlich, dass ihre Kombination auf einem Chip zu teuer geworden ist. Die Lösung besteht darin, den Speicher in der Nähe der GPU, jedoch auf einem separaten Chip zu platzieren. Bei HBM werden mehrere Ebenen in einer 3D-Konfiguration (genauer gesagt 2,5D) platziert.







HBM besteht aus drei Hauptteilen: Es ist der Hauptchip (CPU, GPU oder System auf einem Chip), eine oder mehrere Speicherspalten und die Siliziumschicht, auf der sie sich befinden - Interposer (Intermediär). Interposer ist ein regulärer Siliziumchip, der derzeit mit der älteren 65-nm-Prozesstechnologie hergestellt wird. Macri erklärte, dass die Rolle des Interposers vollständig passiv sei und keine aktiven Elemente habe, da seine einzige Aufgabe darin bestehe, die Spuren zwischen dem Speicher und dem Prozessor elektrisch zu verbinden. Da es sich um einen Siliziumchip handelt, kann er viel mehr Elemente als eine normale Platine verbinden. Es ist der Interposer, der das Hauptdetail des Speichers mit hoher Bandbreite darstellt. Unter dem Interposer befinden sich andere traditionelle Elemente. Ihre Aufgabe besteht jedoch darin, sie mit dem PCI Express-Bus auszutauschen, an Monitore und andere Schnittstellen auszugeben.Die gesamte Kommunikation zwischen dem Videoprozessor und dem Speicher erfolgt über einen Interposer.



Der Interposer ist von großem Interesse, aber ein weiteres wichtiges neues Merkmal ist der geschichtete Speicher. Auf der logischen Steuerschicht sind vier Schichten des eigentlichen Speichers gestapelt. Fünf Schichten sind über Verbindungen in einem Siliziumsubstrat (TSV) miteinander verbunden. Laut Macri sind diese Schichten sehr dünn, die Dicke erreicht etwa 100 Mikrometer. Wenn Sie eine in die Hand nehmen, wird sie sich biegen und wie Papier winken.

Und jede dieser Speicherschichten enthält einen neuen Speichertyp, der speziell für die Arbeitsbedingungen in HBM erstellt wurde. Der Speicher verwendet eine relativ niedrige Spannung - 1,3 Volt (GDDR5 hat 1,5), niedrigere Betriebsfrequenzen (500 MHz anstelle von 1750) und eine geringere Bandbreite (1 GB / s anstelle von 7). All dies wird durch eine sehr breite Schnittstelle ausgeglichen. In der ersten HBM-Implementierung kommuniziert jede Speicherschicht auf zwei 128-Bit-Kanälen, dh jeder Stapel verfügt über einen 1024-Bit-Bus. Das Ergebnis ist ein riesiger 4096-Bit-Speicher mit einer Bandbreite von ca. 128 GB / s.



Speicher mit hoher Bandbreite wurde nicht von Grund auf neu angezeigt. Im Jahr 2011 kündigte AMD Pläne an, mit dem Hynix-Speicherhersteller (jetzt SK Hynix) zusammenzuarbeiten, um den Speicherstandard der nächsten Generation zu entwickeln und zu implementieren. AMD hat Verbindungen, einen Interposer und einen neuen Speichertyp erstellt. Hynix produziert Speicher, und die ersten Proben des Interposers wurden in den Einrichtungen der United Microelectronics Corporation erstellt. Der neue Standard wurde bereits vom Regulierungsspeicher der JEDEC-Industrie genehmigt. Dies bedeutet, dass Speicher mit hoher Bandbreite von verschiedenen Unternehmen weitgehend unterstützt werden kann. Mit einiger Verzögerung fiel HBM auch in die Pläne von Nvidia.



Selbst die Implementierung von Speicher mit hoher Bandbreite in der ersten Generation bietet gegenüber GDDR5 eine Reihe von Vorteilen, und dies ist nicht nur die Spitzenbandbreite. Laut Macri können Sie mit GDDR5 10,66 GB / s pro Watt übertragen. Bei HBM sind es 35. Die Energieeffizienz des Speichers ist ein wichtiger Indikator, da der R9 290X 15 bis 20% der Energie für den Speicher verbraucht. Durch Umschalten auf HBM wird diese Anzeige mehr als zweimal gesenkt.



Der Speicher ist nicht nur energieeffizienter, sondern auch kompakt. Ein Gigabyte in HBM erfordert 35 mm², und vier GDDR5-Chips derselben Größe belegen 672 mm² Platinenfläche. Daher ermöglicht HBM die Erstellung kompakterer Geräte. Der Interposer ist sehr effizient organisiert, was die Gesamtkristallgröße reduziert. Es ist sogar möglich, den Datenfluss innerhalb der Grafikkarte zu verbessern. Insgesamt wird ungefähr zweimal weniger Platinenfläche benötigt, was den Aufbau von Karten mit zwei Videoprozessoren vereinfacht. Die Erinnerung an die Zeit nach der DDD wird nicht nur Videobeschleuniger, sondern auch APUs verändern. Mehr Kanäle versprechen weniger Direktzugriffszeit. Ein vereinfachtes Taktsystem und andere geringfügige Änderungen bedeuten eine mögliche Verkürzung der Reaktionszeit. Macri erwartet, dass HBM viele Bereiche des Computermarktes durchdringen wird.





Die HBM-Implementierung der ersten Generation hat ein wichtiges Minus: Die Gesamtspeichergröße kann nur 4 GB erreichen. Das ist ein bisschen, wenn Sie sich erinnern , dass die Titan X hat dreimal so viel, 12 GB Speicher, und die aktuelle Generation R9 290X hat das gleiche 4 GB. Selbst Flaggschiff-Limits sind in 4K-Auflösung leicht zu erreichen. Aber Macri behauptet, dass AMD diese Einschränkung irgendwie bewältigen wird. Grafikkarten der aktuellen Generation gehen seiner Meinung nach nicht sehr effizient mit Speicher um. Das Speichervolumen wuchs schnell, so dass sie bei AMD bis zu diesem Moment nicht viel über ihre Verwendung nachdachten.

HBM hat auch andere "Kindheitsprobleme". Beispielsweise wächst die Größe von Videoprozessorchips, und der Interposer sollte noch größer sein, und die Produktionskosten können unerschwinglich hohe Werte erreichen. Die geringe Größe von HBM bedeutet die Kühlprobleme, die bereits in einigen frühen Fällen des R9 290X aufgetreten sind. Laut Macri haben die Speicherstapel, obwohl die Abbildungen etwas anderes vermuten lassen, ungefähr die gleiche Höhe wie der Videoprozessor, sodass sie die gesamte Wärmeableitungsfläche vergrößern. Schließlich muss sich die neue Technologie auszahlen, und dafür müssen neue Lösungen in großen Mengen hergestellt und verkauft werden. Laut Lecks wird die dreihundertste Serie am 18. Juni vorgestellt, und der R9 390X wird am 24. Juni gezeigt. Lecks in Fotos deuten auf eine mögliche Flüssigkeitskühlung hin.




Laut Macri wird bereits eine zweite Version von High Bandwidth Memory entwickelt. Sein Durchsatz ist doppelt so hoch wie der der ersten Generation, und die Anzahl der Speicherschichten springt auf acht. Durch den Einsatz der neuen Prozesstechnologie wird das Volumen um das Vierfache erhöht. Macri ist sich sicher, dass die Anzahl der Speicherschichten eines Tages auf 16 ansteigen kann.

Zum ersten Mal wird HBM in der nächsten Generation von AMD-Grafikkarten erscheinen. Verschiedene Annahmen über ihre zukünftigen Eigenschaften geben einige mögliche Schätzungen.

AMD Radeon R9 290XNvidia GeForce GTX Titan X.Zukünftiges Flaggschiff - Medienspekulation
Erinnerung4GB12 GB4GB
Speicherchipbandbreite5 Gbit / s7 Gbit / s1 Gbit / s
Anzahl der ChipsSechszehn244
Durchsatz pro Chip20 GB / s14 GB / s128 GB / s
Speicherbus512 Bit384 Bit4096 Bit
Gesamtdurchsatz320 GB / s336 GB / s512 GB / s
Geschätzter Speicherverbrauch30 Watt31,5 Watt14,6 Watt

Basierend auf Tech Report , ExtremeTech und AnandTech .

All Articles