Les premières cartes mémoire à large bande passante d'AMD à apparaître dans quelques mois

Un nouveau type de mémoire est conçu pour fournir de nouveaux gains de performances.


Selon AMD lui-même, la société a défini pendant de nombreuses années de nouveaux types de mémoire pour les accélérateurs graphiques, et le reste de l'industrie a rattrapé son retard. Cela a donné aux produits AMD un avantage concurrentiel, par exemple, à l'époque, l'innovation sous la forme de GDDR5 a donné à la Radeon HD 4870 un leadership en matière de performances. En conséquence, GDDR5 est devenu la norme, mais sept ans se sont écoulés depuis sa première apparition, et aucun changement fondamentalement nouveau ne s'est produit. La prochaine percée consiste à fournir la norme de mémoire à large bande passante. Le premier accélérateur vidéo basé sur celui-ci peut sortir dans quelques mois.

Les travaux sur HBM ont commencé il y a sept ans, c'est-à-dire à peu près au même moment où le GDDR5 était complètement prêt. Les mêmes ingénieurs ont travaillé sur la technologie, explique Joe Macri, employé d'AMD. Même alors, ils ont commencé à s'inquiéter de la dépendance croissante de la puissance de calcul totale des ordinateurs personnels de la mémoire, et ils ont commencé à soupçonner que la consommation d'énergie deviendrait progressivement un moyen de dissuasion.



Maintenant, tout est extrait de GDDR5. Pour obtenir une bande passante supplémentaire, vous devez ajouter des puces et des canaux supplémentaires qui rongent l'espace et l'énergie de la carte. Tout a ses limites, et les cartes vidéo de dernière génération les démontrent avec leurs interfaces 512 bits. L'accélération habituelle du GDDR5 cesse de fonctionner - cette année, Samsung a commencé à produire des puces à 8 Gb / s, ce qui représente une amélioration de seulement 14% par rapport au maximum précédent (7 Gb / s). AMD a déjà commencé à rencontrer des problèmes d'accélération supplémentaire, car l'augmentation de la fréquence signifie une forte augmentation de la consommation d'énergie.



Une solution à ce problème est ce que les fabricants ont fait au cours des deux dernières décennies pour réduire les coûts et l'énergie et augmenter la productivité: l'intégration. Par exemple, les processeurs centraux comprenaient de nombreux éléments, des coprocesseurs mathématiques aux contrôleurs de mémoire, et dans chaque cas, il y avait des avantages. Mais combiner mémoire et GPU n'est pas un processus aussi simple, explique Macri. Les processus de leur production sont si différents que leur combinaison sur une seule puce est devenue trop chère. La solution consiste à placer la mémoire à proximité du GPU, mais sur une puce distincte. HBM consiste à placer plusieurs couches dans une configuration 3D (ou, pour être plus précis, 2.5D).







HBM se compose de trois parties principales: c'est la puce principale (CPU, GPU ou système sur une puce), une ou plusieurs colonnes de mémoire et la couche de silicium sur laquelle elles se trouvent - intercalaire (intermédiaire). Interposer est une puce de silicium ordinaire, actuellement fabriquée en utilisant l'ancienne technologie de traitement à 65 nm. Macri a expliqué que le rôle de l'interposeur est complètement passif, il n'a aucun élément actif, car sa seule tâche est de connecter électriquement les pistes entre la mémoire et le processeur. Puisqu'il s'agit d'une puce en silicium, elle peut connecter beaucoup plus d'éléments qu'une carte ordinaire. C'est l'interposeur qui est le détail clé de la mémoire à large bande passante. Il existe d'autres éléments traditionnels sous l'interposeur, mais leur tâche consiste à échanger avec le bus PCI Express, la sortie vers les moniteurs et d'autres interfaces.Toutes les communications entre le processeur vidéo et la mémoire ont lieu à l'aide d'un interposeur.



L'interposeur est d'un grand intérêt, mais une autre nouvelle fonctionnalité importante est la mémoire en couches. Quatre couches de la mémoire réelle sont empilées sur la couche de contrôle logique. Cinq couches sont connectées les unes aux autres à l'aide d'interconnexions dans un substrat de silicium (TSV). Selon Macri, ces couches sont très minces, l'épaisseur atteint environ 100 micromètres. Si vous en prenez un dans votre main, il se pliera et ondulera comme du papier.

Et chacune de ces couches de stockage contient un nouveau type de mémoire, spécialement créé pour les conditions de travail dans HBM. La mémoire utilise une tension relativement basse - 1,3 volts (GDDR5 a 1,5), des fréquences de fonctionnement plus faibles (500 MHz au lieu de 1750) et a une bande passante inférieure (1 Go / s au lieu de 7). Tout cela est compensé par une interface très large. Dans la première implémentation HBM, chaque couche de mémoire communique sur deux canaux de 128 bits, c'est-à-dire que chaque pile a un bus de 1024 bits. Le résultat est une mémoire massive de 4096 bits avec une bande passante d'environ 128 Go / s.



La mémoire à large bande passante n'est pas apparue de toutes pièces. En 2011, AMD a annoncé son intention de s'associer au fabricant de mémoire Hynix (désormais SK Hynix) pour développer et mettre en œuvre la norme de mémoire de nouvelle génération. AMD a créé des connexions, un interposeur et un nouveau type de mémoire. Hynix produit de la mémoire et les premiers échantillons de l'interposeur ont été créés dans les installations de United Microelectronics Corporation. La nouvelle norme a déjà été approuvée par la mémoire réglementaire de l'industrie JEDEC. Cela signifie que la mémoire à large bande passante peut être largement prise en charge par diverses sociétés. Avec un certain retard, HBM est également tombé dans les plans de Nvidia.



Même l'implémentation de première génération de la mémoire à bande passante élevée présente un certain nombre d'avantages par rapport à GDDR5, et ce n'est pas seulement la bande passante de pointe. Selon Macri, GDDR5 vous permet de transférer 10,66 Go / s par watt, et avec HBM ce chiffre est de 35. L'efficacité énergétique de la mémoire est un indicateur important, car le R9 290X dépense 15-20% d'énergie en mémoire. Le passage à HBM réduira cet indicateur de plus de deux fois.



La mémoire n'est pas seulement plus économe en énergie, elle est compacte. Un gigaoctet en HBM nécessite 35 mm² et quatre puces GDDR5 de même taille occupent 672 mm² de carte. Par conséquent, HBM permettra la création d'appareils plus compacts. L'interposeur est organisé très efficacement, ce qui réduit la taille globale du cristal. Il est même possible d'améliorer le flux de données au sein de la carte graphique. Au total, environ deux fois moins de surface de carte est requise, cela simplifiera la construction de cartes avec deux processeurs vidéo. La mémoire de l'ère post-GDDR changera non seulement les accélérateurs vidéo, mais aussi les APU. Plus de canaux promettent moins de temps d'accès aléatoire. Un système d'horloge simplifié et d'autres changements mineurs signifient une réduction potentielle du temps de réponse. Macri s'attend à ce que HBM pénètre dans de nombreux domaines du marché informatique.





L'implémentation HBM de première génération présente un inconvénient important: la taille totale de la mémoire ne peut atteindre que 4 Go. C'est un peu, si vous vous souvenez que le Titan X a trois fois plus, 12 Go de mémoire, et la génération actuelle R9 290X a les mêmes 4 Go. Même les limites phares sont faciles à atteindre en résolution 4K. Mais Macri prétend qu'AMD va en quelque sorte faire face à cette limitation. À son avis, les cartes vidéo de la génération actuelle ne gèrent pas la mémoire très efficacement. Les volumes de mémoire ont augmenté rapidement, donc chez AMD jusqu'à ce moment-là, ils ne pensaient pas beaucoup à leur utilisation.

HBM a également d'autres problèmes "d'enfance". Par exemple, la taille des puces de processeur vidéo augmente, et l'interposeur devrait être encore plus grand, et le coût de sa production peut atteindre des valeurs prohibitives. La petite taille du HBM signifiera les problèmes de refroidissement qui existaient déjà dans certains premiers cas du R9 290X. Selon Macri, bien que les illustrations suggèrent le contraire, les piles de mémoire sont à peu près de la même hauteur que le processeur vidéo, de sorte qu'elles augmentent la surface totale de dissipation thermique. Enfin, la nouvelle technologie doit porter ses fruits, et pour cela de nouvelles solutions doivent être produites et vendues en grandes quantités. Selon les fuites, la trois centième série sera présentée le 18 juin et la R9 390X sera présentée le 24 juin. Des fuites sur les photos suggèrent un éventuel refroidissement liquide.




Macri a déclaré qu'une deuxième version de la mémoire à large bande passante était déjà en cours de développement. Son débit est deux fois plus élevé que celui de la première génération et le nombre de couches mémoire passera à huit. Grâce à l'utilisation de la nouvelle technologie de processus, le volume augmentera quatre fois. Macri est convaincu qu'un jour, le nombre de couches de mémoire pourra atteindre 16.

Pour la première fois, HBM apparaîtra dans la prochaine génération de cartes graphiques AMD. Diverses hypothèses sur leurs caractéristiques futures donnent quelques estimations possibles.

AMD Radeon R9 290XNvidia GeForce GTX Titan XFutur vaisseau amiral - spéculation médiatique
Mémoire4 GO12 Go4 GO
Bande passante de la puce mémoire5 Gbit / s7 Gbit / s1 Gbit / s
Nombre de jetonsseize244
Débit par puce20 Go / s14 Go / s128 Go / s
Bus mémoire512 bits384 bits4096 bits
Débit total320 Go / s336 Go / s512 Go / s
Consommation de mémoire estimée30 watts31,5 watts14,6 watts

Sur la base de Tech Report , ExtremeTech, et AnandTech .

All Articles