Las primeras tarjetas de memoria de alto ancho de banda de AMD llegarán en unos pocos meses

Un nuevo tipo de memoria está diseñado para proporcionar mayores ganancias de rendimiento.


Según AMD, la compañía ha definido durante años nuevos tipos de memoria para aceleradores de gráficos, y el resto de la industria se ha estado poniendo al día. Esto le dio a los productos AMD una ventaja competitiva, por ejemplo, en ese momento, la innovación en forma de GDDR5 proporcionó a la Radeon HD 4870 un liderazgo en rendimiento. Como resultado, GDDR5 se convirtió en el estándar, pero han pasado siete años desde su primera aparición, y no se han producido cambios fundamentalmente nuevos. El próximo avance es proporcionar el estándar de memoria de ancho de banda alto. El primer acelerador de video basado en él puede salir en unos pocos meses.

El trabajo en HBM comenzó hace siete años, es decir, casi al mismo tiempo que GDDR5 estaba completamente listo. Los mismos ingenieros trabajaron en la tecnología, dice el empleado de AMD Joe Macri. Incluso entonces, comenzaron a preocuparse por la creciente dependencia de la potencia informática total de las computadoras personales en la memoria, y comenzaron a sospechar que el consumo de energía se convertiría gradualmente en un elemento disuasorio.



Ahora todo está exprimido de GDDR5. Para obtener ancho de banda adicional, debe agregar chips y canales adicionales que consuman el espacio y la energía de la placa. Todo tiene sus límites, y las tarjetas de video de última generación lo demuestran con sus interfaces de 512 bits. La aceleración GDDR5 habitual deja de funcionar: este año Samsung comenzó a producir chips a 8 Gb / s, lo que representa una mejora de solo el 14% sobre el máximo anterior (7 Gb / s). AMD ya ha comenzado a experimentar problemas con una mayor aceleración, ya que aumentar la frecuencia significa un fuerte aumento en el consumo de energía.



Una solución a este problema es lo que los fabricantes han estado haciendo durante las últimas décadas para reducir los costos y la energía y aumentar la productividad: la integración. Por ejemplo, los procesadores centrales incluían muchos elementos, desde coprocesadores matemáticos hasta controladores de memoria, y en cada caso había ventajas. Pero combinar memoria y GPU no es un proceso tan simple, explica Macri. Los procesos de su producción son tan diferentes que su combinación en un chip se ha vuelto demasiado costosa. La solución es colocar la memoria cerca de la GPU, pero en un chip separado. HBM implica colocar varias capas en una configuración 3D (o, para ser más precisos, 2.5D).







HBM consta de tres partes principales: es el chip principal (CPU, GPU o sistema en un chip), una o más columnas de memoria y la capa de silicio en la que se encuentran: interpositor (intermediario). Interposer es un chip de silicio regular, actualmente fabricado utilizando la tecnología de proceso más antigua de 65 nm. Macri explicó que el papel del intercalador es completamente pasivo, no tiene elementos activos, ya que su única tarea es conectar eléctricamente las pistas entre la memoria y el procesador. Como es un chip de silicio, puede conectar muchos más elementos que una placa normal. Es el intercalador que es el detalle clave de la memoria de alto ancho de banda. Hay otros elementos tradicionales debajo del intercalador, pero su tarea es intercambiar con el bus PCI Express, salida a monitores y otras interfaces.Toda comunicación entre el procesador de video y la memoria se lleva a cabo utilizando un intercalador.



El intercalador es de gran interés, pero otra característica nueva importante es la memoria en capas. Cuatro capas de la memoria real se apilan en la capa de control lógico. Cinco capas están conectadas entre sí mediante interconexiones en un sustrato de silicio (TSV). Según Macri, estas capas son muy delgadas, el grosor alcanza unos 100 micrómetros. Si toma una en la mano, se doblará y agitará como el papel.

Y cada una de estas capas de almacenamiento contiene un nuevo tipo de memoria, especialmente creada para condiciones de trabajo en HBM. La memoria utiliza un voltaje relativamente bajo: 1.3 voltios (GDDR5 tiene 1.5), frecuencias de operación más bajas (500 MHz en lugar de 1750) y un ancho de banda más bajo (1 GB / s en lugar de 7). Todo esto se compensa con una interfaz muy amplia. En la primera implementación de HBM, cada capa de memoria se comunica en dos canales de 128 bits, es decir, cada pila tiene un bus de 1024 bits. El resultado es una memoria masiva de 4096 bits con un ancho de banda de aproximadamente 128 GB / s.



La memoria de ancho de banda alto no apareció desde cero. En 2011, AMD anunció planes para asociarse con el fabricante de memoria Hynix (ahora SK Hynix) para desarrollar e implementar el estándar de memoria de próxima generación. AMD ha creado conexiones, un intercalador y un nuevo tipo de memoria. Hynix produce memoria, y las primeras muestras del intercalador se crearon en las instalaciones de United Microelectronics Corporation. El nuevo estándar ya ha sido aprobado por la memoria reguladora de la industria JEDEC. Esto significa que la memoria de alto ancho de banda puede ser ampliamente compatible con varias compañías. Con cierto retraso, HBM también cayó en los planes de Nvidia.



Incluso la implementación de primera generación de memoria de alto ancho de banda tiene una serie de ventajas sobre GDDR5, y esto no es solo el ancho de banda máximo. Según Macri, GDDR5 le permite transferir 10.66 GB / s por vatio, y con HBM esta cifra es 35. La eficiencia energética de la memoria es un indicador importante, ya que el R9 290X gasta 15-20% de su energía específicamente para la memoria. Cambiar a HBM reducirá este indicador más de dos veces.



La memoria no solo es más eficiente energéticamente, es compacta. Un gigabyte en HBM requiere 35 mm², y cuatro chips GDDR5 del mismo tamaño ocupan 672 mm² de área de placa. Por lo tanto, HBM permitirá la creación de dispositivos más compactos. El intercalador está organizado de manera muy eficiente, lo que reduce el tamaño total del cristal. Incluso es posible mejorar el flujo de datos dentro de la tarjeta gráfica. En total, se requiere aproximadamente dos veces menos área de placa, esto simplificará la construcción de tarjetas con dos procesadores de video. La memoria de la era posterior al GDDR cambiará no solo los aceleradores de video, sino también las APU. Más canales prometen menos tiempo de acceso aleatorio. Un sistema de reloj simplificado y otros cambios menores significan una reducción potencial en el tiempo de respuesta. Macri espera que HBM penetre en muchas áreas del mercado informático.





La implementación de HBM de primera generación tiene un inconveniente importante: el tamaño total de la memoria puede alcanzar solo 4 GB. Eso es un poco, si recuerdas que el Titan X tiene tres veces más, 12 GB de memoria, y la generación actual R9 290X tiene los mismos 4 GB. Incluso los límites emblemáticos son fáciles de alcanzar en resolución 4K. Pero Macri afirma que AMD de alguna manera hará frente a esta limitación. En su opinión, las tarjetas de video de la generación actual no manejan la memoria de manera muy eficiente. Los volúmenes de memoria crecieron rápidamente, por lo que en AMD hasta ese momento no pensaron mucho en su uso.

HBM también tiene otros problemas de "infancia". Por ejemplo, el tamaño de los chips del procesador de video está creciendo, y el intercalador debería ser aún mayor, y el costo de su producción puede alcanzar valores prohibitivamente altos. El pequeño tamaño de HBM significará los problemas de enfriamiento que ya existían en algunas instancias tempranas del R9 290X. Según Macri, aunque las ilustraciones sugieren lo contrario, las pilas de memoria tienen aproximadamente la misma altura que el procesador de video, por lo que aumentan el área total de disipación de calor. Finalmente, la nueva tecnología debe dar sus frutos, y para esto se deben producir y vender nuevas soluciones en grandes volúmenes. Según las filtraciones, las trescientas series se presentarán el 18 de junio y la R9 390X se mostrará el 24 de junio. Las fugas en las fotos sugieren un posible enfriamiento líquido.




Macri dijo que ya se está desarrollando una segunda versión de High Bandwidth Memory. Su rendimiento es dos veces mayor que el de la primera generación, y el número de capas de memoria aumentará a ocho. Mediante el uso de la nueva tecnología de proceso, el volumen aumentará cuatro veces. Macri está seguro de que algún día la cantidad de capas de memoria puede aumentar a 16.

Por primera vez, HBM aparecerá en la próxima generación de tarjetas gráficas AMD. Varios supuestos sobre sus características futuras dan algunas estimaciones posibles.

AMD Radeon R9 290XNvidia GeForce GTX Titan XFuturo buque insignia - especulación mediática
Memoria4 GB12 GB4 GB
Ancho de banda del chip de memoria5 Gbps7 Gbps1 Gbps
Numero de chipsdieciséis244 4
Rendimiento por chip20 GB / s14 GB / s128 GB / s
Bus de memoria512 bit384 bit4096 bit
Rendimiento total320 GB / s336 GB / s512 GB / s
Consumo estimado de memoria30 vatios31,5 vatios14,6 vatios

Basado en Tech Report , ExtremeTech y AnandTech .

All Articles