Os primeiros cartões de memória de alta largura de banda da AMD serão exibidos em alguns meses

Um novo tipo de memória projetado para fornecer mais ganhos de desempenho


Segundo a própria AMD, há anos a empresa define novos tipos de memória para aceleradores gráficos, e o restante da indústria vem se recuperando. Isso deu aos produtos AMD uma vantagem competitiva, por exemplo, na época, a inovação na forma de GDDR5 forneceu a Radeon HD 4870 com liderança em desempenho. Como resultado, o GDDR5 se tornou o padrão, mas sete anos se passaram desde a sua primeira aparição e nenhuma mudança fundamentalmente nova ocorreu. A próxima inovação é fornecer o padrão de alta largura de banda de memória. O primeiro acelerador de vídeo baseado nele pode ser lançado em alguns meses.

O trabalho na HBM começou há sete anos, ou seja, na mesma época em que o GDDR5 estava completamente pronto. Os mesmos engenheiros trabalharam na tecnologia, diz Joe Macri, funcionário da AMD. Mesmo assim, eles começaram a se preocupar com a crescente dependência do poder computacional total dos computadores pessoais na memória e começaram a suspeitar que o consumo de energia se tornaria gradualmente um impedimento.



Agora tudo é extraído do GDDR5. Para obter largura de banda adicional, é necessário adicionar chips e canais adicionais que consomem espaço e energia da placa. Tudo tem seus limites, e as placas de vídeo de última geração as demonstram com suas interfaces de 512 bits. A aceleração usual do GDDR5 para de funcionar - este ano a Samsung começou a produzir chips a 8 Gb / s, o que representa uma melhoria de apenas 14% em relação ao máximo anterior (7 Gb / s). A AMD já começou a ter problemas com aceleração adicional, pois aumentar a frequência significa um aumento acentuado no consumo de energia.



Uma solução para esse problema é o que os fabricantes vêm fazendo há duas décadas para reduzir custos e energia e aumentar a produtividade: integração. Por exemplo, os processadores centrais incluíam muitos elementos, de coprocessadores matemáticos a controladores de memória, e em cada caso havia vantagens. Mas combinar memória e GPUs não é um processo tão simples, explica Macri. Os processos de sua produção são tão diferentes que sua combinação em um chip se tornou muito cara. A solução é colocar a memória próxima à GPU, mas em um chip separado. O HBM envolve colocar várias camadas em uma configuração 3D (ou, para ser mais preciso, 2.5D).







O HBM consiste em três partes principais: é o chip principal (CPU, GPU ou sistema em um chip), uma ou mais colunas de memória e a camada de silício em que estão localizadas - interposer (intermediário). O Interposer é um chip de silício comum, atualmente fabricado usando a tecnologia de processo mais antiga de 65 nm. Macri explicou que o papel do interpositor é completamente passivo, não possui elementos ativos, pois sua única tarefa é conectar eletricamente as trilhas entre a memória e o processador. Por ser um chip de silício, pode conectar muito mais elementos do que uma placa comum. É o interposer que é o detalhe principal da memória de alta largura de banda. Existem outros elementos tradicionais sob o interposer, mas sua tarefa é trocar com o barramento PCI Express, enviar para monitores e outras interfaces.Toda a comunicação entre o processador de vídeo e a memória ocorre usando um interposer.



O interposer é de grande interesse, mas outro novo recurso importante é a memória em camadas. Quatro camadas da memória real são empilhadas na camada de controle lógico. Cinco camadas são conectadas entre si usando interconexões em um substrato de silício (TSV). Segundo Macri, essas camadas são muito finas, a espessura chega a cerca de 100 micrômetros. Se você pegar uma na mão, ela dobrará e acenará como papel.

E cada uma dessas camadas de armazenamento contém um novo tipo de memória, criado especialmente para condições de trabalho no HBM. A memória usa uma voltagem relativamente baixa - 1,3 volts (GDDR5 tem 1,5), frequências operacionais mais baixas (500 MHz em vez de 1750) e tem largura de banda menor (1 GB / s em vez de 7). Tudo isso é compensado por uma interface muito ampla. Na primeira implementação do HBM, cada camada de memória se comunica em dois canais de 128 bits, ou seja, cada pilha possui um barramento de 1024 bits. O resultado é uma enorme memória de 4096 bits com uma largura de banda de cerca de 128 GB / s.



A Memória de alta largura de banda não apareceu do zero. Em 2011, a AMD anunciou planos de parceria com o fabricante de memória Hynix (agora SK Hynix) para desenvolver e implementar o padrão de memória de última geração. A AMD criou conexões, um interposer e um novo tipo de memória. A Hynix produz memória e as primeiras amostras do interposer foram criadas nas instalações da United Microelectronics Corporation. O novo padrão já foi aprovado pela memória reguladora do setor JEDEC. Isso significa que a alta largura de banda de memória pode ser amplamente suportada por várias empresas. Com algum atraso, a HBM também caiu nos planos da Nvidia.



Até a implementação da primeira geração de memória de alta largura de banda tem várias vantagens sobre o GDDR5, e isso não é apenas o pico da largura de banda. Segundo Macri, o GDDR5 permite transferir 10,66 GB / s por watt, e com o HBM esse número é 35. A eficiência energética da memória é um indicador importante, pois o R9 290X gasta 15-20% de energia na memória. Mudar para HBM reduzirá esse indicador mais de duas vezes.



A memória não é apenas mais eficiente em termos energéticos, é compacta. Um gigabyte na HBM requer 35 mm² e quatro chips GDDR5 do mesmo tamanho ocupam 672 mm² de área da placa. Portanto, a HBM permitirá a criação de dispositivos mais compactos. O interposer é organizado com muita eficiência, o que reduz o tamanho total do cristal. É ainda possível melhorar o fluxo de dados na placa gráfica. No total, é necessária aproximadamente duas vezes menos área da placa, o que simplificará a construção de placas com dois processadores de vídeo. A memória da era pós-GDDR mudará não apenas os aceleradores de vídeo, mas também as APUs. Mais canais prometem menos tempo de acesso aleatório. Um sistema de relógio simplificado e outras pequenas alterações significam uma possível redução no tempo de resposta. Macri espera que a HBM penetre muitas áreas do mercado de computadores.





A implementação da primeira geração do HBM tem um importante sinal de menos: o tamanho total da memória pode atingir apenas 4 GB. Isso é um pouco, se você se lembra que o Titan X tem três vezes mais, 12 GB de memória, e a geração atual R9 290X tem os mesmos 4 GB. Até os limites principais são fáceis de alcançar na resolução 4K. Mas Macri afirma que a AMD, de alguma forma, lidará com essa limitação. Na sua opinião, as placas de vídeo da geração atual não lidam com a memória com muita eficiência. Os volumes de memória cresceram rapidamente; portanto, na AMD, até aquele momento, eles não pensaram muito em seu uso.

HBM também tem outros problemas de "infância". Por exemplo, o tamanho dos chips de processador de vídeo está aumentando, e o interposer deve ser ainda maior, e o custo de sua produção pode atingir valores proibitivamente altos. O pequeno tamanho da HBM significará os problemas de resfriamento que já estavam em alguns casos iniciais do R9 290X. De acordo com Macri, embora as ilustrações sugiram o contrário, as pilhas de memória têm aproximadamente a mesma altura do processador de vídeo, portanto aumentam a área total de dissipação de calor. Finalmente, a nova tecnologia deve valer a pena e, para isso, novas soluções devem ser produzidas e vendidas em grandes volumes. De acordo com os vazamentos, as trezentas séries serão apresentadas em 18 de junho e o R9 390X será exibido em 24 de junho. Vazamentos nas fotos sugerem um possível resfriamento por líquido.




Macri disse que uma segunda versão do High Bandwidth Memory já está sendo desenvolvida. Sua taxa de transferência é duas vezes maior que a da primeira geração, e o número de camadas de memória passa para oito. Com o uso da nova tecnologia de processo, o volume aumentará quatro vezes. Macri tem certeza de que algum dia o número de camadas de memória poderá aumentar para 16.

Pela primeira vez, o HBM aparecerá na próxima geração de placas gráficas da AMD. Várias suposições sobre suas características futuras fornecem algumas estimativas possíveis.

AMD Radeon R9 290XNvidia GeForce GTX Titan XFuturo carro-chefe - especulação da mídia
Memória4GB12 GB4GB
Largura de banda do chip de memória5 Gbps7 Gbps1 Gbps
Número de fichasdezesseis244
Rendimento por chip20 GB / s14 GB / s128 GB / s
Barramento de memória512 bit384 bit4096 bit
Rendimento total320 GB / s336 GB / s512 GB / s
Consumo estimado de memória30 watts31,5 watts14,6 watts

Baseado no relatório técnico , ExtremeTech e AnandTech .

All Articles