Kartu Memori Bandwidth Tinggi Pertama AMD Akan Muncul dalam Beberapa Bulan

Jenis memori baru dirancang untuk memberikan peningkatan kinerja lebih lanjut.


Menurut AMD sendiri, perusahaan telah bertahun-tahun menetapkan jenis memori baru untuk akselerator grafis, dan sisa industri telah mengejar ketinggalan. Ini memberikan keunggulan kompetitif produk AMD, misalnya, pada saat itu, inovasi dalam bentuk GDDR5 memberikan Radeon HD 4870 kepemimpinan dalam kinerja. Akibatnya, GDDR5 menjadi standar, tetapi tujuh tahun telah berlalu sejak kemunculan pertamanya, dan tidak ada perubahan baru yang secara fundamental telah terjadi. Terobosan berikutnya adalah menyediakan standar Memori Bandwidth Tinggi. Akselerator video pertama berdasarkan itu bisa keluar dalam beberapa bulan.

Pekerjaan HBM dimulai tujuh tahun lalu, yaitu sekitar waktu yang sama ketika GDDR5 benar-benar siap. Insinyur yang sama bekerja pada teknologinya, kata karyawan AMD Joe Macri. Bahkan kemudian, mereka mulai khawatir tentang ketergantungan yang meningkat dari total daya komputasi komputer pribadi pada memori, dan mereka mulai curiga bahwa konsumsi daya secara bertahap akan menjadi pencegah.



Sekarang semuanya diperas keluar dari GDDR5. Untuk mendapatkan bandwidth tambahan, Anda harus menambahkan chip dan saluran tambahan yang menggerogoti ruang dan energi papan. Semuanya memiliki batasnya, dan kartu video generasi terbaru menunjukkannya dengan antarmuka 512-bit. Akselerasi GDDR5 biasa berhenti bekerja - tahun ini Samsung mulai memproduksi chip pada 8 Gb / s, yang merupakan peningkatan hanya 14% dari maksimum sebelumnya (7 Gb / s). AMD sudah mulai mengalami masalah dengan akselerasi lebih lanjut, karena peningkatan frekuensi berarti peningkatan tajam dalam konsumsi daya.



Salah satu solusi untuk masalah ini adalah apa yang telah dilakukan pabrikan selama beberapa dekade terakhir untuk mengurangi biaya dan energi dan meningkatkan produktivitas: integrasi. Sebagai contoh, prosesor terpusat mencakup banyak elemen, dari koprosesor matematika hingga pengontrol memori, dan dalam setiap kasus ada kelebihan. Tetapi menggabungkan memori dan GPU bukanlah proses yang sederhana, jelas Macri. Proses produksi mereka sangat berbeda sehingga kombinasi mereka pada satu chip menjadi terlalu mahal. Solusinya adalah menempatkan memori dekat dengan GPU, tetapi pada chip yang terpisah. HBM melibatkan penempatan banyak lapisan dalam konfigurasi 3D (atau, lebih tepatnya, 2.5D).







HBM terdiri dari tiga bagian utama: itu adalah chip utama (CPU, GPU atau sistem pada sebuah chip), satu atau lebih kolom memori dan lapisan silikon di mana mereka berada - interposer (perantara). Interposer adalah chip silikon biasa, yang saat ini diproduksi menggunakan teknologi proses 65 nm yang lebih lama. Macri menjelaskan bahwa peran interposer benar-benar pasif, tidak memiliki elemen aktif, karena satu-satunya tugasnya adalah menyambungkan secara elektrik trek antara memori dan prosesor. Karena ini adalah chip silikon, ia dapat menghubungkan lebih banyak elemen daripada papan biasa. Ini adalah interposer yang merupakan detail kunci dari Memori Bandwidth Tinggi. Ada elemen tradisional lain di bawah interposer, tetapi tugas mereka adalah bertukar dengan bus PCI Express, output ke monitor dan antarmuka lainnya.Semua komunikasi antara prosesor video dan memori berlangsung menggunakan interposer.



Interposer sangat menarik, tetapi fitur baru penting lainnya adalah memori berlapis. Empat lapisan memori aktual ditumpuk pada lapisan kontrol logis. Lima lapisan terhubung satu sama lain menggunakan interkoneksi dalam substrat silikon (TSV). Menurut Macri, lapisan ini sangat tipis, ketebalannya mencapai sekitar 100 mikrometer. Jika Anda mengambil satu di tangan Anda, itu akan menekuk dan melambai seperti kertas.

Dan masing-masing lapisan penyimpanan ini berisi jenis memori baru, khusus dibuat untuk kondisi kerja di HBM. Memori menggunakan tegangan yang relatif rendah - 1,3 volt (GDDR5 memiliki 1,5), frekuensi operasi yang lebih rendah (500 MHz, bukannya 1750) dan memiliki bandwidth yang lebih rendah (1 GB / s bukannya 7). Semua ini diimbangi oleh antarmuka yang sangat luas. Dalam implementasi HBM pertama, setiap lapisan memori berkomunikasi pada dua saluran 128-bit, yaitu, setiap tumpukan memiliki bus 1024-bit. Hasilnya adalah memori 4096-bit besar dengan bandwidth sekitar 128 GB / s.



Memori Bandwidth Tinggi tidak muncul dari awal. Pada 2011, AMD mengumumkan rencana untuk bermitra dengan produsen memori Hynix (sekarang SK Hynix) untuk mengembangkan dan mengimplementasikan standar memori generasi berikutnya. AMD telah membuat koneksi, interposer dan tipe memori baru. Hynix menghasilkan memori, dan sampel pertama interposer dibuat di fasilitas United Microelectronics Corporation. Standar baru telah disetujui oleh memori pengaturan industri JEDEC. Ini berarti bahwa Memori Bandwidth Tinggi dapat didukung secara luas oleh berbagai perusahaan. Dengan beberapa penundaan, HBM juga jatuh ke dalam rencana Nvidia.



Bahkan implementasi generasi pertama Memori Bandwidth Tinggi memiliki sejumlah keunggulan dibandingkan GDDR5, dan ini bukan hanya bandwidth puncak. Menurut Macri, GDDR5 memungkinkan Anda untuk mentransfer 10,66 GB / s per watt, dan dengan HBM angka ini adalah 35. Efisiensi energi dari memori adalah indikator penting, karena R9 290X menghabiskan 15-20% energi pada memori. Beralih ke HBM akan menurunkan indikator ini lebih dari dua kali.



Memori tidak hanya lebih hemat energi, tetapi juga ringkas. Satu gigabyte dalam HBM membutuhkan 35 mm², dan empat chip GDDR5 dengan ukuran yang sama menempati 672 mm² area papan. Oleh karena itu, HBM akan memungkinkan pembuatan perangkat yang lebih ringkas. Interposer diatur dengan sangat efisien, yang mengurangi ukuran kristal keseluruhan. Bahkan dimungkinkan untuk meningkatkan aliran data di dalam kartu video. Secara total, sekitar dua kali lebih sedikit area papan yang diperlukan, ini akan menyederhanakan konstruksi kartu dengan dua prosesor video. Memori era pasca-GDDR tidak hanya akan mengubah akselerator video, tetapi juga APU. Lebih banyak saluran menjanjikan waktu akses yang kurang acak. Sistem pencatatan jam kerja yang disederhanakan dan perubahan kecil lainnya berarti pengurangan potensial dalam waktu respons. Macri mengharapkan HBM untuk menembus banyak area pasar komputer.





Implementasi HBM generasi pertama memiliki minus yang penting: ukuran memori total hanya bisa mencapai 4 GB. Itu sedikit, jika Anda ingat bahwa Titan X memiliki tiga kali lipat, memori 12 GB, dan R9 290X generasi sekarang memiliki 4 GB yang sama. Bahkan batas unggulan mudah dicapai dalam resolusi 4K. Namun Macri mengklaim bahwa AMD akan mengatasi keterbatasan ini. Menurutnya, kartu video dari generasi saat ini tidak menangani memori dengan sangat efisien. Volume memori tumbuh dengan cepat, sehingga pada AMD sampai saat itu mereka tidak banyak memikirkan tentang penggunaannya.

HBM juga memiliki masalah "masa kecil" lainnya. Sebagai contoh, ukuran sirkuit mikro prosesor video tumbuh, dan interposer harus lebih besar, dan biaya produksinya dapat mencapai nilai yang sangat tinggi. Ukuran kecil HBM akan berarti masalah pendinginan yang sudah ada dalam beberapa kasus awal R9 290X. Menurut Macri, meskipun ilustrasinya menunjukkan sebaliknya, tumpukan memori hampir sama dengan prosesor video, sehingga meningkatkan total area pembuangan panas. Akhirnya, teknologi baru harus terbayar, dan untuk ini solusi baru harus diproduksi dan dijual dalam volume besar. Menurut bocoran, seri ke tiga ratus akan disajikan pada 18 Juni, dan R9 390X akan ditampilkan pada 24 Juni. Kebocoran pada foto mengisyaratkan kemungkinan pendinginan cairan.




Macri mengatakan versi kedua Memori Bandwidth Tinggi sedang dikembangkan. Throughputnya dua kali lebih tinggi dari generasi pertama, dan jumlah lapisan memori akan melonjak menjadi delapan. Melalui penggunaan teknologi proses baru, volume akan meningkat empat kali lipat. Macri yakin bahwa suatu hari nanti jumlah lapisan memori dapat bertambah menjadi 16.

Untuk pertama kalinya, HBM akan muncul di kartu grafis AMD generasi berikutnya. Berbagai asumsi tentang karakteristik masa depan mereka memberikan beberapa perkiraan yang mungkin.

AMD Radeon R9 290XNvidia GeForce GTX Titan XUnggulan masa depan - spekulasi media
Penyimpanan4 GB12 GB4 GB
Bandwidth chip memori5 Gbps7 Gbps1 Gbps
Jumlah chipenambelas244
Throughput per chip20 GB / s14 GB / s128 GB / s
Bus memori512 bit384 bit4096 bit
Total throughput320 GB / s336 GB / s512 GB / s
Taksiran Konsumsi Memori30 watt31,5 watt14,6 watt

Berdasarkan Laporan Teknologi , ExtremeTech, dan AnandTech .

All Articles