Jumat, Januari 17

Jakarta

Sejumlah konsumen kelas kakap Nvidia disebut menunda pesanan chip AI Blackwell terbaru. Penyebabnya adalah keluhan overheating dan masalah konektivitas pada chip tersebut.

Dilansir The Information, rak Blackwell GB200 yang merupakan komponen penting di data center AI, menunjukkan sejumlah masalah pada penggunaan awal. Salah satunya adalah konsumsi listrik yang sangat besar.

Setiap rak Blackwell GB200 itu mengkonsumsi listrik antara 120-132 kW. Konsumsi listrik yang sangat besar ini membuat sistem tersebut harus diimbangi dengan sistem pendingin yang mumpuni. Dan, sayangnya, sistem pendingin tradisional tak mampu mengatasi panas yang dihasilkan dari komponen dengan konsumsi listrik setinggi itu.


Selain itu, pada rak Blackwell versi awal ditemukan masalah interkoneksi, yang menambah panjang masalah selain overheating. Masalah interkoneksi ini terjadi dalam sambungan antara satu chip dengan chip lainnya.

Sebagai informasi, sebuah rak GB200 bisa berisi hingga 72 chip Blackwell. Dan desain rak server yang ada saat ini terbukti tak mampu menangani panas yang dihasilkan oleh chip tersebut.

Alhasil Nvidia pun meminta perubahan desain dari pemasoknya. Selain itu, memecahkan masalah ini membutuhkan kombinasi dari banyak hal, seperti optimasi di tingkat chip, pengembangan solusi pendinginan, serta perubahan total pada infrastruktur rak server.

Masalah yang dialami Blackwell ini membuat perusahaan seperti Amazon Web Services, Google, Microsoft, dan Meta untuk sementara mengurangi pesanan rak GB200. Padahal, perusahaan-perusahaan teknologi kelas kakap itu sudah memesan Blackwell senilai lebih dari USD 10 miliar.

Misalnya Microsoft yang awalnya berencana mengoperasikan rak GB200 berisi setidaknya 50 ribu chip Blackwell di data center mereka di Phoenix, Amerika. Namun akibat masalah ini, mitra AI Microsoft OpenAI mengubah pesanannya menjadi chip Hopper yang lebih jadul.

Dampaknya bagi Nvidia pun langsung terasa, sahamnya anjlok 4% setelah kabar penundaan pesanan ini tersebar.

CEO Nvidia Jensen Huang juga pernah menepis tudingan overheating ini. Menurutnya, dalam pengujian awal, rak server berisi 72 chip Blackwell ini bisa dijinakkan menggunakan sistem pendingin air.

(asj/rns)

Membagikan
Exit mobile version