HubsNVIDIA

NVIDIA Perkenalkan GPU “Rubin CPX”: Monolithic Die dengan 30 PetaFLOPS dan 128 GB GDDR7

Pada ajang AI Infra Summit, NVIDIA resmi mengumumkan Rubin CPX, sebuah GPU akselerator khusus yang dirancang untuk menangani model AI dengan konteks sangat besar. Chip ini menghadirkan performa 30 PetaFLOPS NVFP4 dalam satu monolithic die, didukung memori 128 GB GDDR7.

Berbeda dari arsitektur Blackwell maupun Blackwell Ultra yang menggunakan paket GPU ganda, Rubin CPX hadir dengan desain tunggal untuk mengatasi keterbatasan komputasi pada skenario extended-context, di mana model AI harus memproses jutaan token secara bersamaan. Kapabilitas ini sangat penting untuk aplikasi seperti analisis kode perangkat lunak berskala besar maupun pemrosesan video berdurasi jam yang bisa menuntut hingga satu juta token.

Fitur Utama Rubin CPX

Rubin CPX dilengkapi empat NVENC dan empat NVDEC encoder/decoder video langsung di dalam chip, memungkinkan alur kerja multimedia yang lebih efisien tanpa ketergantungan pemrosesan eksternal. Berdasarkan metrik internal, Rubin CPX mampu memberikan kecepatan tiga kali lipat dalam pemrosesan attention dibandingkan akselerator GB300 Blackwell Ultra saat ini.

Desain monolithic die ini dipilih untuk mengoptimalkan biaya sekaligus menjaga kepadatan komputasi, tanpa kompleksitas manufaktur multi-chip modules. Meski spesifikasi bandwidth memori belum diumumkan, penggunaan antarmuka 512-bit dengan chip GDDR7 30 Gbps berpotensi menghadirkan throughput sekitar 1,8 TB/s.

Integrasi dalam Platform Skala Rak

NVIDIA berencana mengintegrasikan Rubin CPX ke dalam Vera Rubin NVL144 CPX platform, yang menggabungkan GPU Rubin standar dengan varian CPX. Satu rak penuh konfigurasi ini ditargetkan mencapai performa 8 ExaFLOPS dengan bandwidth memori hingga 1,7 PB/s. Infrastruktur “Kyber” akan dilengkapi adapter ConnectX-9 dengan dukungan jaringan 1600G, switch Spectrum6 102,4T, serta teknologi co-packaged optics. Peluncurannya dijadwalkan pada akhir 2026, setelah debut Rubin reguler di awal tahun.

Optimalisasi untuk AI Generasi Berikutnya

Rubin CPX diposisikan sebagai varian unik dalam keluarga Rubin untuk menghadapi tantangan inferensi pada sistem AI test-time scaling. Seiring evolusi model dari sekadar generator teks menuju agen penalaran multilangkah dengan memori persisten, beban kerja inferensi terbagi menjadi dua: komputasi intensif untuk pemrosesan konteks, dan kebutuhan bandwidth tinggi untuk fase generasi token.

Arsitektur CPX dirancang untuk mengoptimalkan kedua kebutuhan tersebut. Contohnya, chip ini mampu menangani prefill konteks chatbot enterprise dengan 256.000 token, atau analisis kode komprehensif lebih dari 100.000 baris. Dengan pendekatan ini, NVIDIA berupaya menghadirkan pengalaman pengembangan AI yang lebih mulus bagi perusahaan maupun peneliti.


Sumber: NVIDIA

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button