NVIDIA Perkenalkan GPU “Rubin CPX”: Monolithic Die dengan 30 PetaFLOPS dan 128 GB GDDR7

2 hours ago

0 1 minute read

Pada ajang AI Infra Summit, NVIDIA resmi mengumumkan Rubin CPX, sebuah GPU akselerator khusus yang dirancang untuk menangani model AI dengan konteks sangat besar. Chip ini menghadirkan performa 30 PetaFLOPS NVFP4 dalam satu monolithic die, didukung memori 128 GB GDDR7.

Berbeda dari arsitektur Blackwell maupun Blackwell Ultra yang menggunakan paket GPU ganda, Rubin CPX hadir dengan desain tunggal untuk mengatasi keterbatasan komputasi pada skenario extended-context, di mana model AI harus memproses jutaan token secara bersamaan. Kapabilitas ini sangat penting untuk aplikasi seperti analisis kode perangkat lunak berskala besar maupun pemrosesan video berdurasi jam yang bisa menuntut hingga satu juta token.

Fitur Utama Rubin CPX

Rubin CPX dilengkapi empat NVENC dan empat NVDEC encoder/decoder video langsung di dalam chip, memungkinkan alur kerja multimedia yang lebih efisien tanpa ketergantungan pemrosesan eksternal. Berdasarkan metrik internal, Rubin CPX mampu memberikan kecepatan tiga kali lipat dalam pemrosesan attention dibandingkan akselerator GB300 Blackwell Ultra saat ini.

Desain monolithic die ini dipilih untuk mengoptimalkan biaya sekaligus menjaga kepadatan komputasi, tanpa kompleksitas manufaktur multi-chip modules. Meski spesifikasi bandwidth memori belum diumumkan, penggunaan antarmuka 512-bit dengan chip GDDR7 30 Gbps berpotensi menghadirkan throughput sekitar 1,8 TB/s.

Integrasi dalam Platform Skala Rak

NVIDIA berencana mengintegrasikan Rubin CPX ke dalam Vera Rubin NVL144 CPX platform, yang menggabungkan GPU Rubin standar dengan varian CPX. Satu rak penuh konfigurasi ini ditargetkan mencapai performa 8 ExaFLOPS dengan bandwidth memori hingga 1,7 PB/s. Infrastruktur “Kyber” akan dilengkapi adapter ConnectX-9 dengan dukungan jaringan 1600G, switch Spectrum6 102,4T, serta teknologi co-packaged optics. Peluncurannya dijadwalkan pada akhir 2026, setelah debut Rubin reguler di awal tahun.

Optimalisasi untuk AI Generasi Berikutnya

Rubin CPX diposisikan sebagai varian unik dalam keluarga Rubin untuk menghadapi tantangan inferensi pada sistem AI test-time scaling. Seiring evolusi model dari sekadar generator teks menuju agen penalaran multilangkah dengan memori persisten, beban kerja inferensi terbagi menjadi dua: komputasi intensif untuk pemrosesan konteks, dan kebutuhan bandwidth tinggi untuk fase generasi token.

Arsitektur CPX dirancang untuk mengoptimalkan kedua kebutuhan tersebut. Contohnya, chip ini mampu menangani prefill konteks chatbot enterprise dengan 256.000 token, atau analisis kode komprehensif lebih dari 100.000 baris. Dengan pendekatan ini, NVIDIA berupaya menghadirkan pengalaman pengembangan AI yang lebih mulus bagi perusahaan maupun peneliti.

Sumber: NVIDIA

NVIDIA Perkenalkan GPU “Rubin CPX”: Monolithic Die dengan 30 PetaFLOPS dan 128 GB GDDR7

Fitur Utama Rubin CPX

Integrasi dalam Platform Skala Rak

Optimalisasi untuk AI Generasi Berikutnya

Read Next

NVIDIA RTX Remix Hadirkan Sistem Partikel Path-Traced untuk Visual Lebih Realistis

Intel Kirimkan Prosesor “Panther Lake” ke Samsung untuk Galaxy Book

Intel Arc B770 “Battlemage” Siap Meluncur, Masuki Tahap Persiapan Packaging

Intel Umumkan Perubahan Kepemimpinan Strategis di Divisi Data Center dan Client Computing

Intel 14A Dipastikan Lebih Mahal dari 18A, Didorong oleh High-NA EUV

AMD Tegaskan Arm ISA Tidak Lebih Efisien Dibanding x86

NVIDIA RTX Remix Hadirkan Sistem Partikel Path-Traced untuk Visual Lebih Realistis

Intel Kirimkan Prosesor “Panther Lake” ke Samsung untuk Galaxy Book

Intel Arc B770 “Battlemage” Siap Meluncur, Masuki Tahap Persiapan Packaging

Intel Umumkan Perubahan Kepemimpinan Strategis di Divisi Data Center dan Client Computing

Intel 14A Dipastikan Lebih Mahal dari 18A, Didorong oleh High-NA EUV

AMD Tegaskan Arm ISA Tidak Lebih Efisien Dibanding x86

Leave a Reply Cancel reply

Intel Tegaskan Komitmen Penuh pada Node 14A, Gandeng Pelanggan dalam Co-Design

Intel Pastikan “Arrow Lake Refresh” Hadir 2026, “Nova Lake” Meluncur Akhir 2026

Ekspansi Cerita Baru Kingdom Come: Deliverance II “Legacy of the Forge” Resmi Dirilis

Turtle Beach Rilis Tiga Aksesori Balap Baru untuk Xbox dan PC

NVIDIA Blackwell Ultra Catat Rekor Baru di MLPerf Inference v5.1

VLOG #39 | Ahmandonk Work From Home Desk Setup 2020 (4 Tips Nyaman Kerja di Rumah)

Unboxing Deepcool RGB 360

ASUS Perkenalkan Pro WS Platinum: PSU 1.600, 2.200, hingga 3.000 W untuk Workstation & AI

Biostar Rilis Developer Kit Edge AI AI‑NONXS dengan NVIDIA Jetson Orin

Synology Luncurkan DiskStation DS1825+ dan DS1525+: Solusi NAS Andal untuk Kebutuhan Bisnis dan Profesional

⚡ Razer Pokémon Collection Hadir di Lebih Banyak Pasar Global

AMD Ryzen AI 9 HX 475 dan 470 “Gorgon Point” Muncul di Shipping Manifest, Siap Jadi Penantang Intel Lunar Lake

Es Puter Cong Lik – Semarang

Stronghold: Crusader Definitive Edition Resmi Diluncurkan – RTS Klasik Kembali dengan Sentuhan Modern

Phison Umumkan Pembaruan Stabilitas Terbaru untuk Kontroler SSD

Fitur Utama Rubin CPX

Integrasi dalam Platform Skala Rak

Optimalisasi untuk AI Generasi Berikutnya

Read Next

NVIDIA RTX Remix Hadirkan Sistem Partikel Path-Traced untuk Visual Lebih Realistis

Intel Kirimkan Prosesor “Panther Lake” ke Samsung untuk Galaxy Book

Intel Arc B770 “Battlemage” Siap Meluncur, Masuki Tahap Persiapan Packaging

Intel Umumkan Perubahan Kepemimpinan Strategis di Divisi Data Center dan Client Computing

Intel 14A Dipastikan Lebih Mahal dari 18A, Didorong oleh High-NA EUV

AMD Tegaskan Arm ISA Tidak Lebih Efisien Dibanding x86

NVIDIA RTX Remix Hadirkan Sistem Partikel Path-Traced untuk Visual Lebih Realistis

Intel Arc Pro B-Series dan Xeon 6 Tunjukkan Performa AI di MLPerf Inference v5.1

Related Articles

Leave a Reply Cancel reply

Intel Tegaskan Komitmen Penuh pada Node 14A, Gandeng Pelanggan dalam Co-Design

Intel Pastikan “Arrow Lake Refresh” Hadir 2026, “Nova Lake” Meluncur Akhir 2026

Ekspansi Cerita Baru Kingdom Come: Deliverance II “Legacy of the Forge” Resmi Dirilis

Turtle Beach Rilis Tiga Aksesori Balap Baru untuk Xbox dan PC

NVIDIA Blackwell Ultra Catat Rekor Baru di MLPerf Inference v5.1

VLOG #39 | Ahmandonk Work From Home Desk Setup 2020 (4 Tips Nyaman Kerja di Rumah)

Unboxing Deepcool RGB 360

ASUS Perkenalkan Pro WS Platinum: PSU 1.600, 2.200, hingga 3.000 W untuk Workstation & AI

Biostar Rilis Developer Kit Edge AI AI‑NONXS dengan NVIDIA Jetson Orin

Synology Luncurkan DiskStation DS1825+ dan DS1525+: Solusi NAS Andal untuk Kebutuhan Bisnis dan Profesional

⚡ Razer Pokémon Collection Hadir di Lebih Banyak Pasar Global

AMD Ryzen AI 9 HX 475 dan 470 “Gorgon Point” Muncul di Shipping Manifest, Siap Jadi Penantang Intel Lunar Lake

Es Puter Cong Lik – Semarang

Stronghold: Crusader Definitive Edition Resmi Diluncurkan – RTS Klasik Kembali dengan Sentuhan Modern

Phison Umumkan Pembaruan Stabilitas Terbaru untuk Kontroler SSD

ASUS Perkenalkan Pro WS Platinum: PSU 1.600, 2.200, hingga 3.000 W untuk Workstation & AI