Microsoft Azure Umumkan Klaster Superkomputer NVIDIA GB300 NVL72 Pertama di Dunia untuk OpenAI

Infrastruktur AI terbesar Azure kini menghadirkan 4.600+ GPU Blackwell Ultra untuk mendukung model penalaran dan sistem AI generatif skala triliun parameter.
10 Oktober 2025 — Microsoft Azure resmi memperkenalkan seri VM NDv6 GB300, yang menghadirkan klaster superkomputer NVIDIA GB300 NVL72 pertama di dunia. Infrastruktur canggih ini dirancang khusus untuk memenuhi kebutuhan inferensi dan pelatihan AI berskala ekstrem milik OpenAI.
Klaster berskala superkomputer ini menggabungkan lebih dari 4.600 GPU NVIDIA Blackwell Ultra, dihubungkan melalui NVIDIA Quantum-X800 InfiniBand, menghasilkan sistem dengan performa, efisiensi, dan kapasitas memori yang belum pernah ada sebelumnya.
“Mewujudkan klaster NVIDIA GB300 NVL72 berskala produksi adalah pencapaian luar biasa yang melampaui sekadar silikon bertenaga tinggi. Ini mencerminkan komitmen bersama Microsoft Azure dan NVIDIA dalam mengoptimalkan seluruh lapisan pusat data AI modern,” ujar Nidhi Chappell, Corporate Vice President, Microsoft Azure AI Infrastructure.

Mesin di Balik Azure NDv6 GB300
Setiap GB300 NVL72 merupakan sistem rack-scale berpendingin cair yang menggabungkan 72 GPU Blackwell Ultra dan 36 CPU Grace dalam satu unit terpadu.
Kapasitasnya mencapai 37 TB memori cepat dan 1,44 exaflops performa FP4 Tensor Core per VM, menjadikannya ideal untuk model penalaran (reasoning models), AI agentik, dan AI multimodal berskala besar.
Platform ini juga dilengkapi teknologi baru seperti:
- NVFP4 format untuk performa pelatihan luar biasa,
- NVIDIA Dynamo compiler untuk inferensi berkecepatan tinggi, dan
- Collective communication libraries untuk efisiensi komunikasi antar-GPU.
Dalam benchmark MLPerf Inference v5.1, sistem NVIDIA GB300 NVL72 mencetak rekor dengan hingga 5× throughput per GPU lebih tinggi dibanding arsitektur Hopper, termasuk performa terbaik pada model besar seperti DeepSeek-R1 (671B) dan Llama 3.1 405B.

Jaringan Superkomputer: NVLink dan Quantum-X800 InfiniBand
Untuk menghubungkan ribuan GPU tersebut, Microsoft mengandalkan arsitektur jaringan dua lapis NVIDIA:
- NVLink Switch generasi kelima menyediakan bandwidth 130 TB/s antar-GPU dalam satu rack, menjadikannya akselerator terpadu dengan memori bersama, dan
- Quantum-X800 InfiniBand, dengan ConnectX-8 SuperNICs serta switch 800 Gb/s per GPU, memastikan komunikasi mulus antar-4.600 GPU.
Teknologi NVIDIA SHARP v4, adaptive routing, dan telemetry-based congestion control juga diintegrasikan untuk meningkatkan efisiensi pelatihan dan inferensi berskala besar.
Langkah Menuju Masa Depan AI
Pencapaian ini merupakan hasil dari kemitraan jangka panjang antara Microsoft dan NVIDIA dalam membangun infrastruktur AI kelas dunia.
Azure merekayasa ulang setiap lapisan pusat datanya — mulai dari pendinginan cairan kustom, distribusi daya, hingga software stack untuk orkestrasi dan penyimpanan.
Inovasi ini menjadi tonggak penting menuju skala ratusan ribu GPU Blackwell Ultra di pusat data Azure, memperkuat posisi Microsoft dan OpenAI di garis depan pengembangan AI generatif dan penalaran tingkat lanjut.
Sumber: NVIDIA, Microsoft Azure








