NVIDIA Dominasi MLPerf Training v5.1, Menang di Semua Benchmark

November 13, 2025

2 minutes read

NVIDIA kembali membuktikan dominasinya di dunia komputasi AI dengan menyapu bersih seluruh benchmark pada MLPerf Training v5.1. Dalam ajang evaluasi performa industri paling penting untuk pelatihan model AI ini, NVIDIA unggul di tujuh kategori—mulai dari large language models (LLM), image generation, hingga graph neural networks.

Tidak hanya itu, NVIDIA menjadi satu-satunya platform yang mengirim hasil untuk semua pengujian, menegaskan kedewasaan ekosistem CUDA dan fleksibilitas arsitektur GPU mereka.

Blackwell Ultra Tunjukkan Lonjakan Performa Besar

Generasi terbaru GPU NVIDIA Blackwell Ultra, melalui sistem rack-scale GB300 NVL72, berhasil mencetak debut gemilang di MLPerf Training v5.1.

Dibandingkan generasi sebelumnya (Hopper), Blackwell Ultra memberikan:

4x lebih cepat dalam pretraining Llama 3.1 405B
Hampir 5x lebih cepat untuk fine-tuning LoRA pada Llama 2 70B
15 petaflops NVFP4 compute, dukungan memori HBM3e sebesar 279 GB
Dua kali performa attention-layer compute

Arsitektur ini didukung pula oleh InfiniBand Quantum-X800, platform jaringan 800 Gb/s yang baru, menggandakan bandwidth scale-out dari generasi sebelumnya.

FP4 (NVFP4) Jadi Senjata Baru NVIDIA

Salah satu terobosan terbesar putaran ini adalah penggunaan presisi FP4 (NVFP4) untuk pelatihan LLM—dan NVIDIA merupakan satu-satunya platform yang memenuhi persyaratan akurasi MLPerf dengan FP4.

Keuntungan FP4:

Compute per GPU meningkat signifikan
Operasi matematis berjalan 2x lebih cepat dibanding FP8
Pada Blackwell Ultra, performa FP4 meningkat hingga 3x dibanding FP8

Dengan inovasi ini, NVIDIA mampu memberikan performa pelatihan model AI yang jauh lebih efisien tanpa mengorbankan hasil akhir.

Rekor Baru: Llama 3.1 405B Selesai Dilatih dalam 10 Menit

NVIDIA berhasil menetapkan rekor pelatihan baru untuk Llama 3.1 405B, menyelesaikannya hanya dalam:

➡ 10 menit

(dengan lebih dari 5.000 GPU Blackwell bekerja secara paralel)

Ini 2,7x lebih cepat dibanding hasil terbaik putaran sebelumnya.

Sebagai perbandingan:

2.560 GPU Blackwell: 18,79 menit, masih 45% lebih cepat dari rekor putaran sebelumnya dengan 2.496 GPU.

Benchmark Baru, Rekor Baru

Dua benchmark baru MLPerf Training v5.1 juga berhasil dipatahkan NVIDIA:

1. Llama 3.1 8B

Model LLM ringkas pengganti BERT-large
Time to train: 5,2 menit
Menggunakan 512 GPU Blackwell Ultra

2. FLUX.1 (Image Generation)

NVIDIA menjadi satu-satunya yang mengirim hasil
Time to train: 12,5 menit
Menggunakan 1.152 GPU Blackwell

Selain itu, NVIDIA mempertahankan posisi teratas untuk semua benchmark existing, termasuk recommender system, object detection, dan GNN.

Ekosistem Mitra Kian Luas

Sebanyak 15 organisasi besar berpartisipasi dengan hardware berbasis NVIDIA, termasuk:

ASUSTeK, Dell, Giga Computing, HPE, Lenovo, Nebius, Lambda, Supermicro, Wiwynn, Quanta, hingga Universitas Florida.

NVIDIA terus berinovasi dengan ritme tahunan—mendorong percepatan pelatihan, finetuning, dan inferensi AI untuk membawa industri ke tingkat kecerdasan baru.

NVIDIA Dominasi MLPerf Training v5.1, Menang di Semua Benchmark

Blackwell Ultra Tunjukkan Lonjakan Performa Besar

FP4 (NVFP4) Jadi Senjata Baru NVIDIA