HubsNVIDIA

NVIDIA Dominasi MLPerf Training v5.1, Menang di Semua Benchmark

NVIDIA kembali membuktikan dominasinya di dunia komputasi AI dengan menyapu bersih seluruh benchmark pada MLPerf Training v5.1. Dalam ajang evaluasi performa industri paling penting untuk pelatihan model AI ini, NVIDIA unggul di tujuh kategori—mulai dari large language models (LLM), image generation, hingga graph neural networks.

Tidak hanya itu, NVIDIA menjadi satu-satunya platform yang mengirim hasil untuk semua pengujian, menegaskan kedewasaan ekosistem CUDA dan fleksibilitas arsitektur GPU mereka.


Blackwell Ultra Tunjukkan Lonjakan Performa Besar

Generasi terbaru GPU NVIDIA Blackwell Ultra, melalui sistem rack-scale GB300 NVL72, berhasil mencetak debut gemilang di MLPerf Training v5.1.

Dibandingkan generasi sebelumnya (Hopper), Blackwell Ultra memberikan:

  • 4x lebih cepat dalam pretraining Llama 3.1 405B
  • Hampir 5x lebih cepat untuk fine-tuning LoRA pada Llama 2 70B
  • 15 petaflops NVFP4 compute, dukungan memori HBM3e sebesar 279 GB
  • Dua kali performa attention-layer compute

Arsitektur ini didukung pula oleh InfiniBand Quantum-X800, platform jaringan 800 Gb/s yang baru, menggandakan bandwidth scale-out dari generasi sebelumnya.


FP4 (NVFP4) Jadi Senjata Baru NVIDIA

Salah satu terobosan terbesar putaran ini adalah penggunaan presisi FP4 (NVFP4) untuk pelatihan LLM—dan NVIDIA merupakan satu-satunya platform yang memenuhi persyaratan akurasi MLPerf dengan FP4.

Keuntungan FP4:

  • Compute per GPU meningkat signifikan
  • Operasi matematis berjalan 2x lebih cepat dibanding FP8
  • Pada Blackwell Ultra, performa FP4 meningkat hingga 3x dibanding FP8

Dengan inovasi ini, NVIDIA mampu memberikan performa pelatihan model AI yang jauh lebih efisien tanpa mengorbankan hasil akhir.


Rekor Baru: Llama 3.1 405B Selesai Dilatih dalam 10 Menit

NVIDIA berhasil menetapkan rekor pelatihan baru untuk Llama 3.1 405B, menyelesaikannya hanya dalam:

➡ 10 menit

(dengan lebih dari 5.000 GPU Blackwell bekerja secara paralel)

Ini 2,7x lebih cepat dibanding hasil terbaik putaran sebelumnya.

Sebagai perbandingan:

  • 2.560 GPU Blackwell: 18,79 menit, masih 45% lebih cepat dari rekor putaran sebelumnya dengan 2.496 GPU.

Benchmark Baru, Rekor Baru

Dua benchmark baru MLPerf Training v5.1 juga berhasil dipatahkan NVIDIA:

1. Llama 3.1 8B

  • Model LLM ringkas pengganti BERT-large
  • Time to train: 5,2 menit
  • Menggunakan 512 GPU Blackwell Ultra

2. FLUX.1 (Image Generation)

  • NVIDIA menjadi satu-satunya yang mengirim hasil
  • Time to train: 12,5 menit
  • Menggunakan 1.152 GPU Blackwell

Selain itu, NVIDIA mempertahankan posisi teratas untuk semua benchmark existing, termasuk recommender system, object detection, dan GNN.


Ekosistem Mitra Kian Luas

Sebanyak 15 organisasi besar berpartisipasi dengan hardware berbasis NVIDIA, termasuk:

ASUSTeK, Dell, Giga Computing, HPE, Lenovo, Nebius, Lambda, Supermicro, Wiwynn, Quanta, hingga Universitas Florida.

NVIDIA terus berinovasi dengan ritme tahunan—mendorong percepatan pelatihan, finetuning, dan inferensi AI untuk membawa industri ke tingkat kecerdasan baru.

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button