AMD resmi merilis ROCm 7.0, pembaruan besar untuk platform perangkat lunak GPU terbuka yang ditujukan bagi beban kerja AI, mulai dari perangkat klien hingga skala pusat data multi-rak. Versi terbaru ini menghadirkan dukungan penuh untuk akselerator Instinct MI350 berbasis arsitektur CDNA 4, sekaligus membawa peningkatan signifikan pada efisiensi, skala, dan fleksibilitas implementasi.
Peningkatan Performa Generasional
AMD menyebut ROCm 7.0 sebagai lompatan generasi dibanding ROCm 6.0, dengan peningkatan performa hingga 3,8 kali lipat pada tugas-tugas model besar tertentu. Optimasi ini dihasilkan dari kombinasi penyempurnaan perangkat keras (termasuk pemanfaatan HBM yang lebih canggih dan dukungan tipe data baru) serta perbaikan perangkat lunak yang mempercepat throughput untuk training dan inference.
Fitur Utama ROCm 7.0
- Dukungan precision baru: FP4, FP6, dan FP8, memungkinkan penghematan memori besar dengan sedikit kompromi akurasi.
- Optimasi algoritmik: peningkatan attention dan reasoning primitives, serta teknik sparse mixture-of-experts.
- Skalabilitas cluster: komunikasi GPU-direct, inference terdistribusi dengan kompatibilitas vLLM-d dan DeepEP.
- Manajemen & orkestrasi: hadirnya AMD Resource Manager dan AI Workbench untuk monitoring serta pengelolaan cluster.
- Prebuilt Docker images: dengan contoh model terkuantisasi dan stack siap pakai untuk framework populer.
Ekosistem yang Diperluas
Selain untuk akselerator pusat data, AMD memperluas dukungan ROCm 7.0 ke prosesor Ryzen AI dan GPU Radeon RX series. Dengan demikian, pengembang dapat membangun pipeline AI yang konsisten dari edge device hingga cloud rack, mempercepat transisi dari prototipe ke produksi.
Ketersediaan
ROCm 7.0 sudah tersedia melalui portal developer AMD lengkap dengan dokumentasi, contoh implementasi, serta dukungan enterprise bagi tim yang ingin segera mengadopsinya.
Sumber: AMD
