
NVIDIA memperkenalkan CUDA Tile dalam rilis CUDA 13.1, yang disebut sebagai lompatan terbesar sejak platform CUDA pertama kali hadir pada 2006. Inovasi ini menghadirkan virtual instruction set untuk tile-based parallel programming, memungkinkan developer menulis algoritma pada level lebih tinggi tanpa harus berurusan langsung dengan detail hardware khusus seperti tensor cores.
Konsep Utama CUDA Tile
- Abstraksi tensor cores: kode berbasis CUDA Tile kompatibel dengan arsitektur tensor core saat ini maupun mendatang.
- Tile-based programming: developer mendefinisikan operasi pada chunks data (tiles), bukan per elemen.
- Compiler & runtime: otomatis menangani eksekusi detail, memudahkan portabilitas lintas GPU generasi baru.
- Analogi: mirip paradigma Python/NumPy, di mana operasi bulk dilakukan dengan kode sederhana.

CUDA Tile IR
- Intermediate Representation (IR): fondasi tile programming.
- Memperkenalkan virtual instruction set untuk operasi tile.
- Memungkinkan eksekusi efisien di berbagai generasi GPU dengan perubahan minimal.
- Analogi: CUDA Tile IR untuk tile programming ≈ PTX untuk SIMT programming.
- Mendukung pengembangan compiler, frameworks, dan domain-specific languages (DSLs) berbasis NVIDIA hardware.
Integrasi dengan Ekosistem
- SIMT & Tile coexist: developer bisa tetap menulis kernel SIMT tradisional, atau tile kernels untuk tensor cores.
- cuTile Python: implementasi Python resmi NVIDIA yang menggunakan CUDA Tile IR sebagai backend.
- Dokumentasi, repositori GitHub, dan contoh kode tersedia di halaman resmi CUDA Tile.
Implikasi
- AI workloads: tile programming memudahkan pemanfaatan tensor cores untuk operasi berbasis tensor.
- Produktivitas developer: abstraksi lebih tinggi → kode lebih ringkas, portabel, dan siap untuk GPU masa depan.
- Ekosistem CUDA: membuka jalan bagi compiler dan framework generasi baru yang lebih fokus pada data-parallel workloads.
Sumber: NVIDIA









