Google dikabarkan tengah mempersiapkan dua varian terbaru dari Tensor Processing Unit (TPU) generasi kedelapan yang dirancang khusus untuk kebutuhan kecerdasan buatan modern. Dua chip tersebut adalah TPUv8ax “Sunfish” yang dioptimalkan untuk pelatihan model AI, serta TPUv8x “Zebrafish” yang difokuskan pada inferensi berskala besar.
Langkah ini menegaskan semakin seriusnya Google dalam mengembangkan infrastruktur AI internal yang kini mulai menarik minat pihak eksternal. TPU generasi terbaru ini diposisikan sebagai tulang punggung komputasi untuk model AI canggih seperti Gemini, sekaligus mengurangi ketergantungan pada GPU pihak ketiga.
TPUv8ax “Sunfish” untuk Training Model AI
Untuk varian Sunfish, Google bekerja sama dengan Broadcom dan tim desain kustomnya. Kolaborasi ini mencakup desain end-to-end, subsistem memori, perangkat pendukung, hingga proses pengemasan chip. Hasilnya adalah solusi siap pakai yang dapat langsung diintegrasikan ke dalam infrastruktur server Google dalam skala besar.
TPUv8ax dirancang khusus untuk beban kerja pelatihan AI yang intensif, termasuk model bahasa besar dan sistem multimodal. Pendekatan ini memungkinkan Google mengoptimalkan performa, efisiensi daya, serta integrasi perangkat keras dan perangkat lunak secara lebih menyeluruh dibandingkan solusi generik.
TPUv8x “Zebrafish” Fokus Inference
Sementara itu, TPUv8x Zebrafish ditujukan untuk kebutuhan inferensi AI dalam skala masif. Pada varian ini, Google melibatkan MediaTek, namun dalam peran yang lebih terbatas. Google menangani sendiri pengadaan wafer dan memori langsung dari pemasok, sedangkan MediaTek berkontribusi pada chip pendukung dan proses packaging, area yang masih membutuhkan keahlian tambahan.
Strategi ini menunjukkan bahwa Google semakin memindahkan proses desain chip ke internal, sehingga ketergantungan pada mitra eksternal dapat dikurangi. Meski demikian, karena Google belum sepenuhnya menguasai desain chip full-stack, dukungan dari pihak ketiga tetap diperlukan pada aspek tertentu.
Performa Diprediksi Melampaui TPUv7
Hingga kini, detail resmi mengenai performa dan kapasitas memori TPUv8 masih belum diungkap. Namun, ekspektasi pasar cukup tinggi mengingat TPUv7 “Ironwood” sudah menawarkan performa hingga 4.614 TeraFLOPS pada presisi FP8 dengan memori HBM sebesar 192 GB. Generasi kedelapan ini diperkirakan akan menghadirkan lompatan performa yang signifikan, baik untuk training maupun inference.
Permintaan TPU Google Terus Meningkat
Minat terhadap TPU Google terus meningkat. Startup AI Safe Superintelligence Inc. (SSI) yang didirikan oleh Ilya Sutskever dilaporkan telah bermitra dengan Google Cloud untuk memanfaatkan komputasi TPUv7. Selain itu, Anthropic juga memperluas penggunaan TPUv7, dengan sebagian inferensi model Claude dijalankan di atas Ironwood.
Permintaan yang tinggi ini membuat Google diperkirakan akan menyediakan jutaan unit TPU untuk pelanggan eksternal. TPU dirancang untuk skalabilitas masif, efisiensi biaya kepemilikan, serta performa tinggi untuk training dan inference AI.
Sebagai bukti komitmen tersebut, model Gemini 3 milik Google kini dilatih dan dijalankan sepenuhnya di atas TPU, tanpa melibatkan GPU dari NVIDIA maupun AMD. Hal ini menandai babak baru dalam strategi Google untuk membangun ekosistem AI yang sepenuhnya terintegrasi dari perangkat keras hingga perangkat lunak.
Sumber: SemiAnalysis
