Google Gemini 3 Tunjukkan Performa Mengagumkan, Mampu Menciptakan Game dalam Satu Prompt

November 20, 2025

2 minutes read

Google resmi merilis Gemini 3, dan hasil awalnya menunjukkan lompatan besar dalam kemampuan model AI, terutama dalam tugas-tugas kompleks seperti pembuatan game sederhana hanya dengan satu prompt. Model Gemini 3 Pro tampil impresif di berbagai benchmark dan pengujian dunia nyata, menunjukkan bahwa hype seputarnya bukan sekadar janji marketing.

Mendominasi Benchmark dan Uji Kemampuan

Gemini 3 Pro langsung mencatatkan skor tinggi pada beberapa tolok ukur utama:

LMArena Leaderboard: 1501 Elo
Humanity’s Last Exam: 37,5% (tanpa alat bantu)
GPQA Diamond: 91,9%
MMMU-Pro: 81%
Video-MMMU: 87,6%
SimpleQA Verified: 72,1% (rekor baru akurasi fakta)

Dengan skor-skor tersebut, Google mengklaim Gemini 3 Pro mampu menyelesaikan persoalan ilmiah dan matematis tingkat tinggi dengan keandalan yang jauh lebih baik dibanding generasi sebelumnya.

Demonstrasi Dunia Nyata: Game Selesai dalam Satu Prompt

Pietro Schirano, kreator MagicPath, ikut menguji kemampuan Gemini 3 Pro dalam pembuatan game. Hasilnya mengejutkan: model ini berhasil membangun editor 3D berbasis LEGO dalam satu prompt, lengkap dengan fungsi dasar yang diperlukan.

Biasanya, model bahasa besar kesulitan menangani struktur kode rumit atau lingkungan game, tetapi Gemini 3 menunjukkan peningkatan signifikan dalam:

Pemahaman struktur game
Penulisan kode berkelanjutan
Konsistensi eksekusi perintah
Pemrosesan multimodal (visual + tekstual)

Inilah yang membuat komunitas developer menyebut Gemini 3 sebagai awal era baru dalam AI-assisted coding.

Kinerja Multimodal Semakin Mapan

Kemampuan Gemini 3 tidak hanya bertumpu pada pembuatan kode. Model ini menunjukkan performa kuat pada pemahaman visual dan video, diperlihatkan lewat pencapaian tinggi pada benchmark multimodal. Google menyebut bahwa Gemini 3 kini menghadirkan reasoning yang jauh lebih konsisten dan stabil untuk tugas lintas format.

Kekurangan: Adherence Masih Jadi Tantangan

Meski unggul di banyak sisi, Gemini 3 masih kalah dalam hal adherence—kemampuan mengikuti instruksi secara ketat—dibanding Claude Code Sonnet 4.5, model yang dikenal stabil untuk CLI dan coding yang presisi.

Dalam pengujian praktis:

Claude Code lebih unggul dalam mengikuti perintah secara presisi
Gemini 3 lebih baik untuk tugas kompleks, analisis, simulasi, multimodal, dan eksplorasi ide
Untuk tugas sehari-hari atau coding detail, Sonnet 4.5 tetap pilihan lebih aman

Artinya, kedua model memiliki keunggulan masing-masing, dan pengguna bisa memilih berdasarkan kebutuhan.

Rekomendasi untuk Pengguna LLM

Gunakan Claude Sonnet 4.5 untuk tugas reguler, CLI, atau coding yang sangat presisi
Gunakan Gemini 3 Pro untuk persoalan teknis berat, eksperimen kreatif, game prototyping, sains, matematika, atau multimodal tingkat lanjut
Jika Anda naik dari Gemini 2.5 Pro, peningkatan Gemini 3 sangat terasa

Google Gemini 3 Tunjukkan Performa Mengagumkan, Mampu Menciptakan Game dalam Satu Prompt

Mendominasi Benchmark dan Uji Kemampuan

Demonstrasi Dunia Nyata: Game Selesai dalam Satu Prompt

Kinerja Multimodal Semakin Mapan

Kekurangan: Adherence Masih Jadi Tantangan

Rekomendasi untuk Pengguna LLM

Sumber: Google

Read Next

Pengguna Kecewa, Claude Fable 5 Dinilai Alami Penurunan Performa Setelah Kembali Diluncurkan

ASRock Rilis Claw Quickset, Permudah Instalasi AI Lokal di Windows Hanya dengan Beberapa Klik

Anthropic Akan Pulihkan Akses Claude Fable 5 Setelah Pembatasan Ekspor Dicabut

Anthropic Luncurkan Claude Sonnet 5, Performa Mendekati Opus 4.8 dengan Biaya Lebih Murah

OpenAI Perkenalkan Jalapeno, Akselerator Inferensi LLM Hasil Kolaborasi Bersama Broadcom

Sasar Institusi Akademik, Bocoran Web Ungkap OpenAI Uji Coba Langganan “ChatGPT for Science”

Pengguna Kecewa, Claude Fable 5 Dinilai Alami Penurunan Performa Setelah Kembali Diluncurkan

ASRock Rilis Claw Quickset, Permudah Instalasi AI Lokal di Windows Hanya dengan Beberapa Klik

Anthropic Akan Pulihkan Akses Claude Fable 5 Setelah Pembatasan Ekspor Dicabut

Anthropic Luncurkan Claude Sonnet 5, Performa Mendekati Opus 4.8 dengan Biaya Lebih Murah

OpenAI Perkenalkan Jalapeno, Akselerator Inferensi LLM Hasil Kolaborasi Bersama Broadcom

Sasar Institusi Akademik, Bocoran Web Ungkap OpenAI Uji Coba Langganan “ChatGPT for Science”

Leave a Reply Cancel reply

MSI Optimalkan Motherboard Intel Seri 800 untuk RAM DDR5 Berbasis CXMT hingga DDR5-8000+

Logitech Dikabarkan Siapkan Gaming Mouse Superstrike Generasi Kedua, Meluncur September 2026

Cougar Perkenalkan CFV220 RGB, Casing Mid-Tower Bergaya Panorama dengan Dukungan Motherboard Back-Connector

JEDEC Resmikan Standar SPHBM4, Hadirkan Bandwidth Setara HBM4 dengan Substrat Organik

Cooler Master Luncurkan HAF II 500, Casing Premium dengan Fokus Airflow Maksimal dan Operasi Lebih Senyap

VLOG #39 | Ahmandonk Work From Home Desk Setup 2020 (4 Tips Nyaman Kerja di Rumah)

Unboxing Deepcool RGB 360

Microsoft Perbaiki Masalah Audio di Windows 11 yang Dikonfirmasi Sejak Desember

Vidar Stealer 2.0: Infostealer Versi Baru Ditulis Ulang, Mencuri Data Lebih Cepat dan Lebih Sulit Dideteksi

VLOG #2 | Ke Jakarta 8 Oktober 2016

Hacker Manfaatkan HexStrike-AI untuk Eksploitasi Cepat Celah N-Day

Samsung Galaxy S25 Edge Siap Diluncurkan pada 12 Mei: Ponsel Tipis dengan Kamera 200MP

Corsair Luncurkan FRAME 4500X: Casing Modular dengan Kaca Panoramik Melengkung

AMD Dikabarkan Naikkan Harga Paket GPU Radeon hingga 10% Mulai Juli

Microsoft Uji Fitur Windows 11 yang Maksimalkan Kecepatan CPU demi Buka Aplikasi Lebih Cepat

Mendominasi Benchmark dan Uji Kemampuan

Demonstrasi Dunia Nyata: Game Selesai dalam Satu Prompt

Kinerja Multimodal Semakin Mapan

Kekurangan: Adherence Masih Jadi Tantangan

Rekomendasi untuk Pengguna LLM

Sumber: Google

Read Next

Pengguna Kecewa, Claude Fable 5 Dinilai Alami Penurunan Performa Setelah Kembali Diluncurkan

ASRock Rilis Claw Quickset, Permudah Instalasi AI Lokal di Windows Hanya dengan Beberapa Klik

Anthropic Akan Pulihkan Akses Claude Fable 5 Setelah Pembatasan Ekspor Dicabut

Anthropic Luncurkan Claude Sonnet 5, Performa Mendekati Opus 4.8 dengan Biaya Lebih Murah

OpenAI Perkenalkan Jalapeno, Akselerator Inferensi LLM Hasil Kolaborasi Bersama Broadcom

Sasar Institusi Akademik, Bocoran Web Ungkap OpenAI Uji Coba Langganan “ChatGPT for Science”

Pengguna Kecewa, Claude Fable 5 Dinilai Alami Penurunan Performa Setelah Kembali Diluncurkan

ASRock Rilis Claw Quickset, Permudah Instalasi AI Lokal di Windows Hanya dengan Beberapa Klik

Anthropic Akan Pulihkan Akses Claude Fable 5 Setelah Pembatasan Ekspor Dicabut

Anthropic Luncurkan Claude Sonnet 5, Performa Mendekati Opus 4.8 dengan Biaya Lebih Murah

OpenAI Perkenalkan Jalapeno, Akselerator Inferensi LLM Hasil Kolaborasi Bersama Broadcom

Sasar Institusi Akademik, Bocoran Web Ungkap OpenAI Uji Coba Langganan “ChatGPT for Science”

Google Search Kini Gunakan AI untuk Membuat UI Interaktif dalam Menjawab Pertanyaan Pengguna

Sneaky2FA Tambah Serangan Browser-in-the-Browser untuk Bobol Akun Microsoft 365

Related Articles

Google Search Kini Gunakan AI untuk Membuat UI Interaktif dalam Menjawab Pertanyaan Pengguna

Leave a Reply Cancel reply

MSI Optimalkan Motherboard Intel Seri 800 untuk RAM DDR5 Berbasis CXMT hingga DDR5-8000+

Logitech Dikabarkan Siapkan Gaming Mouse Superstrike Generasi Kedua, Meluncur September 2026

Cougar Perkenalkan CFV220 RGB, Casing Mid-Tower Bergaya Panorama dengan Dukungan Motherboard Back-Connector

JEDEC Resmikan Standar SPHBM4, Hadirkan Bandwidth Setara HBM4 dengan Substrat Organik

Cooler Master Luncurkan HAF II 500, Casing Premium dengan Fokus Airflow Maksimal dan Operasi Lebih Senyap

VLOG #39 | Ahmandonk Work From Home Desk Setup 2020 (4 Tips Nyaman Kerja di Rumah)

Unboxing Deepcool RGB 360

Microsoft Perbaiki Masalah Audio di Windows 11 yang Dikonfirmasi Sejak Desember

Vidar Stealer 2.0: Infostealer Versi Baru Ditulis Ulang, Mencuri Data Lebih Cepat dan Lebih Sulit Dideteksi

VLOG #2 | Ke Jakarta 8 Oktober 2016

Hacker Manfaatkan HexStrike-AI untuk Eksploitasi Cepat Celah N-Day

Samsung Galaxy S25 Edge Siap Diluncurkan pada 12 Mei: Ponsel Tipis dengan Kamera 200MP

Corsair Luncurkan FRAME 4500X: Casing Modular dengan Kaca Panoramik Melengkung

AMD Dikabarkan Naikkan Harga Paket GPU Radeon hingga 10% Mulai Juli

Microsoft Uji Fitur Windows 11 yang Maksimalkan Kecepatan CPU demi Buka Aplikasi Lebih Cepat