HardwareSSDsStorage

Atasi Krisis RAM, Lexar Kembangkan “AI Storage Core SSD” untuk Jalankan LLM Raksasa

Produsen media penyimpanan global, Lexar, dilaporkan tengah bereksperimen dengan teknologi radikal untuk mengubah peran SSD dalam ekosistem komputer modern. Alih-alih hanya menjadi tempat menampung file, Lexar memproyeksikan SSD masa depan sebagai penyelamat konsumen di tengah fenomena “RAMpocalypse”—situasi di mana kebutuhan kapasitas RAM melonjak drastis demi bisa menjalankan model kecerdasan buatan (AI) secara lokal.

Dalam sesi wawancara eksklusif bersama Chief Technical Officer (CTO) Lexar, Daniel Guo, terungkap bahwa biaya manufaktur memori DRAM saat ini tercatat enam kali lipat lebih mahal dibandingkan dengan memori NAND Flash. Guna menekan biaya rakitan PC AI, Lexar mengembangkan Lexar AI Storage Core SSD yang dipadukan dengan software kustom untuk memindahkan sebagian besar beban data Model Bahasa Besar (LLM) dari DRAM langsung ke dalam SSD. Pendekatan ini diklaim mampu memangkas kebutuhan memori sistem (DRAM footprint) setidaknya hingga 40%.


Sukses Uji Coba Model Qwen 3.5 122B pada PC RAM 32 GB

Sebagai pembuktian platform, Lexar melakukan pengujian internal menggunakan model AI raksasa Qwen 3.5 122B (122 miliar parameter). Secara tradisional, untuk menjalankan model sebesar ini secara lancar di tingkat lokal, pengguna setidaknya harus merogoh kocek sekitar $4.500 USD untuk membangun PC berspesifikasi tinggi dengan kapasitas RAM minimal 128 GB DRAM.

Melalui optimalisasi hibrida perangkat keras dan lunak dari Lexar AI Suite, kebutuhan sistem tersebut berhasil dipangkas secara ekstrem:

Parameter PengujianKonfigurasi Tradisional (Llama.cpp)Ekosistem Lexar AI Stack + SSD
Kebutuhan RAM MinimumMinimal 128 GB DRAMHanya butuh 32 GB DRAM
Kecepatan Sub-Model (35B)Hanya menghasilkan 5,2 tokens/detikMelesat hingga 15,6 tokens/detik
Eksekusi Model Penuh (122B)Sistem Gagal Memuat & CrashBerjalan Stabil di 4,4 tokens/detik
Konteks Besar (256K Tokens)Tidak Dapat DijalankanBerjalan Lancar di 19,3 tokens/detik (RAM 64GB)

Pada pengujian dengan kapasitas RAM 64 GB, kerangka kerja tradisional akan langsung lumpuh saat diminta membaca jendela konteks (context window) berukuran besar. Sebaliknya, stack teknologi Lexar justru mampu menangani konteks hingga 256K tokens dan menghasilkan kecepatan respons yang stabil.


Konsekuensi Teknis: Kendala Latensi TTFM

Meskipun metode pengalihan (offloading) ke NAND Flash ini sangat menghemat dompet, Daniel Guo mengakui bahwa teknologi ini belum sempurna. Hambatan terbesar dari pengalihan beban kerja ke SSD terletak pada pertumbuhan latensi sistem secara eksponensial, terutama pada parameter TTFM (Time to First Token)—jeda waktu antara pengguna menekan tombol enter hingga karakter pertama jawaban muncul di layar:

  • Konteks Kosakata 2K: Membutuhkan waktu tunggu awal sekitar 2 detik.
  • Konteks Kosakata 4K: Jeda waktu tunggu membengkak menjadi 6 hingga 8 detik.

Secara teori, arsitektur ini sanggup memuat model super raksasa hingga 400 miliar parameter. Namun, kecepatan produksi teks (tokens per second) dan TTFM-nya akan berjalan sangat lambat. Bagi pengguna yang membutuhkan kecepatan instan, berinvestasi pada kepingan DRAM fisik yang lebih besar tetap menjadi opsi yang lebih superior.


Inovasi Desain Hot-Swap Front-Panel di Computex 2026

Pada ajang Computex 2026, Lexar memamerkan implementasi fisik dari konsep ini yang diterapkan pada perangkat desktop dan Mini-PC. Lexar merancang sebuah slot M.2 khusus selebar 25 mm yang dipasang pada panel depan casing.

    [ KOMPUTER MINI / DESKTOP ]
┌─────────────────────────────────┐
│  [Slot 25mm] ◄─ (Front Panel)   │ ──► Tempat colok SSD Jaket Metal
│       │                         │     (Koneksi Jalur PCIe CPU Langsung)
│       ▼                         │
│  [Lexar SPU DRAM-less]          │ ──► Kendali Gerak Data NAND Flash 
└─────────────────────────────────┘

Unit M.2 SSD tersebut dibungkus oleh sebuah jaket pelindung logam khusus (metal jacket) dan dapat dicabut-pasang secara instan (hot-swappable) layaknya sebuah flashdisk. Konektor di dalam slot depan tersebut ditarik menggunakan jalur kabel khusus yang terhubung langsung ke jalur PCIe prosesor (CPU lanes) atau chipset utama guna memangkas hambatan data (overhead).

Media penyimpanan khusus AI ini dipastikan akan tersedia dalam varian PCIe Gen 5 (untuk bandwidth maksimal) serta PCIe Gen 4, dan digerakkan oleh kontroler DRAM-less dengan chip SPU (Storage Processing Unit) kustom buatan Lexar untuk memegang kendali penuh atas manajemen lalu lintas data.


Sumber: Lexar Technology Engineering Interview

Leave a Reply

Your email address will not be published. Required fields are marked *


Back to top button