Seperti diketahui, model AI seperti GPT dan Gemini membutuhkan memori besar untuk menyimpan konteks percakapan. Proses ini dikenal dengan istilah KV cache, yang membuat penggunaan RAM jadi sangat boros.
Lewat TurboQuant, Google mengklaim teknologi ini mampu menghemat memori hingga 6 kali lipat dan membuat proses AI berjalan 8 kali lebih cepat, tanpa mengorbankan akurasi.
Klaim tersebut langsung mencuri perhatian, bahkan sempat memicu sorotan terhadap saham produsen chip besar seperti Samsung dan SK Hynix.
Meski begitu, TurboQuant masih dalam tahap pengembangan dan belum siap digunakan secara massal. Namun, jika benar-benar berhasil diterapkan, teknologi ini bisa menjadi langkah besar dalam mengatasi krisis memori di era AI.
Hai, Sobat Medcom.id! Kalau kamu punya video peristiwa menarik bisa mengirimkannya ke redaksi@medcom.id Cek Berita dan Artikel yang lain di
Google News
(rzs)