Gigantul tehnologic Google a dezvăluit recent noul său model de inteligență artificială, Gemma 4 12B, o inovație concepută special pentru a fi accesibilă utilizatorilor obișnuiți, rulând pe laptopuri cu o configurație standard de 16GB RAM. Acest pas marchează o strategie importantă a Google de a democratiza accesul la tehnologia AI, într-un moment în care cererea și costurile componentelor hardware, în special ale memoriei, au atins cote maxime.
Gemma 4 12B vine ca o completare necesară la familia de modele Gemma lansată la începutul anului, care includea opțiuni optimizate pentru dispozitive mobile (E2B și E4B) și modele mai puternice pentru sarcini complexe (26B Mixture of Experts și 31B Dense). Noul model ocupă un spațiu crucial intermediar, fiind semnificativ mai capabil decât versiunile mobile, dar fără a necesita investiții masive în acceleratoare AI, depășind cu mult pragul de 20.000 de dolari. Google susține că Gemma 4 12B se distinge prin capacitatea sa de a funcționa pe majoritatea laptopurilor de consum, fără a compromite calitatea rezultatelor.
Cerința principală pentru rularea eficientă a acestui model este prezența a 16GB de memorie RAM a sistemului sau VRAM. Această cantitate reprezintă aproximativ jumătate din necesarul modelului Gemma 4 26B MoE, iar Google afirmă că noul model este aproape la fel de performant, conform testelor de referință.
O altă caracteristică notabilă a Gemma 4 12B este capacitatea sa de a realiza raționamente complexe, pe mai mulți pași, și de a gestiona fluxuri de lucru agențiale, sarcini care anterior necesitau versiunile mai mari ale familiei Gemma. Acest lucru este posibil datorită implementării noului sistem Multi-Token Prediction (MTP). Acesta utilizează ciclurile de procesare nefolosite pentru a anticipa token-uri viitoare, rezultând o viteză și o eficiență sporite. Deși Google a lansat și versiuni MTP opționale pentru celelalte modele Gemma 4, 12B este primul care îl integrează nativ.
Eficiența modelului este sporită și de o abordare nouă a multimodalității. Familia Gemma 4 este nativ multimodală, acceptând intrări de text, audio sau imagini. Spre deosebire de majoritatea modelelor AI generative care folosesc codificatoare separate pentru date non-text, crescând latența și consumul de memorie, Gemma 4 12B dispune de un modul de embedding simplificat pentru viziune. Acesta utilizează o singură multiplicare matricială și embedding pozițional, permițând datelor să fie transmise către modelul lingvistic mare (LLM) cu o conștientizare spațială corectă, eliminând necesitatea unui intermediar complex. Pentru audio, procesul este și mai direct, semnalul audio brut fiind proiectat în aceiași vectori utilizați pentru token-urile textuale.
Modelul Gemma 4 12B este deja accesibil prin diverse platforme, inclusiv LM Studio și Google AI Edge Gallery. Cu toate acestea, adevăratul avantaj al acestui model constă în posibilitatea de a-l rula local, pe propriul dispozitiv. Fișierele cu modelul sunt disponibile pentru descărcare pe Kaggle și Hugging Face, având o dimensiune de puțin sub 18GB, fiind o soluție ideală pentru dezvoltatorii și pasionații de AI care doresc să exploreze și să utilizeze cele mai noi tehnologii pe propriile computere.

