Categoria
Intelligenza ArtificialeHeadroom si installa con pip, si mette davanti al tuo LLM come proxy e comprime gli output rumorosi — log, JSON, chunk RAG — prima che arrivino al modello. Sul mio homelab, davanti a Ollama e LM Studio, ha tagliato in media il 51% dei token. Ma con un asterisco grosso: su un log
Intelligenza ArtificialeC'è un modello di Google che pesa meno di una foto del telefono. Si chiama Gemma 3 270M — 270 milioni di parametri, circa 300 MB su disco una volta quantizzato — e la prima reazione di tutti è la stessa: "e che ci faccio con un modello così piccolo?".