Nella prima parte abbiamo visto come installare LM Studio e far partire un modello AI sul proprio computer. Funziona, è gratis, è privato. Ma restano due domande oneste: ne vale davvero la pena? E soprattutto: quanto va veloce su un portatile normale, non su un server da migliaia di euro?
Per rispondere ho installato questa stessa configurazione sul mio laptop — una RTX 5080 Laptop da 16GB — e l'ho misurata. Niente numeri copiati da altri: velocità, memoria occupata e tempi presi sulla mia macchina. Ma prima, il "perché".
Perché usare l'AI in locale
Quattro motivi concreti, al di là dell'effetto "wow":
- Privacy totale. I tuoi prompt non lasciano il PC. Niente di quello che scrivi finisce su un server esterno, non viene usato per addestrare nulla, non resta in un log da qualche parte. Per documenti di lavoro, idee, dati personali, è un mondo diverso.
- Costo zero a consumo. Nessun abbonamento, nessun conteggio di token. Una volta scaricato il modello, lo usi quanto vuoi. L'unico costo è la corrente.
- Funziona offline. Aereo, treno, casa in montagna senza linea: l'AI c'è lo stesso.
- Nessun limite e nessun filtro arbitrario. Niente "hai raggiunto il limite, riprova tra un'ora". E puoi sperimentare con decine di modelli diversi liberamente.
…e i limiti, detti onestamente
Non sarei onesto se mi fermassi qui. L'AI locale non è magia:
- I modelli che girano su un PC sono più piccoli dei modelli di frontiera del cloud (GPT, Claude, Gemini). Per i ragionamenti complessi, il cloud resta avanti.
- Serve hardware. Senza una GPU decente le risposte sono lente. I 16 GB di VRAM del mio portatile sono un buon punto, ma sono comunque un limite.
- La qualità varia molto da modello a modello: bisogna provare e scegliere.
La sintesi: l'AI locale non sostituisce il cloud per tutto, ma per moltissime cose quotidiane è più che sufficiente — e con i vantaggi di cui sopra.
LM Studio e le alternative
LM Studio non è l'unico modo di far girare modelli in locale, ma è il più amichevole. Giusto per orientarsi:
- Ollama — quello che uso io di solito, ma da riga di comando: potentissimo per server e automazioni, meno per chi vuole solo aprire una finestra e chattare.
- Jan, GPT4All — altre app con interfaccia, valide alternative.




