Intelligenza ArtificialeOgni mese ricevo email tipo "metto Llama 3 in azienda, gratis, addio cloud". È una promessa che gira ovunque: con 200€ di hardware e un modello da 1 miliardo di parametri ti fai il tuo ChatGPT interno, paghi zero per token, i dati restano in casa.
Intelligenza ArtificialeOpenHuman si vende agente AI self-hosted privacy-first, ma il .env manda chat e integrazioni nel cloud: cosa regge come assistente AI locale open source.

21 febbraio 2026 · 4 min lettura
Upgrade rete 2.5G casa nel 2026: quale switch 2.5G economico scegliere, NIC USB o PCIe, Cat6 basta, e quando il salto da Gigabit non conviene.
Iscriviti alla newsletter per ricevere i migliori articoli direttamente nella tua inbox.
Stai pagando 20 dollari al mese per ChatGPT Plus. I tuoi prompt finiscono nei dataset di addestramento di OpenAI. E ogni volta che i loro server vanno giù, il tuo workflow si ferma.
C'è un'alternativa che nel 2026 è esplosa nelle community tech: far girare un LLM sul tuo hardware, senza internet, senza abbonamenti, senza inviare una sola riga di dati a nessuno. E la parte migliore? L'installazione richiede 10 minuti.
Tre cambiamenti hanno reso il tutto possibile:

Nota: Senza GPU i modelli girano su CPU, 5-10 volte più lento. Usabile per domande singole, non per conversazioni fluide. Una GPU NVIDIA è il singolo upgrade con più impatto.
Su Linux, un solo comando:

curl -fsSL https://ollama.com/install.sh | sh
Si installa come servizio di sistema e parte in automatico. Su macOS e Windows c'è l'installer grafico sul sito ufficiale.
ollama pull llama3:8b
Download di circa 4,7 GB. Puoi testarlo subito:
ollama run llama3:8b
Hai appena avviato un LLM sul tuo computer. Nessun account, nessun token API, nessun dato inviato fuori.
Open WebUI ti dà un'interfaccia identica a ChatGPT. Con Docker:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
Apri http://localhost:3000 nel browser, crea un account locale, e hai la tua ChatGPT personale.
Con Tailscale installato sul server e sui tuoi dispositivi, raggiungi Open WebUI da qualsiasi luogo — senza aprire porte, senza DNS dinamico, con crittografia end-to-end.
Non tutti i modelli sono uguali. Ecco una guida rapida:
Confronto diretto:
In 12-18 mesi il hardware si ripaga. Poi ogni mese risparmiato è puro guadagno. E il modello gira anche quando OpenAI ha un outage.
L'ironia è perfetta: l'industria AI spende miliardi per centralizzare l'intelligenza nei data center — e contemporaneamente produce modelli abbastanza efficienti da girare sotto la tua scrivania.
Ogni trimestre i modelli diventano più piccoli, veloci e capaci. Il trend è inequivocabile: l'AI decentralizzata non è il futuro — è il presente.
La domanda non è se l'AI locale diventerà mainstream. È quanto tempo vuoi ancora aspettare prima di smettere di pagare per qualcosa che puoi avere gratis.