Categoria

Guide

Headroom in pratica: guida passo-passo e quanto risparmia davvero

Headroom si installa con pip, si mette davanti al tuo LLM come proxy e comprime gli output rumorosi — log, JSON, chunk RAG — prima che arrivino al modello. Sul mio homelab, davanti a Ollama e LM Studio, ha tagliato in media il 51% dei token. Ma con un asterisco grosso: su un log

Antonio Distefano22 giu 202610 min

Intelligenza Artificiale

Gemma 3 270M: il modello da mezzo giga che, addestrato in un pomeriggio, batte un 8B

C'è un modello di Google che pesa meno di una foto del telefono. Si chiama Gemma 3 270M — 270 milioni di parametri, circa 300 MB su disco una volta quantizzato — e la prima reazione di tutti è la stessa: "e che ci faccio con un modello così piccolo?".

Antonio Distefano20 giu 20267 min

Guide

Il miglior backup per Proxmox nel 2026: PBS, Veeam o NAKIVO?

Ogni settimana mi arriva la stessa domanda: "Antonio, qual è il miglior backup per Proxmox?". È la domanda sbagliata. È come chiedere "qual è il miglior attrezzo" senza dire se devi piantare un chiodo o stringere un bullone.

Antonio Distefano20 giu 20267 min

Guide

VPN commerciale in un homelab self-hosted: quando serve davvero

Partiamo dalla provocazione, perché me la sono fatta anch'io. Se ti sei tirato su un overlay mesh — NetBird, Tailscale, o WireGuard puro — la VPN commerciale ad abbonamento sembra una cosa per gente che non sa cosa sia un tunnel. E per buona parte di ciò che fa un homelab è esatt

Antonio Distefano19 giu 20267 min

Intelligenza Artificiale

Q3, Q4 o Q8? Quale versione di un'AI locale scaricare (la quantizzazione)

Siamo all'ultima tappa. Nei primi due articoli abbiamo installato LM Studio e misurato quanto corre su una RTX 5080 16GB; poi, nei bonus, abbiamo spinto la scheda lungo due dei suoi tre assi: la memoria del contesto e la dimensione del modello. Resta il terzo asse, e per i princi

Antonio Distefano18 giu 20265 min

Intelligenza Artificiale

Quanto grande può essere un'AI in locale? Il limite della VRAM sui 16GB

Nei primi due articoli della serie abbiamo installato LM Studio e misurato quanto corre sul mio portatile RTX 5080 16GB. Poi, nel primo bonus, abbiamo visto quanto costa la *memoria* del modello — il contesto. Oggi il secondo dei tre bonus in cui spingo la scheda al limite lungo

Antonio Distefano18 giu 20265 min

Intelligenza Artificiale

Quanto può ricordare un'AI in locale? Il limite del contesto sui 16GB

Nei primi due articoli della serie abbiamo installato LM Studio e misurato quanto corre sul mio portatile RTX 5080 16GB. Lì abbiamo visto quanta VRAM si mangia il *modello*. Ma c'è un secondo divoratore di memoria di cui quasi nessuno parla: il contesto.

Antonio Distefano18 giu 20263 min

Intelligenza Artificiale

Perché usare LM Studio (e quanto corre davvero sul mio portatile RTX 5080)

Nella prima parte abbiamo visto come installare LM Studio e far partire un modello AI sul proprio computer. Funziona, è gratis, è privato. Ma restano due domande oneste: ne vale davvero la pena? E soprattutto: quanto va veloce su un portatile normale, non su un server da migliaia

Antonio Distefano18 giu 20265 min

Intelligenza Artificiale

LM Studio: cos'è e come installarlo su Windows (guida per chi parte da zero)

C'è un'idea che a tanti sembra ancora fantascienza: avere un assistente come ChatGPT che gira tutto sul tuo computer, senza internet, senza abbonamenti, senza che una sola parola di quello che scrivi finisca sul server di qualcun altro.

Antonio Distefano18 giu 20265 min

Guide

OPNsense Business vs Community Edition: vale la differenza nel 2026?

Partiamo dalla conclusione, così non ci giriamo intorno: la Community Edition di OPNsense è gratuita, open source e completa, e per il classico homelab è la scelta giusta. Punto. Non c'è nessuna vergogna a restarci, e chi ti dice che "in produzione si usa la Business" sta confond

Antonio Distefano18 giu 20268 min

Guide

L'homelab in valigia: accesso sicuro da reti ostili con un travel router

Questa non è una recensione a benchmark. È una guida d'uso. Il prodotto è il mezzo, l'architettura è il contenuto: come ti porti dietro un perimetro fidato quando la rete sotto di te è ostile, e come da lì raggiungi l'homelab di casa senza esporre niente.

Antonio Distefano17 giu 20268 min

Intelligenza Artificiale

Agente AI scraping locale: Scrapling come MCP server, zero cloud nel tuo homelab

Dai al tuo Ollama + Open WebUI un agente AI scraping locale: Scrapling MCP server via mcpo, scraping adattivo anti-bot, tutto self-hosted senza cloud.

Antonio Distefano1 giu 20268 min

Indice completo: tutti i 29 articoli in Guide

Sfoglia l'archivio completo