Un assistente AI in casa sa ragionare ma non sa cosa è successo cinque minuti fa.

Se hai già messo in piedi un ChatGPT privato con Ollama + Open WebUI, conosci il limite: il modello è bravissimo a sintetizzare, scrivere codice, rispondere a domande. Ma vive in una bolla. Non legge una pagina web, non controlla una documentazione aggiornata, non sa nulla che non fosse nel suo training. Gli manca un agente AI di scraping locale: occhi per leggere internet in tempo reale senza uscire da casa. È un cervello senza occhi.

La soluzione ovvia sarebbe collegarlo a un servizio cloud di scraping — ScraperAPI, Firecrawl, ScrapingBee. E qui crolla tutto. Il senso di un'AI self-hosted è che i tuoi prompt e i dati che legge non escono da casa. Appoggiarsi a un'API esterna per leggere il web significa rispedire metà del traffico a un terzo, pagandolo. La promessa zero-cloud si rompe al primo fetch.

Scrapling risolve esattamente questo. È un framework Python di scraping adattivo (BSD-3, quasi 58k stelle su GitHub, ultima release v0.4.8 dell'11 maggio 2026) con un dettaglio che cambia le carte: ha un MCP server integrato. Lo avvii con un comando e diventa un set di tool che il tuo LLM locale può chiamare per leggere il web reale, restando interamente dentro la tua rete.

Cosa serve per un agente AI di scraping locale

Questo tutorial parte dallo stack che abbiamo già documentato: Ollama + Open WebUI in Docker. Se non ce l'hai, parti da lì — il setup è descritto nel post sul ChatGPT privato in casa. Qui aggiungiamo solo un tassello: un MCP tool server. I prerequisiti operativi sono pochi e tutti self-hosted.

Ollama + Open WebUI già funzionanti (vedi prerequisito sopra)
Un modello Ollama che supporta il tool calling — questo è il punto critico, ci torniamo sotto

Criterio	Via A — mcpo / OpenAPI	Via B — MCP nativo
Disponibilità	Sempre	Solo Open WebUI v0.6.31+
Transport	OpenAPI REST	Solo Streamable HTTP
Componenti da gestire	Open WebUI + mcpo + Scrapling	Open WebUI + Scrapling
Posizione doc ufficiale	Via preferita per la maggior parte dei deploy	Supportata, meno matura
Quando sceglierla	Setup stabile, audit/caching, default sicuro	Vuoi meno layer e sei aggiornato

Articoli Correlati

Ollama Proxmox LXC senza GPU: gotcha reali, 15 t/s CPU-only

MoneyPrinterTurbo + Ollama: video AI a costo zero in locale (Parte 1)

Agente AI scraping locale: Scrapling come MCP server, zero cloud nel tuo homelab

Cosa serve per un agente AI di scraping locale

Commenti (0)

Resta Aggiornato

MoneyPrinterTurbo: footage a tema in automatico con una patch al prompt (Parte 2.5)

Installa Scrapling e avvia l'MCP server

Collegarlo a Open WebUI: due strade

Via A — mcpo (OpenAPI), la raccomandata

Via B — MCP nativo per l'agente AI di scraping locale (Streamable HTTP)

Verifica che l'agente legga davvero il web

Perché questo conta, in un homelab