Agente AI self-hosted? OpenHuman lo promette, il suo .env dice no

OpenHuman si vende come agente AI self-hosted desktop, "local-first, privacy-first". La sua stessa documentazione dice il contrario.

Non serve un'inchiesta. Non serve installarlo. Bastano due file pubblici del loro repository: il .env.example e la Issue #1793, aperta da un contributor e presa in carico dal team. Dicono che chat, vision, trascrizione, sintesi vocale, ricerca web e le 118+ integrazioni passano per un backend cloud proprietario, api.tinyhumans.ai. Il local-first reale si riduce a una cosa sola — gli embeddings della memoria — e quella funzione è spenta di default. Chi cerca un agente AI self-hosted, qui, trova un client desktop con un backend cloud davanti.

Il progetto è giovane: ~8.200 stelle su GitHub, GPL-3.0, repo creato il 18 febbraio 2026. Lo stesso pattern "AI agent self-hostable con migliaia di stelle" lo avevamo già analizzato con UI-TARS Desktop e i suoi requisiti hardware da datacenter. Qui il caso è opposto e più sottile: OpenHuman gira con pochi GB di RAM proprio perché il lavoro pesante non è in locale. È leggero sul tuo nodo perché non è davvero locale per le funzioni che contano.

Repository GitHub di OpenHuman, agente AI desktop open-source di tinyhumansai — Il repository OpenHuman su GitHub (tinyhumansai/openhuman, GPL-3.0)

OpenHuman come agente AI self-hosted: cosa promette e cosa fa davvero

OpenHuman è un'app desktop costruita da tinyhumansai in Rust e TypeScript su Tauri, con una mascotte animata, memoria persistente locale e 118+ integrazioni. Il README la presenta come una personal AI super intelligence privata, con tutti i dati di workflow locali e cifrati. Il punto da verificare non è cosa fa l'app — è dove finiscono i dati quando la usi davvero. E qui le fonti ufficiali del progetto raccontano due storie diverse, in pagine diverse della stessa documentazione.

La pagina GitBook Local AI elenca in modo esplicito cosa resta nel cloud, sempre: la chat ("frontier reasoning quality", il default), la vision, lo speech-to-text ("backend-proxied transcription"), il text-to-speech ("hosted") e la ricerca web ("backend proxy"). Cosa gira davvero on-device? Solo gli embeddings della memoria e la costruzione del summary-tree, con due modelli minuscoli via Ollama. Nessun ragionamento di chat, nessuna conversazione: in locale solo loop di background (heartbeat, learning). Lo scarto tra il claim e il funzionamento documentato è tutto qui.

Funzione	Dove gira di default	Local-first reale?
Chat / ragionamento	Cloud — api.tinyhumans.ai ("frontier")	No
Vision (immagini)	Cloud — backend	No
Speech-to-text	Cloud — "backend-proxied transcription"	No
Text-to-speech	Cloud — "hosted text-to-speech"	No
Ricerca web	Cloud — backend proxy (Seltz)	No
118+ integrazioni (Composio)	Cloud — via backend OpenHuman	No (Issue #1793)
Embeddings memoria	Locale via Ollama — se Local AI è ON	Sì, ma opt-in
Summary-tree (memoria)	Locale via Ollama — se Local AI è ON	Sì, ma opt-in

Agente AI self-hosted? OpenHuman lo promette, il suo .env dice no

Articoli Correlati

MoneyPrinterTurbo alla prova: 229 secondi per un video AI in locale (Parte 2)

Nvidia, $193 miliardi di chip AI e il pizzo del 25%: a pagare sono i gamer

OpenHuman come agente AI self-hosted: cosa promette e cosa fa davvero

Commenti (0)

Resta Aggiornato

Headroom compressione contesto LLM: il 90% di token in meno è hype

La contraddizione è nel repo, non nelle nostre supposizioni

L'obiezione: "ma 8.200 stelle non possono sbagliarsi"

Cosa significa per chi ha già Ollama nel proprio homelab