13.6 token al secondo. Su un Ryzen 7 1800X del 2017, quattro vCPU, nessuna GPU. Con llama3.2:1b che gira dentro un container LXC su Proxmox VE. Non è un numero da slide — l'ho misurato io, sul CT 130 del mio homelab, mentre analizzava log di sistema via API REST.

Se stai cercando di capire se ha senso far girare ollama proxmox lxc senza GPU, questo post è la risposta diretta. Ti mostro il setup completo — inclusi due gotcha che mi hanno fatto perdere tempo e che le guide online tendono a nascondere — e i benchmark reali per capire dove funziona e dove no.

Se vuoi il contesto su cosa fa Ollama e perché ha senso nel proprio homelab, c'è una introduzione generale a Ollama che copre le basi. Qui partiamo direttamente dal setup Proxmox.

Cosa serve per Ollama Proxmox LXC — prerequisiti e configurazione CT

Ho creato CT 130 partendo da Ubuntu 22.04 LTS con 4 vCPU, 4 GB di RAM e 15 GB su ZFS mirror. Ollama su Proxmox LXC funziona in ambiente unprivileged — nessun privilegio root nel container — e questo è il motivo per cui il processo di installazione ha due gotcha che lo script ufficiale non gestisce su Ubuntu 22.04. La configurazione minima realistica per llama3.2:1b è 4 GB di RAM: il modello occupa 1.4 GB RSS, il resto serve al sistema.

Proxmox VE 8.x con ZFS mirror sull'host
CT 130 — Ubuntu 22.04 LTS (template Proxmox standard)
4 vCPU (Ryzen 7 1800X fisico, 8-core, 16-thread)
4 GB RAM
15 GB disco su ZFS
Rete bridged, IP fisso sul VLAN homelab

Il CT va creato come unprivileged — è la modalità default e quella raccomandata. Ma richiede due opzioni che non sono attive di default e senza le quali Ollama non parte:

bash

# /etc/pve/lxc/130.conf
# Aggiungere queste righe manualmente o via UI Proxmox → Options → Features
features: keyctl=1,nesting=1

Modello	Disco	RAM usata	t/s generazione	Cold start	Warm start
qwen2:0.5b	352 MB	378 MB	15.5 t/s	170 ms	—
llama3.2:1b	1.23 GB	1.38 GB	13.6 t/s	933 ms	467 ms

Articoli Correlati

MoneyPrinterTurbo + Ollama: video AI a costo zero in locale (Parte 1)

MoneyPrinterTurbo: footage a tema in automatico con una patch al prompt (Parte 2.5)

Ollama Proxmox LXC senza GPU: gotcha reali, 15 t/s CPU-only

Cosa serve per Ollama Proxmox LXC — prerequisiti e configurazione CT

Commenti (0)

Resta Aggiornato

Agente AI scraping locale: Scrapling come MCP server, zero cloud nel tuo homelab

Installazione Ollama su LXC Ubuntu 22.04 — i due gotcha reali

Gotcha #1 — zstd mancante su Ubuntu 22.04 LXC

Gotcha #2 — il systemd unit non viene creato in LXC unprivileged

Caricare i modelli su Ollama Proxmox LXC e verificare il setup

Benchmark: qwen2:0.5b vs llama3.2:1b su CPU-only

Dove ha senso e dove no — CPU-only Ollama in produzione

Verifica finale — API REST e monitoraggio