Proxmox cluster 2 nodi: Corosync, QDevice e HA reale

3 voti, quorum 2, token 1000 millisecondi. Sono i tre numeri che tengono in piedi il mio cluster Proxmox a 2 nodi. Tre numeri che decidono, ogni due secondi, se i container sono vivi o morti. Se il cluster resiste o si spezza in due.

Nella Parte 1 ho spiegato perché tratto il mio homelab come un datacenter. Qui entro nel come: Corosync, QDevice su un Raspberry Pi 5, High Availability su 4 container, replica ZFS ogni 15 minuti. E soprattutto, i limiti che nessun tutorial vi mostra.

Cluster Proxmox a 2 nodi e lo split-brain: il problema reale

Un cluster Proxmox a 2 nodi ha un problema strutturale. Quando i nodi perdono contatto, ognuno crede di essere l'unico sopravvissuto. Entrambi provano a prendere il controllo delle risorse. Il risultato si chiama split-brain: due nodi che scrivono sugli stessi volumi, due istanze dello stesso container, corruzione dati.

Proxmox risolve con il quorum: serve una maggioranza di voti per operare. Con 2 nodi hai 2 voti. La maggioranza è 2. Se un nodo muore, l'altro ha 1 voto su 2 richiesti. Nessuno può operare. Cluster bloccato.

Serve un terzo voto — un arbitro esterno che rompa il pareggio.

Corosync e knet: come i nodi si parlano

Corosync è il cuore della comunicazione cluster. Nel mio setup usa il transport knet con autenticazione cifrata, ip_version ipv4-6 e link_mode passive. Il token è impostato a 1000 millisecondi: se un nodo non risponde entro due cicli, viene dichiarato morto.

Due secondi. È il tempo che passa tra "tutto ok" e "failover in corso".

È anche il tempo in cui un falso positivo può mandare a terra il cluster. Token troppo basso e avrai failover fantasma. Troppo alto e un nodo morto resterà lì a marcire mentre i servizi sono giù.

bash

# /etc/pve/corosync.conf (estratto)
totem {
    version: 2
    cluster_name: homelab-cluster
    transport: knet
    token: 1000
    ip_version: ipv4-6
    link_mode: passive
    secauth: on
}

quorum {
    provider: corosync_votequorum
    expected_votes: 3
    device {
        votes: 1
        model: net
        net {
            algorithm: ffsplit
            host: 10.0.10.1
        }
    }
}

La sezione quorum mostra il punto chiave: expected_votes 3 con un QDevice che aggiunge il terzo voto. L'algoritmo ffsplit assegna il voto al sottoinsieme che mantiene il maggior numero di nodi attivi. Nel nostro caso, con 2 nodi, il voto va sempre al sopravvissuto.

CT	Nome	Cores	RAM	Ruolo
104	docker-proxy	2	512 MB	Reverse proxy per tutti i servizi
110	hlabz-wb	4	1536 MB	Sito homelabz.cc (produzione)
112	differenziata-facile	2	768 MB	App pubblica, utenti attivi
121	authentik	4	3072 MB	SSO per tutti i servizi interni

Parametro	pve (master)	pve2 (failover)
CPU	Ryzen 7 1800X (8C/16T)	i7-6700K (4C/8T)
RAM totale	47 GB	7.7 GB
RAM disponibile	31 GB	4.5 GB
Swap usato	0 GB	1.3 GB
RAM richiesta HA	5.75 GB	5.75 GB
Bridge di rete	vmbr0, vmbr1, vmbr2	solo vmbr0

Cluster Proxmox con 2 nodi: Corosync, QDevice e HA — come funziona il failover con dati reali

Articoli Correlati

ZFS, backup e disaster recovery — i buchi che ho trovato nel mio homelab

SSO e 2FA su tutto con Authentik — un login per il tuo homelab di produzione

Cluster Proxmox a 2 nodi e lo split-brain: il problema reale

Corosync e knet: come i nodi si parlano

Commenti (0)

Resta Aggiornato

VM vs LXC su Proxmox: 17 container, zero VM e la matematica che decide

QDevice su Raspberry Pi: l'arbitro a costo zero

HA e replica ZFS: cosa proteggo e perché

Limiti e compromessi del mio cluster Proxmox a 2 nodi

Roadmap: come correggo i limiti

Aggiornamento — aprile 2026

La serie completa