Ryzen AI NPU su Linux per LLM: il chip dormiente che cambia il tuo homelab

Ryzen AI NPU Vs GPU per LLM nel tuo homelab: i contendenti

Per tre anni AMD ha promesso che le NPU Ryzen AI sarebbero servite a qualcosa su Linux. Per tre anni, chi ha un homelab con un mini-PC Ryzen AI ha guardato quei 50 TOPS di potenza NPU restare fermi, inutilizzati, buoni solo per le slide del marketing. L'11 marzo 2026, con Lemonade SDK 10.0 e FastFlowLM 0.9.35, le NPU hanno finalmente un motivo per esistere: inference LLM locale nel tuo homelab, su Linux, con API compatibile OpenAI.

Ma servono davvero? O è l'ennesimo giro di hype per investitori?

I numeri raccontano una storia più sfumata di quanto vorrebbero sia gli entusiasti che gli scettici. Ho messo NPU e GPU fianco a fianco, pesato i benchmark reali, ascoltato le obiezioni della community — e alla fine mi sono fatto un'idea precisa. Se state valutando un nodo AI per il vostro homelab, quello che segue vi risparmia settimane di ricerche.

Die shot AMD Ryzen AI Max Strix Halo con NPU per LLM nel tuo homelab Linux — Die shot annotato del Ryzen AI Max+ "Strix Halo" — 441mm² di silicio dove NPU, GPU e CPU convivono. Credit: Tom's Hardware / Fritzchens Fritz

Il contesto: tre anni di promesse, un solo rilascio utile

Aprile 2023: AMD lancia XDNA 1 nei Ryzen 7040 "Phoenix" con circa 10 TOPS. La NPU c'è, ma non serve a niente — nessun software la sfrutta per LLM. Ottobre dello stesso anno, AMD chiede alla community Linux se vogliono supporto Ryzen AI. La risposta è un "sì" massiccio. Poi silenzio.

Luglio 2024: il driver XDNA viene postato per review sul kernel mainline, mergiato poi in Linux 6.14 a inizio 2025. Bene, il mattone hardware c'è. Ma manca tutto il resto — il software applicativo. GAIA esce per Windows, ma su Linux ricade silenziosamente sulla iGPU via Vulkan invece di usare la NPU, come ha documentato Phoronix. A settembre 2025, Virtualization Howto titola senza mezzi termini: "NPUs in Mini PCs are Worthless for a Home Lab".

Ryzen AI NPU su Linux per LLM: il chip dormiente che cambia il tuo homelab

Articoli Correlati

ChatGPT privato in casa su LattePanda Alpha: €13 l'anno, zero cloud

Quattro switch 2.5GbE a confronto: Hasivo, MokerLink (x2) e TRENDnet — i numeri reali

Ryzen AI NPU Vs GPU per LLM nel tuo homelab: i contendenti

Il contesto: tre anni di promesse, un solo rilascio utile

Commenti (0)

Resta Aggiornato

Agente AI self-hosted? OpenHuman lo promette, il suo .env dice no

Lemonade SDK 10.0 e FastFlowLM: cosa cambia davvero

Ryzen AI NPU Vs GPU: i benchmark che contano per il tuo homelab

Throughput: la GPU domina, e non è neanche vicina

Efficienza energetica: dove la NPU ribalta il tavolo per LLM locale

Il modo ibrido NPU+iGPU: l'architettura che nessun altro ha

Le obiezioni della community — e cosa risponde il benchmark

Cosa significa per chi ha un homelab

FastFlowLM su NPU Linux: lo scenario pratico

Cosa NON può fare la NPU (ancora)

L'ecosistema intorno: GAIA, il cluster di Geerling e cosa viene dopo

Il verdetto