Self-HostingAccesso remoto al tuo server di casa senza port forwarding né firewall aperto: NetBird usa WireGuard P2P e funziona gratis fino a 100 device.
GuideUpgrade rete 2.5G casa nel 2026: quale switch 2.5G economico scegliere, NIC USB o PCIe, Cat6 basta, e quando il salto da Gigabit non conviene.

22 maggio 2026 · 14 min lettura
Come far girare ollama proxmox lxc senza GPU: zstd mancante, systemd da zero, 13-15 t/s reali con llama3.2 su CPU AMD Ryzen.
Iscriviti alla newsletter per ricevere i migliori articoli direttamente nella tua inbox.
RTX 5070 vs RTX 5090, maggio 2026: 576 euro contro 3.544 euro per la coppia di schede più chiacchierate dell'anno. Sei volte il prezzo, +54% a 1440p, +91% a 4K, 12 GB di VRAM contro 32 GB. Numeri che messi in fila sembrano risolvere la domanda da soli, e invece no. Perché la scelta tra queste due schede non si decide guardando la barretta del benchmark, ma capendo cosa ci farai davvero — gaming a 1440p, gaming a 4K, inference LLM in locale, rendering 3D — e quanto ti pesa la bolletta a fine mese.
Questa guida non risponde "compra la X". Risponde "se fai Y con budget Z, allora ha senso la X — e qui il perché in numeri". Sono due schede che nel mercato 2026 non si toccano nemmeno: la 5070 è il sweet spot 1440p mainstream, la 5090 è l'unica consumer GPU che porta in pancia 32 GB di GDDR7 e fa girare un Qwen 2.5 32B in Q4 nativo. In mezzo c'è il deserto dei prezzi reali italiani, il TDP da 575W che ti raddoppia i consumi, e un refresh SUPER che NVIDIA ha rinviato a Q3 2026 — variabile non trascurabile per chi può aspettare.
Le differenze tra RTX 5070 e 5090 sono sostanzialmente tre, e una sola pesa sulla decisione d'acquisto. Sul fronte raw performance, la 5090 monta 21.760 CUDA cores contro i 6.144 della 5070 — 3,5 volte tanto — su un bus a 512-bit invece che 192-bit. Tradotto in frame rate, secondo i sei benchmark aggregati da technical.city, parliamo di +54% in rasterizzazione media a 1440p e +91% a 4K. Sono numeri grandi, ma prevedibili: è il salto da fascia mainstream a flagship enthusiast, lo stesso che vedi tra 4070 e 4090 lo scorso ciclo.
La seconda differenza è il TDP: 250W contro 575W. Vuol dire alimentatore raccomandato da 650W per la 5070 e da 1000W per la 5090, e — vedremo dopo — circa 142 euro all'anno di elettricità in più solo per 4 ore di gaming al giorno alle tariffe italiane attuali.
La terza differenza è la VRAM, ed è quella che decide la scelta: 12 GB GDDR7 sulla 5070, 32 GB GDDR7 sulla 5090. Per il gaming puro a 1440p, oggi, 12 GB bastano nel 95% dei titoli. Per il path tracing 4K — testato da Hardware Upgrade su Indiana Jones — i 12 GB della 5070 saturano e perdi frame. Per l'inference LLM in locale via Ollama o llama.cpp, la differenza non è di grado ma di natura: la 5070 si ferma ai modelli 7-9B in Q4, la 5090 gestisce 32B in Q4 senza offload. Stesso chip Blackwell, due workload completamente diversi.
Da qui in poi entriamo nei dettagli scheda per scheda, con i prezzi reali italiani trovati su trovaprezzi e idealo a maggio 2026 — perché l'MSRP NVIDIA, in Italia, esiste solo nei comunicati stampa.
La RTX 5070, lanciata il 5 marzo 2025 a un MSRP italiano di 659 euro (poi rivisto verso il basso quando l'euro si è rafforzato sul dollaro), oggi si trova su trovaprezzi a partire da 576 euro — INNO3D Twin X2 — con disponibilità buona e diversi modelli custom nella fascia 580-610 euro. È la fascia di prezzo che storicamente piace di più al mainstream PC gaming, ed è anche dove NVIDIA fa più volume.

Sui 1440p — la risoluzione che condivide la fetta più ampia del mercato monitor gaming — la 5070 macina qualsiasi titolo AAA del 2025-2026 in rasterizzazione con frame rate confortevoli, e con DLSS 4 Multi Frame Generation diventa l'opzione più sensata per chi gioca a 144 Hz su un pannello 2560x1440. Hardware Upgrade nella sua recensione l'ha definita "come una 4090" nei titoli ottimizzati per il MFG, con tutte le cautele del caso sul frame interpolato.
Anche sul 4K la 5070 regge in molti scenari, ma con compromessi: rasterizzazione pura sì, ray tracing con MFG attivo sì, path tracing maxed out no. Cyberpunk 2077 a 4K rasterizzazione gira intorno ai 50 FPS, accettabile ma non più "flagship feeling".
Qui sta il dibattito vero, e nessuna recensione italiana l'ha mancato. Tom's Hardware Italia ha dato alla scheda 7/10 proprio per i 12 GB ritenuti limitanti — "in Indiana Jones abilitiamo il path tracing, i 12 GB di VRAM vengono saturati", scrive Hardware Upgrade. La community su HardForum è ancora più dura: chi compra una 70-class la tiene 3-4 anni, e con i giochi Unreal Engine 5 path-traced del 2027-2028 la 5070 sarà strozzata dalla VRAM ben prima che dai CUDA cores. Tom's Hardware Italia suggerisce esplicitamente di non firmare al day-one ma di confrontare con le proposte AMD RDNA4 da 16 GB a prezzi simili, prima di mettere mano al portafoglio.
È una critica fondata. Ma va contestualizzata: se la tua build è 1440p e cambi GPU ogni 2 anni, i 12 GB non sono un problema oggi e probabilmente non lo saranno nei prossimi 18 mesi. Se invece punti a tenerla 4+ anni con la prospettiva di passare al 4K, allora la conversazione si sposta sulla 5070 Ti (16 GB) o sulla 5070 SUPER da 18 GB attesa per Q3 2026 — di cui parliamo più avanti.
La RTX 5090 esce dalla logica gaming consumer e atterra in territorio prosumer/workstation. Sulla carta è una scheda gaming — 21.760 CUDA cores Blackwell, 32 GB GDDR7 su bus 512-bit, 575W di TGP, MSRP US 1.999 dollari. Nei fatti, nel maggio 2026 italiano, è l'unica scheda consumer che permette di far girare in locale modelli LLM da 32 miliardi di parametri quantizzati a 4 bit senza offload su CPU. Non è un dettaglio nerd: è la differenza tra usare DeepSeek-R1 32B come strumento di lavoro quotidiano o pagare l'API.

Il listino reale è ben oltre il listino teorico. La più economica trovata su trovaprezzi a maggio 2026 è la Gigabyte AORUS Master ICE a 3.544,15 euro. ASUS TUF Gaming oscilla tra 3.629 e 3.866 euro, Zotac Solid OC sta a 3.764,50 euro, e si arriva fino ai 4.270-4.509 euro della ASUS ROG Astral OC. Disponibilità limitata, molti modelli marcati come non disponibili sui maggiori e-tailer. La Founders Edition a MSRP EU di 2.389 euro? Introvabile dal day-one, ne avevamo già scritto nella tabella prezzi 5090 dedicata, e la situazione non è cambiata.
Tradotto: chi vuole una 5090 oggi paga +48% sull'MSRP teorico EU. È una bolla domanda enthusiast/AI che persiste, alimentata da chi compra la scheda per inference o rendering — non per giocare a Cyberpunk 2077.
Prima di mettere 3.500 euro su una scheda video, c'è un capitolo che vale la pena leggere. Il driver NVIDIA 595.71 — distribuito a fine 2025 — ha causato morti improvvise di RTX 5090 per via di un cambio nella curva voltaggio: abbiamo documentato il caso quando è esploso, con utenti che hanno visto la propria scheda da 3.500 euro diventare un mattoncino dopo un aggiornamento di routine. NVIDIA ha rilasciato un hotfix, ma la dinamica racconta qualcosa di importante: la 5090 è una scheda spinta al limite termico-elettrico, e il margine d'errore — lato driver, lato firmware, lato BIOS partner — è più stretto del solito.
Non è un motivo per non comprarla. È un motivo per metterla in build con un alimentatore di qualità (1000W minimo, 1200W consigliato), evitare overclock aggressivi nelle prime settimane di un nuovo driver, e tenere d'occhio i forum quando esce un major release. La 5070, con il suo 250W di TDP, di questi grattacapi non ne ha.
Sul fronte gaming, la 5090 macina 4K maxed out senza compromessi nella maggior parte dei titoli, e con DLSS 4 MFG resta l'unica scheda 2026 capace di tenere 4K + path tracing sopra i 100 FPS nei titoli più pesanti. Sul fronte AI inference — quello che giustifica davvero il prezzo per chi non gioca solo — i benchmark Ollama di databasemart misurano 149,95 tok/s su Llama 3.1 8B Q4, 89,93 tok/s su Qwen 2.5 14B Q4, 45,07 tok/s su Qwen 2.5 32B Q4 e 45,51 tok/s su DeepSeek-R1 32B Q4. Con offload minimo CPU per gli ultimi layer, arriva persino a Llama 3.3 70B Q4_K_M a 15-18 tok/s. Per metterla in prospettiva: 45 tok/s su un modello da 32 miliardi di parametri è velocità di lettura confortevole — leggermente sopra il ritmo di scrittura umana — il che vuol dire che la 5090 trasforma l'inference 32B da esperimento da weekend a strumento di lavoro.
Per chi gestisce un homelab AI — argomento che abbiamo affrontato calcolando i costi hardware reali di un LLM in locale — la 5090 è oggi l'unico modo per replicare in casa l'esperienza utente di un API tier mid (DeepSeek, Claude Haiku) senza compromessi di latenza.
Vale la pena fermarsi un attimo sulla questione VRAM, perché incarna un cambio di prospettiva nel mercato GPU 2026. Fino al 2023, la VRAM era una metrica gaming: serviva per texture pack alte, asset 4K, in qualche caso pesante con ray tracing. Il salto qualitativo è arrivato con la diffusione dell'inference LLM locale: improvvisamente la VRAM smette di essere quanti GB occupano le texture e diventa quale modello mi sta in memoria.
Per dare un'idea concreta dei limiti: Llama 3.1 8B in Q4_K_M occupa circa 5,4 GB, sta comodamente nei 12 GB della 5070 con context window completa. Qwen 2.5 14B Q4_K_M occupa circa 9,5 GB — entra, ma riduci context o batch. Llama 4 Scout 17B Q4_K_M sui 10 GB — sei al limite, KV cache permettendo. Qwen 2.5 32B Q4_K_M? 19,5 GB. Fuori. Devi quantizzare a Q3 o Q2 perdendo qualità, oppure offloadare layer su CPU pagando latenza pesante (parliamo di un ordine di grandezza in meno di tok/s rispetto all'esecuzione full-GPU).
Per misurare il limite concreto della tua build, Ollama con Open WebUI è il benchmark VRAM-cap più immediato: prova a far girare i modelli che ti interessano e vedi cosa entra e cosa no. Il numero della VRAM su una scheda nel 2026 non è più una metrica gaming, è il vincolo che decide quali use case ti restano accessibili.
Tornando al punto: questa è la ragione vera per cui i 12 GB della 5070 sono diventati il topic dell'anno. Non è il gaming del 2026 a renderli scarsi. È il fatto che chi compra una GPU mid-range oggi spesso ci fa anche AI in locale, e in quel mondo 12 GB sono il primo gradino della scala.
Ridotta all'osso, la decisione di acquisto si gioca su sette parametri: prezzo street italiano, VRAM, performance gaming a 1440p e 4K, TDP e relativi costi operativi, capacità AI in locale, e disponibilità reale. Questa tabella mette i numeri uno accanto all'altro — niente metriche di marketing, solo quello che cambia la spesa o l'esperienza d'uso quotidiana.
Sui costi operativi serve un chiarimento. Il delta di consumo tra le due schede sotto carico gaming è di circa 325W (575 - 250). Quattro ore di gioco al giorno per 365 giorni fanno 1.460 ore l'anno, che moltiplicate per 0,325 kW danno 474,5 kWh annui di energia extra. Alla tariffa media tutto compreso del mercato libero italiano a maggio 2026 — circa 0,30 €/kWh — sono 142 euro in più all'anno solo per il gaming, senza contare l'idle a desktop e i workload AI sostenuti.
Qui i numeri diventano consigli. Non esiste una raccomandazione assoluta tra 5070 e 5090 — esistono profili d'uso, e per ognuno una delle due scelte ha più senso dell'altra. Quattro scenari coprono il 90% dei lettori che stanno valutando l'acquisto in questo periodo.
Se giochi su un monitor 2560x1440 a 144 o 165 Hz e non hai pretese di path tracing maxed out, la 5070 a 576-610 euro è la scelta razionale del 2026. DLSS 4 MFG fa da tie-breaker contro le alternative AMD nella stessa fascia: in Cyberpunk 2077, Alan Wake 2 e tutti i titoli con MFG nativo, il delta di frame rate giustifica il premio NVIDIA. Spendere oltre 700 euro per giocare a 1440p oggi è sovradimensionare, salvo casi specifici di simulatori VR pesanti.
Questo è lo scenario scomodo. La 5070 sul 4K mostra i suoi limiti VRAM, la 5090 a 3.500+ euro per puro gaming è uno spreco. La risposta sensata è guardare altrove: la 5070 Ti con 16 GB resta la scheda 4K mainstream più equilibrata, oppure — se i tempi te lo permettono — aspettare la 5070 SUPER da 18 GB attesa per Q3 2026 (luglio-settembre). Comprare una 5090 solo per giocare a 4K significa pagare il triplo per il +91% di performance, e usarla al 40% delle sue capacità reali. Aggiungi che la 5090 ha quel margine ridotto su firmware, driver e curva voltaggio di cui parlavamo prima, e capisci perché in molti — nel forum HardForum come negli store italiani — stanno aspettando il refresh prima di firmare ordini sui 3.500 euro.
Se l'obiettivo è far girare Qwen 2.5 32B, DeepSeek-R1 32B o anche Llama 3.3 70B in locale come strumento di lavoro quotidiano, la 5090 è oggi l'unica consumer GPU che lo permette senza compromessi inaccettabili. La 5070 con i suoi 12 GB ti relega a Mistral 7B, Llama 3.1 8B, Qwen 2.5 7B in Q4 — modelli validi, ma di una categoria sotto. L'alternativa è non spendere e usare API esterne: con i 3.500 euro della 5090 paghi 3-4 anni di Claude Haiku o DeepSeek API a uso quotidiano intenso. La scelta dipende da privacy, latenza, e da quanto ami il controllo della tua infrastruttura. Un secondo fattore da considerare è il costo energetico cumulato: una 5090 sotto carico inference 12-16 ore al giorno spinge la bolletta di 400 euro l'anno oltre l'idle base, cifra che va sommata al prezzo d'acquisto quando confronti il TCO con un servizio cloud.
Per Blender Cycles in scene complesse, DaVinci Resolve con timeline 4K multi-stream, e generazione Stable Diffusion/Flux con LoRA multiple ad alta risoluzione, i 32 GB della 5090 fanno la differenza vera. Se rendering e editing sono il tuo lavoro — non un hobby — il ritorno sull'investimento di una 5090 si materializza in tempi di rendering dimezzati o triplicati a seconda della scena. La 5070 cavalca senza problemi SDXL a 1024x1024 e Flux Schnell base, ma su Flux Dev con LoRA multiple ad alta risoluzione la VRAM diventa il primo collo di bottiglia. Se sono hobby, la 5070 fa il 90% del lavoro al 18% del prezzo, ed è ancora la scelta razionale.
La 5070 a 576 euro è la GPU mainstream più equilibrata del 2026 per gaming 1440p e AI entry-level — con l'asterisco VRAM da considerare se la tieni 4+ anni o se pianifichi il passaggio al 4K. La 5090 a 3.544 euro non è una scheda gaming: è una piattaforma AI/workstation che gioca anche a 4K maxed out, e ha senso comprarla solo se l'inference 32B+ o il rendering professionale fanno parte della tua quotidianità.
Sei volte il prezzo. +91% di performance al 4K. Stesso chip Blackwell, due mondi diversi: RTX 5070 vs RTX 5090 è il confronto sbagliato — la domanda giusta è cosa ci farai. Per chi può aspettare, Q3 2026 cambia le carte.
Fonti: NVIDIA RTX 5070 Family, Wikipedia RTX 50 series, Trovaprezzi RTX 5070, Trovaprezzi RTX 5090, Hardware Upgrade — recensione RTX 5070, Tom's Hardware Italia — RTX 5070 test, Databasemart — RTX 5090 Ollama benchmark, APXML — Best Local LLMs for RTX 50, Videocardz — RTX 50 SUPER slips to Q3 2026, Overclocking.com — RTX 5090 FE energy consumption, technical.city — RTX 5070 vs 5090 benchmark.
| Parametro | RTX 5070 | RTX 5090 |
|---|---|---|
| MSRP US lancio | 549 $ | 1.999 $ |
| MSRP IT lancio (FE) | 659 € | 2.389 € (introvabile) |
| Street price IT (mag 2026) | 576-610 € | 3.544-4.500 € |
| CUDA cores | 6.144 | 21.760 |
| VRAM | 12 GB GDDR7 | 32 GB GDDR7 |
| Bus memoria | 192-bit | 512-bit |
| TGP | 250 W | 575 W |
| PSU consigliato | 650 W | 1000 W |
| Performance 1440p (vs 5070) | baseline | +54% |
| Performance 4K (vs 5070) | baseline | +91% |
| LLM max in Q4 nativo | 9-10B (Mistral, Llama 8B) | 32B (Qwen, DeepSeek-R1) |
| Llama 3.1 8B Q4 (tok/s) | ~59 | 149,95 |
| Costo elettrico delta 4h/g gaming | baseline | ~142 €/anno in più |
| Disponibilità maggio 2026 | buona | limitata |