8 aprile 2026 · 9 min lettura
Intelligenza ArtificialeDal caso Yellow Tech alle PMI italiane: come l'AI generativa sta automatizzando contratti, fatture e workflow documentali B2B. Stack open source replicabile in homelab con n8n, Ollama e Docling.
HardwareQuanto hardware serve per pareggiare i free tier di ChatGPT, Claude e Gemini con un LLM locale? Ho fatto i conti: GPU, VRAM, elettricità, break-even. I numeri non mentono.

Iscriviti alla newsletter per ricevere i migliori articoli direttamente nella tua inbox.
GitHub Copilot scrive il 46% del codice — ma su repo da 1M+ righe i senior ci mettono il 19% in più con AI. Dati reali su coding agent e futuro dev.
Dipende da chi chiedi. E da cosa misuri. È questa la risposta onesta alla domanda sugli strumenti AI più utilizzati 2026. Ogni classifica LLM 2026 che trovi online usa una metodologia diversa — web traffic, mobile app, referral click, self-reported MAU — e produce risultati che a volte si contraddicono del 30%. ChatGPT ha ancora il 78% del mercato o il 60%? Gemini è al 21% o all'8%? Entrambe le affermazioni appaiono in fonti credibili, pubblicate nello stesso mese.
Quello che è certo: il mercato si sta ridisegnando in tempo reale. E i numeri che contano davvero non sono quelli che circolano sui social.
Ne avevamo già parlato a proposito di modelli locali per homelab — il quadro consumer è però diverso dall'inference locale, e vale la pena separare i due piani.
Partiamo dai dati consolidati. Quattro metodologie, quattro fotografie diverse dello stesso mercato.
| Fonte | Metodologia | ChatGPT | Gemini | Perplexity | Claude |
|---|---|---|---|---|---|
| Wallaroo Media / SimilarWeb | Web traffic diretto chatbot, gen 2026 | 64.5% | 21.5% | n.d. | n.d. |
| First Page Sage (USA only) | Web + mobile, apr 2026 | 60.2% | 15.3% | n.d. | n.d. |
| Statcounter | Referral click AI, mar 2026 | 78.2% | 8.6% | 7.1% | 2.9% |
| Fortune / mobile app data | Dati app store, fine 2025 | 45.3% | 25.2% | n.d. | n.d. |
Il contesto storico aiuta a capire la traiettoria: nel 2023 ChatGPT era di fatto l'unico player consumer — a gennaio 2025 deteneva ancora l'86% del traffico web secondo SimilarWeb. A gennaio 2026 — qualunque fonte tu usi — è sceso. Il trend è reale, anche se l'entità precisa dipende da come si misura. Google Gemini ha quintuplicato la quota in 12 mesi: da 5.7% (gennaio 2025) a 21.5% secondo SimilarWeb, numeri che si traducono in 2 miliardi di visite mensili a gennaio 2026 (Fortune). Un +277% annuo.

Il consumer market share è rumoroso e difficile da misurare. La spesa enterprise API è più concreta: la paghi, la tracci, hai una fattura. Ed è lì che il quadro si ribalta.
Menlo Ventures ha misurato la spesa enterprise LLM a metà 2025: Anthropic al 32%, OpenAI al 25%, Google al 20%. A fine 2025 Anthropic era già al 40%. La stessa ricerca rivela che Claude ha il 54% del market share enterprise nel coding — contro il 21% di OpenAI. Non è un sorpasso minimo.
I numeri ARR confermano la direzione: Anthropic ha chiuso la Serie G a febbraio 2026 con un ARR di $14 miliardi, salito a $30 miliardi ad aprile — superando i $25 miliardi di OpenAI. Nello stesso periodo, Claude Code ha raggiunto il 4% dei commit GitHub pubblici mondiali.
Un dato che aiuta a capire la dinamica: quasi la metà dei clienti enterprise Claude paga anche ChatGPT (Menlo Ventures). Le aziende non scelgono un vincitore — costruiscono stack multi-vendor. ChatGPT per un uso, Claude per un altro, Gemini per la ricerca Google Workspace.
Tutte le statistiche che hai letto finora misurano i chatbot standalone — le interfacce dove vai apposta a chiedere qualcosa a un modello. Ma Wallaroo Media ha messo in evidenza un problema metodologico strutturale: Google AI Overviews genera tra 1.3 e 1.7 miliardi di interazioni AI al giorno, invisibili a queste statistiche. I chatbot standalone combinati — ChatGPT, Claude, Gemini, Perplexity, tutti — arrivano a circa 290 milioni di visite giornaliere totali.
Cinque volte più interazioni AI avvengono fuori dai chatbot che dentro. Se conti l'uso AI reale, Google potrebbe essere già il leader assoluto — ma non compare in nessuna classifica perché le AI Overview sono integrate nella ricerca, non in un prodotto separato.
"ChatGPT is the undisputed leader of the AI chatbot market with nearly 900 million weekly active users — more than twice the size of its nearest rival." — OpenAI blog, feb 2026
OpenAI conta 900 milioni di WAU. Il dato è self-reported, non verificato indipendentemente, e non risponde alla domanda su quanti di quelli siano bot. il report Imperva Bad Bot 2025, riportato da Fortune (luglio 2025), ha rilevato che i bot superano il 50% del traffico internet globale per la prima volta nel 2024, con OpenAI bot che da soli rappresentano il 69% del traffico bot AI. Le metriche di "utenti attivi" del settore potrebbero includere una quota significativa di traffico automatizzato. Nessuno lo sa con certezza.
Chatbot Arena è la classifica di riferimento per i benchmark LLM — quella che trovi citata ovunque quando si parla di quale modello sia "il migliore". Ha un problema: è finanziata dai lab che rankeggia.
La ricerca di Simon Willison (aprile 2025) ha documentato un episodio specifico: Meta ha testato in privato 27 varianti diverse di Llama-4 prima del rilascio pubblico, pubblicando solo il punteggio della variante migliore. il paper "The Leaderboard Illusion" (arXiv, aprile 2025) ha dimostrato che anche un accesso modesto ai dati Arena può aumentare artificialmente la performance fino al 112%. I modelli che rispondono in bullet point con una certa lunghezza ottimizzata performano meglio indipendentemente dalla qualità reale della risposta.
Quando l'arbitro prende soldi dalle squadre, ogni decisione ravvicinata è sospetta.
La guerra dei chatbot cloud è interessante ma per chi gestisce un homelab il quadro rilevante è quello dei modelli open weight. E lì il vincitore non è né OpenAI né Anthropic.
Interconnects.ai ha documentato a dicembre 2025 che i top 5 modelli Qwen3 su HuggingFace avevano più download mensili di tutti i modelli OpenAI, Mistral e NVIDIA combinati. Ollama — lo strumento standard per l'inference locale — ha superato 165.000 stelle GitHub a marzo 2026 e nella versione v0.18.0 ha aggiunto supporto nativo alle GPU AMD.
| Modello | VRAM richiesta | Caso d'uso | Performance |
|---|---|---|---|
| Llama 3.3 8B | 8 GB | Uso generale | 94 TPS su RTX 4090 |
| Qwen 2.5 Coder 14B | 12-16 GB | Coding locale | Top-rated per coding su HF |
| Qwen3.5 27B | 24 GB | General purpose avanzato | 72.4% SWE-bench |
| DeepSeek-R1 | 24+ GB | Reasoning | Open weight, deploy locale OK |
Una nota su DeepSeek: il Garante italiano ha bannato deepseek.com con effetto immediato a gennaio 2025, seguito da indagini in diverse giurisdizioni EU. Il ban riguarda il servizio cloud, non i pesi del modello. DeepSeek-R1 in locale su Ollama è legittimo — l'inference avviene sulla tua macchina, nessun dato viene inviato. La distinzione è importante e spesso omessa nei titoli.
Se Claude Code domina il coding enterprise al 54% ma costa — e costa — l'alternativa locale è Qwen2.5-Coder 14B su Ollama. Come avevamo visto testando la Ryzen AI NPU per LLM su Linux, l'hardware consumer del 2025-2026 rende credibile l'inference locale per uso quotidiano.

Al di fuori dei tre grandi, il mercato degli strumenti AI più utilizzati 2026 ha player secondari con traiettorie precise.
La frammentazione dello strumento AI più usato cambia anche se guardi i benchmark. Come spiegato nella nostra analisi su cosa significa l'AI per i programmatori nella realtà dei dati, il modello "migliore" in assoluto non esiste — esiste il modello migliore per un compito specifico.
Il 2 agosto 2026 l'EU AI Act entra in piena applicazione. Per i sistemi ad alto rischio integrati in prodotti regolamentati, la scadenza è agosto 2027. Non cambia nulla per l'uso personale o homelab, ma impatta chi costruisce prodotti commerciali con AI in Europa. Le aziende che usano LLM in produzione devono già essere in conformità — o adattarsi rapidamente.
Gartner prevede che il 35% dei paesi sarà vincolato a piattaforme AI regionali specifiche entro il 2027. La frammentazione geopolitica — USA, EU, Cina — sta creando ecosistemi paralleli. I modelli cinesi open source (Qwen, DeepSeek) dominano HuggingFace per download ma sono sotto pressione regolamentare in Occidente. I modelli EU stanno emergendo ma restano indietro in benchmark.
Nessuna classifica ha torto. Nessuna ha ragione. Misurano cose diverse chiamandole con lo stesso nome.. ChatGPT vince per volume utenti consumer — 900M WAU è un numero che nessun competitor avvicina, anche se non verificato indipendentemente. Gemini vince per crescita e per integrazione con l'ecosistema Google — 2 miliardi di visite mensili in 12 mesi di espansione. Claude vince dove i contratti si firmano: 40% enterprise LLM spend, 54% coding, ARR che supera OpenAI ad aprile 2026.
Ma il dato che tutte queste classifiche ignorano è quello da 1.3-1.7 miliardi: le interazioni AI che avvengono ogni giorno via Google AI Overviews, senza che l'utente abbia mai aperto chat.openai.com o claude.ai. La mappa del potere AI reale non assomiglia a nessuna delle classifiche che circolano.
Gli strumenti AI più utilizzati 2026 dipendono da chi stai misurando, con quale strumento, e con quale interesse. La prossima volta che leggi una classifica LLM, guarda chi l'ha finanziata.
Fonti: First Page Sage, Wallaroo Media Q1 2026, Menlo Ventures Mid-Year Report, Anthropic Series G, Fortune (ChatGPT market share), Simon Willison su Chatbot Arena, Statcounter AI Chatbot, Fortune bot traffic, Interconnects.ai open models, GlobeNewswire Menlo Enterprise, The Leaderboard Illusion (arXiv), Imperva Bad Bot Report 2025