Claude, Gemini o GPT: quale modello AI scegliere per la tua azienda

Ogni settimana un cliente mi fa la stessa domanda: "Davide, ma noi quale AI dobbiamo usare?". Di solito la domanda arriva dopo che hanno letto un articolo entusiastico su uno dei tre grandi o dopo che un commerciale gli ha fatto una demo. Il problema è che la risposta dipende da variabili che nessuna demo mostra: dove finiscono i tuoi dati, quanto paghi davvero a volume, e se il modello si integra con i sistemi che hai già.

Questo articolo non è una classifica di quale modello "vince". È una guida ai criteri che uso con le aziende quando dobbiamo prendere questa decisione in modo serio.

Il primo filtro è la privacy, non le prestazioni

Prima di confrontare qualità delle risposte o velocità, devi rispondere a una domanda: che tipo di dati userai con questo modello? Se lavori con dati personali di clienti, informazioni finanziarie, segreti industriali o dati sanitari, la scelta del modello diventa anche una scelta legale.

OpenAI con GPT (via API), Anthropic con Claude e Google con Gemini offrono tutti contratti enterprise con garanzie sul trattamento dei dati. Ma le condizioni non sono identiche. OpenAI ha introdotto accordi DPA (Data Processing Agreement) conformi al GDPR per i clienti API. Anthropic ha una politica esplicita di non utilizzo dei dati API per addestrare i modelli. Google, attraverso Vertex AI, consente di deployare Gemini dentro la propria infrastruttura cloud con controllo geografico dei dati.

Se la tua azienda è soggetta a normative di settore, come NIS2, DORA per il finance, o il Codice Privacy, il deployment su cloud privato o on-premise diventa un requisito, non un'opzione. In quel caso Gemini su Google Cloud o modelli open-weight come Llama deployati internamente diventano strade da valutare seriamente, indipendentemente da chi "scrive meglio".

I costi reali: oltre il prezzo per token

Sulle pagine di pricing di OpenAI, Anthropic e Google trovi i costi per milione di token in input e output. È il punto di partenza, non il punto di arrivo.

Il costo reale di adozione include almeno quattro voci:

Costo per token (varia moltissimo tra modelli base e modelli avanzati della stessa famiglia)
Costo di sviluppo dell'integrazione (chi costruisce i prompt, chi mantiene l'infrastruttura)
Costo delle chiamate ridondanti (un sistema mal progettato moltiplica i token inutilmente)
Costo di switching se cambi modello dopo 6 mesi

Per darti un ordine di grandezza indicativo: GPT-4o di OpenAI, Claude 3.5 Sonnet di Anthropic e Gemini 1.5 Pro di Google si posizionano tutti in una fascia simile per i modelli mid-tier, ma i modelli di punta di ogni famiglia possono costare da tre a cinque volte di più. Se il tuo caso d'uso richiede ragionamento complesso su documenti lunghi, quella differenza di costo diventa rilevante a volume.

Una cosa che vedo spesso sottovalutata: il costo del contesto lungo. Se devi analizzare documenti di decine di pagine, il numero di token in input esplode. Gemini 1.5 Pro ha una finestra di contesto nativa molto ampia (fino a un milione di token), il che lo rende interessante per use case documentali pesanti senza dover frammentare i contenuti.

Dove ciascun modello ha un vantaggio concreto

Evito di dire chi è "il migliore" in assoluto perché dipende dal task. Detto questo, ci sono aree dove i tre ecosistemi mostrano caratteristiche diverse che hanno impatto pratico.

GPT e l'ecosistema OpenAI hanno il vantaggio della maturità dell'ecosistema. Più integrazioni native, più librerie, più sviluppatori che lo conoscono. Se il tuo team tecnico è già orientato su LangChain, n8n o simili, troverà più documentazione e supporto community su OpenAI. Gli Assistants API e i GPT personalizzati abbassano la barriera per use case standard senza sviluppo custom.

Claude di Anthropic si distingue su task che richiedono istruzioni molto precise, rispetto di vincoli complessi e tono coerente su testi lunghi. Le aziende che lo usano per redazione di documenti legali, contratti o contenuti editoriali ad alto controllo tendono a preferirlo per quella che Anthropic chiama "instruction following" granulare. Ha anche una policy di sicurezza più conservativa, il che in alcuni contesti aziendali è un vantaggio, in altri un limite.

Gemini e l'ecosistema Google ha un vantaggio strutturale per chi è già dentro Google Workspace. L'integrazione nativa con Drive, Docs, Gmail e BigQuery riduce il costo di integrazione in modo significativo. Per le aziende che usano Google Cloud come infrastruttura principale, Vertex AI con Gemini offre controllo su deployment, logging e sicurezza che le API consumer non danno.

L'errore più comune: scegliere il modello prima del caso d'uso

Nella pratica, l'errore che vedo più spesso è questo: l'azienda sceglie un modello (spesso GPT perché è il più noto) e poi cerca di adattarci sopra tutti i casi d'uso. È il percorso inverso rispetto a quello corretto.

Il metodo che uso con i clienti parte sempre da tre domande:

1. Qual è il task specifico che vuoi automatizzare o supportare?

2. Che dati utilizza quel task e quali sono i vincoli di privacy?

3. Chi lo mantiene tecnicamente una volta in produzione?

Solo dopo aver risposto a queste tre domande ha senso confrontare i modelli. Spesso si scopre che per il 70% dei task aziendali standard, qualsiasi modello mid-tier dei tre funziona bene, e la scelta diventa puramente una questione di ecosistema, costi e competenze interne.

C'è anche un'ipotesi che tengo sempre aperta: per alcuni use case interni a basso rischio, un modello open-weight deployato internamente (come Llama 3 di Meta) può essere la scelta più sensata. Zero costi variabili a token, controllo totale dei dati, nessuna dipendenza da vendor esterni. Il costo è sul fronte infrastrutturale e di competenze, ma per aziende con un team tecnico solido non è una strada da scartare.

Vendor lock-in: il rischio che nessuno vuole nominare

L'ultimo criterio, spesso ignorato nelle valutazioni, è il rischio di dipendenza dal vendor. Se costruisci la tua logica applicativa tutta intorno alle funzionalità specifiche di un provider (i thread di OpenAI, i tool di Claude, le funzioni native di Gemini), migrarsi dopo diventa costoso.

La buona pratica è progettare un livello di astrazione tra la tua applicazione e il modello. Questo significa più lavoro iniziale, ma ti dà flessibilità reale quando tra 12 mesi il panorama dei modelli sarà ulteriormente cambiato. E cambierà, di questo puoi essere certo.

La mossa concreta per domani mattina

Scrivi in un foglio i tre casi d'uso AI che hai in testa per la tua azienda. Per ognuno, annota: che dati coinvolge, chi lo usa internamente, e se hai già un'infrastruttura cloud preferenziale. Con quelle informazioni in mano, contatta direttamente i team enterprise di OpenAI, Anthropic e Google e chiedi i termini DPA e i contratti di livello di servizio. La scelta giusta emerge da quella conversazione, non dalle classifiche online.