Embedding e RAG nelle PMI: utilità reale o moda passeggera

Pubblicato il • Generato e revisionato

Embedding e RAG nelle PMI: utilità reale o moda passeggera

Se negli ultimi mesi hai partecipato a un webinar sull'intelligenza artificiale applicata alle aziende, hai sentito sicuramente queste due parole: embedding e RAG. Spesso usate insieme, spesso usate male, quasi sempre senza spiegare cosa risolvono davvero.

Partiamo da un caso concreto. Un'azienda manifatturiera con 80 dipendenti ha un archivio di manuali tecnici, schede prodotto e procedure interne. Quando un tecnico in campo ha un problema, cerca nel PDF sbagliato per venti minuti, poi chiama qualcuno in ufficio. Il problema non è la mancanza di AI: è che l'informazione esiste ma non è accessibile in modo rapido. Ecco dove RAG ed embedding entrano in gioco, e dove ha senso parlarne seriamente.

Cosa sono, in parole semplici

Gli embedding sono rappresentazioni numeriche del testo. Prendono un documento, un paragrafo, una frase, e li trasformano in vettori che catturano il significato semantico. Due frasi che vogliono dire la stessa cosa, anche con parole diverse, avranno vettori simili. Questo permette ricerche per concetto, non solo per parola chiave.

RAG, che sta per Retrieval-Augmented Generation, è l'architettura che combina questi vettori con un modello di linguaggio. Funziona così: l'utente fa una domanda, il sistema recupera i pezzi di testo più rilevanti dal tuo archivio (grazie agli embedding), poi passa quei pezzi al modello che genera una risposta basata su quei contenuti specifici. Il risultato è un assistente che risponde usando le tue informazioni, non quelle generiche del modello base.

La distinzione è importante: un modello come GPT-4 senza RAG risponde basandosi su quello che ha imparato durante l'addestramento. Con RAG, risponde basandosi sui tuoi documenti aggiornati. Per una PMI, questa differenza è tutto.

Dove porta risultati concreti

I casi in cui RAG ed embedding funzionano bene nelle PMI hanno una caratteristica comune: esiste già una base documentale strutturata (o strutturabile) e il problema è l'accesso rapido a quella conoscenza.

Alcuni scenari reali:

  • Assistenza tecnica interna: manuali, procedure, troubleshooting. I tecnici fanno domande in linguaggio naturale e ottengono la sezione giusta del documento, non un link al PDF.
  • Onboarding dipendenti: policy aziendali, procedure HR, organigramma, benefit. Invece di disturbare l'ufficio per ogni dubbio, il nuovo assunto trova risposta autonomamente.
  • Supporto commerciale: schede prodotto, listini, condizioni contrattuali. Il commerciale in trasferta può interrogare il catalogo senza aprire dieci file Excel.
  • Customer service su documentazione pubblica: FAQ, manuali d'uso, condizioni di garanzia. Riduzione del carico sul team di supporto per le domande ripetitive.

In tutti questi casi il valore è misurabile: tempo risparmiato, riduzione di errori, meno escalation verso figure senior per domande operative.

Dove invece è solo moda (o peggio, un problema in più)

Non tutti i problemi aziendali si risolvono con RAG. Anzi, in molti casi il tentativo di applicarlo crea complessità senza valore.

Primo caso problematico: dati disorganizzati. RAG non risolve un problema di governance documentale. Se i tuoi documenti sono obsoleti, contraddittori, scritti male o sparsi in dieci sistemi diversi, un sistema RAG recupererà documenti obsoleti, contraddittori e scritti male. Il modello li userà comunque per rispondere. Il risultato è peggio del niente, perché dà un'aria di autorevolezza a informazioni sbagliate.

Secondo caso: quando il problema è diverso. Molte PMI che pensano di aver bisogno di RAG hanno in realtà bisogno di un CRM decente, di un knowledge base statico ben scritto, o semplicemente di processi più chiari. Prima di costruire un sistema RAG, vale la pena chiedersi: se il documento giusto fosse nella cartella giusta con il nome giusto, il problema sarebbe risolto? Se la risposta è sì, l'AI non serve.

Terzo caso: volumi troppo bassi. Se un'azienda ha 15 dipendenti e 30 documenti interni, il costo di implementazione e manutenzione di un sistema RAG supera di gran lunga il beneficio. Una buona intranet con ricerca full-text è più che sufficiente.

I costi reali che nessuno ti dice

Implementare RAG non è gratis, né tecnicamente né organizzativamente. Ci sono alcune voci che spesso vengono sottovalutate.

La prima è la pulizia dei dati. Prima di indicizzare qualsiasi documento, serve una revisione: togliere versioni obsolete, standardizzare i formati, decidere cosa includere e cosa no. Questa fase richiede tempo umano, non AI.

La seconda è la manutenzione dell'indice. Quando un documento cambia, l'indice vettoriale deve essere aggiornato. Se nessuno presidia questo processo, nel giro di mesi il sistema risponde con informazioni vecchie.

La terza è la valutazione delle risposte. Un sistema RAG può generare risposte plausibili ma sbagliate, specie quando il documento sorgente è ambiguo. Serve un processo, almeno iniziale, di verifica della qualità delle risposte.

Il costo totale di un progetto RAG serio per una PMI, fatto bene con un partner esterno, parte da qualche migliaio di euro per un proof of concept e può crescere significativamente se i dati sono disorganizzati o se si vuole integrare con sistemi esistenti. Non è proibitivo, ma non è nemmeno l'investimento da 500 euro che alcuni vendor sembrano suggerire.

Come valutare se fa al caso tuo

Prima di qualsiasi decisione tecnica, rispondi a queste domande:

1. Esiste già una base documentale che il personale dovrebbe usare ma usa poco, perché difficile da navigare?

2. Le domande che il personale o i clienti fanno ripetutamente hanno risposte già scritte da qualche parte?

3. C'è qualcuno in azienda che può presidiare la qualità e l'aggiornamento dei documenti nel tempo?

4. Il problema attuale genera costi misurabili (tempo, errori, escalation, insoddisfazione cliente)?

Se hai risposto sì alle prime tre e sai quantificare la quarta, ha senso approfondire. Se invece stai pensando a RAG perché «lo fanno tutti» o perché vuoi essere percepito come un'azienda innovativa, fermati. Il rischio è spendere risorse per un progetto che non cambia nulla di operativo.

La mossa concreta per domani mattina

Se vuoi capire se RAG può valere per la tua azienda, fai questo esercizio: identifica le cinque domande che vengono fatte più spesso al tuo personale interno o al tuo customer service. Verifica se la risposta esiste già in un documento aziendale. Se sì, controlla in quanto tempo un dipendente medio trova quella risposta oggi. Se il tempo è superiore a due o tre minuti per domande operative semplici, hai un problema di accesso alla conoscenza che vale la pena quantificare. Solo dopo quel calcolo, ha senso valutare se e come la tecnologia può aiutare.

Fonti

Torna al blog