Terza puntata della serie. Dopo aver smontato gli embedding, oggi affrontiamo la sigla più venduta del 2026: RAG, Retrieval-Augmented Generation.
Se nell'ultimo anno avete ricevuto un preventivo per "una soluzione AI sulla vostra documentazione aziendale", l'80% delle volte vi stanno vendendo una RAG. Capire cosa sia davvero — e quando vi serve davvero — è la differenza tra spendere bene 30.000 euro e spenderli per dire ai vostri clienti che avete fatto AI.
La metafora
Una RAG è un assistente che, prima di rispondervi, sfoglia il vostro archivio.
Quando fate una domanda a ChatGPT generico, il modello risponde basandosi su ciò che ha imparato durante l'addestramento — un mix di Wikipedia, libri, articoli pubblici, fino a una certa data. Non sa nulla di voi. Non conosce il vostro contratto con il fornitore X, la vostra policy ferie 2026, il manuale di installazione del prodotto Y.
Una RAG colma esattamente questo divario. Si fa così:
- Prendete i vostri documenti (PDF, Word, pagine web, database).
- Li "spezzettate" in piccoli pezzi (chunking).
- Trasformate ogni pezzo in un embedding — un vettore di coordinate nel "significato".
- Li salvate in un database vettoriale.
- Quando l'utente fa una domanda, il sistema cerca nel database i 5-10 pezzi più simili alla domanda, e li passa al modello AI come contesto.
- Il modello genera la risposta basandosi su quei pezzi.
Da qui il nome: Retrieval-Augmented Generation. Recupero (dai vostri documenti) che aumenta la generazione (del modello AI).
Perché esiste
Tre ragioni, in ordine di importanza.
1. Fattualità. Il modello AI senza RAG può inventare ("allucinare"). Con la RAG, le risposte sono ancorate ai vostri documenti — non a ciò che il modello ha imparato da Reddit nel 2024. Se la fonte è il vostro manuale, la risposta sarà fedele al vostro manuale.
2. Aggiornabilità. Riaddestrare un modello AI costa milioni di dollari. Aggiornare una RAG costa il tempo di re-indicizzare i nuovi documenti — minuti, ore al massimo. Quando il vostro listino prezzi cambia, la RAG sa il nuovo prezzo. Il modello "puro" no, finché non viene riaddestrato.
3. Permessi. Una RAG può rispettare i diritti di accesso ai documenti. Se Marco può vedere il documento X ma Sara no, la RAG può filtrare di conseguenza. Un modello puro non può: una volta che il documento è nei suoi pesi, lo sa per chiunque chieda.
Quando vi serve davvero
Tre casi tipici dove la RAG ha senso. Più precisamente: dove la RAG è l'unica soluzione sensata.
Caso 1 — Assistenza clienti su prodotto/servizio complesso. Avete 200 pagine di documentazione tecnica e i vostri agenti customer care passano tempo a cercarle. RAG. Funziona, riduce il tempo medio di risposta, è facilmente misurabile.
Caso 2 — Help desk interno. I dipendenti fanno domande ricorrenti su policy aziendali (ferie, rimborsi, procedure HR). Le domande sono tante, le persone HR sono poche. RAG. Si recupera tempo, si abbassa la frustrazione.
Caso 3 — Assistente di pre-vendita. Avete un'offerta articolata, configurazioni multiple, casi d'uso diversi. Un assistente che guida il cliente attraverso domande, recuperando le informazioni rilevanti dalle vostre brochure, è valore vero.
In tutti e tre i casi, il retorno sull'investimento è chiaro: meno tempo umano speso a cercare informazioni, più tempo speso a fare cose che richiedono giudizio.
Quando NON vi serve (e ve la stanno vendendo lo stesso)
Tre red flag operative.
Vi propongono una RAG per "aiutarvi a prendere decisioni strategiche". Una RAG non prende decisioni. Recupera informazioni. Se il vostro problema è decisionale, la RAG da sola non è la soluzione: serve un sistema più complesso (agent, workflow), o forse non vi serve affatto l'AI.
La vostra documentazione è disorganizzata, incompleta o contraddittoria. Una RAG amplifica la qualità della vostra documentazione. Se i vostri documenti sono confusi, la RAG produrrà risposte confuse. Non risolve il problema; lo automatizza. Prima di una RAG, talvolta serve una due diligence dei contenuti.
Avete meno di 50 documenti. Sotto un certo volume, una RAG è overkill. Un assistente AI con i documenti caricati nel contesto in modo statico fa lo stesso lavoro con un decimo della complessità.
Cosa chiedere al fornitore
Sei domande, scritte in ordine di importanza decrescente. Se il fornitore non sa rispondere a una di queste senza esitazione, prendete tempo prima di firmare.
- Come funziona il chunking? (Spezzettano i documenti in pezzi da quanti caratteri? Mantengono il contesto della sezione? Gestiscono tabelle e immagini?)
- Quale modello di embedding usate? (E sa l'italiano? Vedi il pezzo sugli embedding.)
- Come gestite i permessi? (Se un documento è confidenziale, la RAG sa che certi utenti non possono vederlo?)
- Come gestite gli aggiornamenti? (Quando aggiungo un documento nuovo, in quanto tempo è disponibile? Esiste un controllo versioni?)
- Cosa fa l'assistente quando non trova la risposta? (Dice "non lo so" o prova a inventare? La risposta giusta è la prima.)
- Come testate la qualità delle risposte? (Hanno una batteria di domande di test? La girano a ogni aggiornamento?)
Tre risposte ben formulate, e potete andare avanti. Tre esitazioni o "valutiamo caso per caso", e probabilmente vi stanno vendendo un'idea, non un sistema.
Riassunto in tre righe
Una RAG è un'AI che, prima di rispondere, sfoglia i vostri documenti.
Risolve il problema delle allucinazioni e dell'aggiornabilità — se i vostri documenti sono di qualità.
Vi serve davvero solo se avete molta documentazione e molte domande ripetitive. Altrimenti vi stanno vendendo una moda costosa.
Lunedì 13 luglio cambiamo registro: L'estate del founder. 4 cose da fare ad agosto che pesano davvero a settembre. Niente "ricaricare le batterie". Quattro lavori a basso volume e alto impatto.
A lunedì.
Avete in mente una RAG per la vostra azienda e non sapete se ha senso? Su intelligenza artificiale per il business facciamo audit di RAG-preventivi in mezza giornata. Spieghiamo cosa state comprando, prima che lo compriate. Parliamone.
