#ParoleDifficili: Embedding

Immaginate una sala riunioni. Un fornitore vi sta presentando un preventivo per "una soluzione AI sulla vostra documentazione aziendale". A un certo punto dice una frase tipo: "Useremo embedding di ultima generazione per indicizzare i vostri documenti in uno spazio vettoriale a 1.536 dimensioni."

Voi annuite. Nessuno dei dieci presenti chiede cosa significhi. La parola "embedding" passa, si insedia in un budget di settantamila euro, e va in produzione.

Sei mesi dopo, il motore di ricerca interno aziendale risponde "non ho trovato nulla" alla query "ferie agosto", e nessuno sa perché.

Benvenuti nella seconda puntata di #ParoleDifficili, la nostra serie che spiega in dieci minuti i termini tech che vi vendono senza mai dirvi cosa siano davvero. Oggi, finalmente: gli embedding.

La metafora che funziona

Un embedding è la traduzione di una frase in coordinate.

Immaginate una mappa. Non delle strade — del significato. In questa mappa, ogni concetto, ogni frase, ogni paragrafo, ogni immagine, ha una posizione. Ferie sta vicino a vacanze. Roma sta vicino a Italia. Ottobre sta vicino a novembre. Padre sta vicino a paternità (ma anche, sorprendentemente, vicino a uomo e a figlio).

Questa mappa non ha due dimensioni come una mappa stradale. Ne ha migliaia. Letteralmente — i modelli moderni usano embedding a 768, 1.536, o anche 3.072 dimensioni. Non chiedete di immaginarle: nessun essere umano ci riesce. Sappiate solo che in quella mappa multidimensionale, ogni frase è un punto, e la vicinanza tra punti corrisponde alla vicinanza di significato.

Tutto qui. Un embedding è il vettore di coordinate di una frase su quella mappa.

Perché esiste

Esiste perché i computer hanno un problema: non capiscono il significato delle parole. Sanno confrontare lettere, sanno contare. Non sanno se "ferie" e "vacanze" sono sinonimi.

Per decenni, abbiamo provato a risolvere il problema con vocabolari, regole grammaticali, ontologie. Funzionava maluccio. Poi, intorno al 2013, qualcuno ha fatto questa cosa: invece di insegnare al computer cosa significano le parole, gli abbiamo fatto leggere miliardi di testi e gli abbiamo detto "trova un modo per rappresentarle come numeri tali che parole che compaiono in contesti simili abbiano numeri simili."

Risultato: il computer ha costruito da solo la mappa multidimensionale. Non sa cosa siano le ferie. Sa che la parola "ferie" gli ricorda statisticamente "vacanze", "agosto", "ponte del 2 giugno", e questo basta.

Questo è il trucco. Tutto quello che chiamiamo "AI che capisce il linguaggio" — chatbot, motori di ricerca semantica, riassuntori, traduttori — gira sopra questa idea.

A che serve nella vostra azienda

In pratica gli embedding vi servono ogni volta che dovete cercare per significato invece che per parole esatte.

Caso uno: ricerca interna. I vostri dipendenti cercano "rimborso trasferta" e non trovano il documento intitolato "Policy spese di viaggio". Embedding: i due testi sono vicini nello spazio del significato. Trova quello giusto anche se le parole sono diverse.

Caso due: assistente conversazionale sui documenti aziendali. Un cliente chiede al chatbot del vostro sito "fate spedizioni in Sicilia?". Il chatbot non ha una pagina specifica su questo. Ma ha una policy logistica generica. Embedding: le due cose sono vicine. La risposta arriva.

Caso tre: raccomandazioni. Avete un e-commerce con tremila prodotti. Un cliente compra un articolo. Embedding: i prodotti più vicini a quello acquistato (nello spazio di descrizioni, immagini, tag) gli verranno proposti.

Caso quattro: clustering / segmentazione. Avete duemila ticket di assistenza dell'ultimo mese. Volete capire i 5 problemi più ricorrenti. Embedding: raggruppate i ticket vicini, e i cluster emergono da soli senza dover scrivere regole.

In tutti questi casi, l'alternativa "vecchia" era: scrivete regole, mantenetele, aggiornatele ogni volta che cambia il vocabolario. L'embedding fa tutto questo praticamente da solo. Vi costa la spesa di calcolare un vettore per ogni pezzo di contenuto, e di salvarlo in un database vettoriale (sì, c'è anche quella parola difficile; ne parliamo più avanti).

Quando dovreste chiederlo

Una volta che sapete cos'è, la domanda da fare in sala riunioni cambia. Non chiedete "usate embedding di ultima generazione?" — è la domanda sbagliata, perché chiunque vi risponderà di sì. Chiedete:

Quale modello di embedding usate? (I nomi che sentirete: text-embedding-3-large di OpenAI, voyage-3 di Voyage, embed-v3 di Cohere, modelli open-source come bge-m3.)
Quante dimensioni? (Più dimensioni = più sfumature, ma anche più costo. Per la maggior parte dei casi business, da 768 a 1.536 vanno benissimo.)
Come gestite l'aggiornamento? (Se aggiungete un documento nuovo, va re-embeddato. Se il modello di embedding cambia, va re-embeddato tutto. Chi paga? Chi monitora?)
In che lingua sono stati addestrati? (Molti embedding sono ottimi sull'inglese e mediocri sull'italiano. Se la vostra documentazione è in italiano, questo è il problema numero uno.)

Se il fornitore esita su una di queste domande, vi sta vendendo un'idea, non una soluzione.

Quando dovreste diffidare

Tre red flag, da appendere al muro:

Uno, qualcuno vi dice che "gli embedding risolvono il problema". Non lo risolvono. Sono uno strato della soluzione. Sopra ci va sempre dell'altro: il modo in cui spezzate i documenti (chunking), come gestite il contesto (RAG, di cui parleremo), come presentate il risultato (interfaccia).

Due, vi propongono di "embeddare tutto e poi vediamo". È l'equivalente di "buttiamo dentro al database tutta la nostra documentazione, e l'AI farà il resto". Non funziona. Embedding senza una strategia di chunking pensata produce risultati casuali.

Tre, qualcuno vi dice che "il vostro embedding sarà personalizzato per la vostra azienda". Quasi sempre falso. Quello che è personalizzato è cosa embeddate (i vostri documenti), non come (il modello di embedding è uno standard di mercato). Fine-tuning di un modello di embedding è possibile ma raro, costoso, e ha senso solo in casi molto specifici.

Riassunto in tre righe

Un embedding è una traduzione di un pezzo di linguaggio in un vettore di numeri.

Le cose con significato simile finiscono vicine in questo spazio numerico.

Tutto quello che fa "ricerca per significato" sotto al cofano fa questo.

Adesso, in sala riunioni, sapete cosa annuire e cosa contestare.

Lunedì 8 giugno torniamo alla serie #BraveHistories, con un caso italiano che è un B2B sottovalutato come pochi: un'azienda marchigiana di misurazioni di precisione che ha costruito un brand silenzioso senza spendere un euro in advertising.

A lunedì.

Vi stanno proponendo "una soluzione AI sui vostri documenti aziendali"? Su intelligenza artificiale per il business facciamo anche audit di preventivi tecnici, in mezza giornata, gratis fino a fine giugno. Parliamone.