Amazon dà priorità all’intelligenza artificiale pratica rispetto ai punteggi dei benchmark

6

Il responsabile dell’intelligenza artificiale di Amazon sostiene che inseguire le classifiche per i modelli linguistici di grandi dimensioni (LLM) è una distrazione dal vero obiettivo: creare un’intelligenza artificiale che risolva problemi aziendali specifici. Rohit Prasad, vicepresidente senior dell’AGI di Amazon, ritiene che i benchmark attuali siano inaffidabili e non riflettano la reale utilità di un modello. Secondo lui l’attenzione dovrebbe spostarsi dalle prestazioni teoriche ai risultati dimostrabili nel mondo reale.

Il problema con i benchmark IA

Il settore dell’intelligenza artificiale è diventato ossessionato dai punteggi di riferimento, ma questi parametri sono imperfetti. I modelli vengono addestrati su set di dati diversi e le valutazioni sono spesso distorte o incoerenti. Ciò rende inutili i confronti diretti. Prasad sostiene che l’unico confronto equo richiederebbe che tutti i modelli fossero addestrati su dati identici, il che non è pratico. Il vero problema è che i benchmark non misurano il valore dell’intelligenza artificiale nelle applicazioni pratiche.

Presentazione di Nova Forge: IA personalizzata su larga scala

La risposta di Amazon è Nova Forge, un nuovo servizio che consente alle aziende di addestrare modelli di intelligenza artificiale personalizzati senza i soliti enormi costi. Forge offre alle aziende l’accesso ai checkpoint del modello Nova di Amazon in varie fasi della formazione. Ciò consente loro di inserire i propri dati proprietari nelle prime fasi del processo, quando il modello è più ricettivo all’apprendimento. Questo approccio evita le insidie ​​legate alla messa a punto di modelli chiusi o alla riqualificazione di modelli a peso aperto, che possono entrambi degradare le prestazioni.

Forge essenzialmente democratizza lo sviluppo avanzato dell’intelligenza artificiale offrendo l’accesso a strumenti precedentemente disponibili solo alle principali aziende tecnologiche. Amazon ha creato Forge internamente perché i suoi team avevano bisogno di questa capacità. Il modello dell’azienda è sempre stato quello di risolvere innanzitutto i propri problemi prima di trasformare le soluzioni in un business.

I primi successi di Reddit con Forge

Reddit è una delle prime aziende a utilizzare Forge per creare modelli di sicurezza personalizzati formati su 23 anni di dati di moderazione della comunità. Il CTO di Reddit, Chris Slowe, afferma che lo strumento è “rivoluzionario”, poiché consente loro di creare un modello in grado di comprendere le sfumature della cultura unica della loro piattaforma. Il loro obiettivo è sostituire i molteplici sistemi di sicurezza esistenti con un unico modello altamente specializzato in grado di far rispettare meglio le regole della comunità.

Slowe ammette che Nova non è un modello di alto livello, ma non importa. Ciò che conta è la capacità del modello di svolgere la funzione prevista: in questo caso, capire cosa costituisce un comportamento “stronzo” su Reddit.

Il futuro dell’intelligenza artificiale: specializzazione rispetto all’intelligence generale

Amazon scommette che la corsa all’intelligenza artificiale più intelligente è meno importante della capacità di costruire un’intelligenza artificiale utile. L’azienda si sta posizionando come piattaforma per le aziende che necessitano di soluzioni personalizzate, piuttosto che competere direttamente con OpenAI e Anthropic sulla pura capacità del modello. Questa strategia è in linea con la filosofia principale di AWS: fornire infrastrutture e strumenti che consentano ad altri di innovare.

Amazon scommette che la corsa al modello si è mercificata e che può avere successo diventando il luogo in cui le aziende possono costruire un’intelligenza artificiale specializzata per specifici problemi aziendali.

In definitiva, il successo di questo approccio dipenderà dall’adozione da parte degli sviluppatori. Ma se Amazon ha ragione, il futuro dell’intelligenza artificiale non dipende da chi ha il punteggio di riferimento più alto, ma da chi può fornire valore nel mondo reale.