Le responsable de l’IA d’Amazon affirme que la poursuite des classements pour les grands modèles de langage (LLM) détourne l’attention du véritable objectif : créer une IA qui résout des problèmes commerciaux spécifiques. Rohit Prasad, vice-président directeur d’AGI chez Amazon, estime que les références actuelles ne sont pas fiables et ne reflètent pas la véritable utilité d’un modèle. Il dit que l’accent devrait passer des performances théoriques aux résultats démontrables dans le monde réel.
Le problème avec les benchmarks IA
L’industrie de l’IA est devenue obsédée par les scores de référence, mais ces mesures sont erronées. Les modèles sont formés sur différents ensembles de données et les évaluations sont souvent biaisées ou incohérentes. Cela rend les comparaisons directes inutiles. Prasad soutient que la seule comparaison équitable nécessiterait que tous les modèles soient formés sur des données identiques, ce qui n’est pas pratique. Le vrai problème est que les benchmarks ne mesurent pas la valeur de l’IA dans des applications pratiques.
Présentation de Nova Forge : une IA personnalisée à grande échelle
La réponse d’Amazon est Nova Forge, un nouveau service permettant aux entreprises de former des modèles d’IA personnalisés sans les coûts énormes habituels. Forge permet aux entreprises d’accéder aux points de contrôle du modèle Nova d’Amazon à différentes étapes de la formation. Cela leur permet d’injecter leurs propres données propriétaires dès le début du processus, lorsque le modèle est le plus réceptif à l’apprentissage. Cette approche évite les pièges liés au réglage fin des modèles fermés ou au recyclage des modèles à poids ouvert, qui peuvent tous deux dégrader les performances.
Forge démocratise essentiellement le développement avancé de l’IA en offrant l’accès à des outils auparavant réservés aux grandes entreprises technologiques. Amazon a construit Forge en interne parce que ses équipes avaient besoin de cette fonctionnalité. Le modèle de l’entreprise a toujours été de résoudre d’abord ses propres problèmes avant de transformer les solutions en affaires.
Les premiers succès de Reddit avec Forge
Reddit est l’une des premières entreprises à utiliser Forge pour créer des modèles de sécurité personnalisés basés sur 23 années de données de modération communautaire. Le CTO de Reddit, Chris Slowe, déclare que l’outil est « révolutionnaire », leur permettant de créer un modèle qui comprend les nuances de la culture unique de leur plateforme. Leur objectif est de remplacer plusieurs systèmes de sécurité existants par un modèle unique hautement spécialisé, capable de mieux appliquer les règles communautaires.
Slowe admet que Nova n’est pas un modèle de premier plan, mais cela n’a pas d’importance. Ce qui compte, c’est la capacité du modèle à remplir la fonction prévue – dans ce cas, comprendre ce qui constitue un comportement « saccadé » sur Reddit.
L’avenir de l’IA : spécialisation sur l’intelligence générale
Amazon parie que la course à l’IA la plus intelligente est moins importante que la capacité à construire une IA utile. La société se positionne comme la plate-forme pour les entreprises qui ont besoin de solutions personnalisées, plutôt que de concurrencer directement OpenAI et Anthropic sur la capacité de modèle pur. Cette stratégie s’aligne sur la philosophie fondamentale d’AWS : fournir une infrastructure et des outils qui permettent aux autres d’innover.
Amazon parie que la course au modèle s’est banalisée et qu’elle peut réussir en étant le lieu où les entreprises peuvent développer une IA spécialisée pour des problèmes commerciaux spécifiques.
En fin de compte, le succès de cette approche dépendra de son adoption par les développeurs. Mais si Amazon a raison, l’avenir de l’IA ne dépend pas de celui qui obtient le score de référence le plus élevé, mais plutôt de celui qui peut apporter une valeur réelle.



























