El jefe de IA de Amazon sostiene que perseguir clasificaciones en las tablas de clasificación para modelos de lenguajes grandes (LLM) es una distracción del objetivo real: crear IA que resuelva problemas comerciales específicos. Rohit Prasad, vicepresidente senior de AGI de Amazon, cree que los puntos de referencia actuales no son confiables y no reflejan la verdadera utilidad de un modelo. Dice que el enfoque debería pasar del desempeño teórico a resultados demostrables en el mundo real.
El problema con los puntos de referencia de la IA
La industria de la IA se ha obsesionado con las puntuaciones de referencia, pero estas métricas son erróneas. Los modelos se entrenan con diferentes conjuntos de datos y las evaluaciones suelen ser sesgadas o inconsistentes. Esto hace que las comparaciones directas carezcan de sentido. Prasad sostiene que la única comparación justa requeriría que todos los modelos se entrenaran con datos idénticos, lo cual no es práctico. El verdadero problema es que los puntos de referencia no miden el valor de la IA en aplicaciones prácticas.
Presentamos Nova Forge: IA personalizada a escala
La respuesta de Amazon es Nova Forge, un nuevo servicio que permite a las empresas entrenar modelos de IA personalizados sin los enormes costos habituales. Forge brinda a las empresas acceso a los puntos de control del modelo Nova de Amazon en varias etapas de capacitación. Esto les permite inyectar sus propios datos en las primeras etapas del proceso, cuando el modelo es más receptivo al aprendizaje. Este enfoque evita los inconvenientes de ajustar los modelos cerrados o volver a entrenar los modelos abiertos, los cuales pueden degradar el rendimiento.
Básicamente, Forge democratiza el desarrollo avanzado de IA al ofrecer acceso a herramientas que antes solo estaban disponibles para las principales empresas de tecnología. Amazon creó Forge internamente porque sus equipos necesitaban esta capacidad. El patrón de la empresa siempre ha sido resolver primero sus propios problemas antes de convertir las soluciones en un negocio.
El éxito inicial de Reddit con Forge
Reddit es una de las primeras empresas que utiliza Forge para crear modelos de seguridad personalizados basados en 23 años de datos de moderación comunitaria. El CTO de Reddit, Chris Slowe, dice que la herramienta es “revolucionaria” y les permite crear un modelo que comprende los matices de la cultura única de su plataforma. Su objetivo es reemplazar múltiples sistemas de seguridad existentes con un modelo único y altamente especializado que pueda hacer cumplir mejor las reglas comunitarias.
Slowe admite que Nova no es un modelo de primer nivel, pero no importa. Lo que importa es la capacidad del modelo para realizar la función prevista; en este caso, comprender qué constituye un comportamiento “idiota” en Reddit.
El futuro de la IA: la especialización frente a la inteligencia general
Amazon apuesta a que la carrera por la IA más inteligente es menos importante que la capacidad de construir una IA útil. La empresa se está posicionando como la plataforma para empresas que necesitan soluciones personalizadas, en lugar de competir directamente con OpenAI y Anthropic en la capacidad pura del modelo. Esta estrategia se alinea con la filosofía central de AWS: proporcionar infraestructura y herramientas que permitan a otros innovar.
Amazon apuesta a que la carrera por los modelos se ha mercantilizado y que puede tener éxito siendo el lugar donde las empresas puedan construir IA especializada para problemas comerciales específicos.
En última instancia, el éxito de este enfoque dependerá de la adopción por parte de los desarrolladores. Pero si Amazon tiene razón, el futuro de la IA no se trata de quién tiene el puntaje de referencia más alto, sino de quién puede ofrecer valor en el mundo real.




























