Глава отдела ИИ Amazon утверждает, что погоня за лидерскими позициями в рейтингах больших языковых моделей (LLM) — это отвлечение от реальной цели: создание ИИ, решающего конкретные бизнес-задачи. Рохит Прасад, старший вице-президент Amazon по AGI, считает, что текущие бенчмарки ненадежны и не отражают истинной полезности модели. Он утверждает, что фокус следует сместить с теоретической производительности на демонстрационные результаты в реальном мире.
Проблема с Бенчмарками ИИ
Отрасль ИИ одержима показателями бенчмарков, но эти метрики несовершенны. Модели обучаются на разных наборах данных, а оценки часто предвзяты или непоследовательны. Это делает прямые сравнения бессмысленными. Прасад утверждает, что единственным справедливым сравнением было бы обучение всех моделей на идентичных данных, что непрактично. Реальная проблема заключается в том, что бенчмарки не измеряют ценность ИИ в практических приложениях.
Представляем Nova Forge: Индивидуальный ИИ в Масштабе
Ответом Amazon является Nova Forge, новый сервис, позволяющий компаниям обучать собственные модели ИИ без обычных огромных затрат. Forge дает бизнесу доступ к контрольным точкам модели Nova от Amazon на различных этапах обучения. Это позволяет им вводить свои собственные запатентованные данные на ранней стадии процесса, когда модель наиболее восприимчива к обучению. Этот подход позволяет избежать недостатков тонкой настройки закрытых моделей или переобучения моделей с открытым весом, что может привести к ухудшению производительности.
Forge фактически демократизирует передовую разработку ИИ, предлагая доступ к инструментам, ранее доступным только крупным технологическим компаниям. Amazon построил Forge внутри компании, потому что его командам требовалась эта возможность. Компания всегда следовала схеме: сначала решать собственные проблемы, а затем превращать решения в бизнес.
Ранний Успех Reddit с Forge
Reddit — одна из первых компаний, использующих Forge для создания пользовательских моделей безопасности, обученных на 23-летних данных модерации сообщества. Главный технический директор Reddit, Крис Слоу, говорит, что этот инструмент «революционен», позволяя им создать модель, понимающую нюансы уникальной культуры их платформы. Их цель — заменить несколько существующих систем безопасности одной высокоспециализированной моделью, которая лучше сможет обеспечивать соблюдение правил сообщества.
Слоу признает, что Nova не является моделью с самым высоким рейтингом, но это не имеет значения. Важна способность модели выполнять свою предполагаемую функцию — в данном случае, понимать, что представляет собой «мерзкое» поведение на Reddit.
Будущее ИИ: Специализация Вместо Общего Интеллекта
Amazon делает ставку на то, что гонка за самым умным ИИ менее важна, чем способность создавать полезный ИИ. Компания позиционирует себя как платформу для бизнеса, которому нужны индивидуальные решения, а не конкурирует напрямую с OpenAI и Anthropic в чистой производительности модели. Эта стратегия соответствует основной философии AWS: предоставление инфраструктуры и инструментов, которые позволяют другим внедрять инновации.
Amazon делает ставку на то, что гонка моделей была коммерциализирована, и компания может добиться успеха, став местом, где компании могут создавать специализированный ИИ для конкретных бизнес-задач.
В конечном счете, успех этого подхода будет зависеть от внедрения разработчиками. Но если Amazon прав, будущее ИИ заключается не в том, у кого самый высокий балл в бенчмарке, а в том, кто может принести реальную ценность.





























