Керівник відділу штучного інтелекту Amazon стверджує, що гонитва за рейтингами великої мовної моделі (LLM) відволікає від справжньої мети: створення ШІ, який вирішує конкретні бізнес-проблеми. Рохіт Прасад, старший віце-президент Amazon з AGI, вважає, що поточні тести є ненадійними та не відображають справжньої корисності моделі. Він стверджує, що фокус має бути зміщений з теоретичних показників на демонстровані результати в реальному світі.
Проблема з тестами AI
Індустрія штучного інтелекту одержима еталонними показниками, але ці показники недосконалі. Моделі навчаються на різних наборах даних, і оцінки часто упереджені або суперечливі. Це робить прямі порівняння безглуздими. Прасад стверджує, що єдиним справедливим порівнянням буде навчання всіх моделей на ідентичних даних, що є непрактичним. Справжня проблема полягає в тому, що бенчмарки не вимірюють вартість штучного інтелекту в практичних застосуваннях.
Представляємо Nova Forge: спеціальний ШІ в масштабі
Відповіддю Amazon є Nova Forge, нова послуга, яка дозволяє компаніям навчати власні моделі ШІ без звичайних величезних витрат. Forge надає компаніям доступ до тестів моделі Nova від Amazon на різних етапах навчання. Це дозволяє їм вводити власні власні дані на початку процесу, коли модель найбільш сприйнятлива до навчання. Такий підхід дозволяє уникнути недоліків тонкого налаштування закритих моделей або надмірного тренування моделей з відкритою вагою, що може призвести до низької продуктивності.
Forge по суті демократизує передову розробку ШІ, пропонуючи доступ до інструментів, які раніше були доступні лише для великих технологічних компаній. Amazon створила Forge всередині себе, тому що її команди потребували таких можливостей. Компанія завжди дотримувалася моделі спочатку вирішувати власні проблеми, а потім перетворювати рішення на бізнес.
Ранній успіх Reddit з Forge
Reddit є однією з перших компаній, яка використовує Forge для створення індивідуальних моделей безпеки, навчених на 23-річних даних модерації спільноти. Головний технічний директор Reddit Кріс Слоу каже, що інструмент є «революційним», що дозволяє їм створити модель, яка розуміє нюанси унікальної культури їхньої платформи. Їхня мета — замінити кілька існуючих систем безпеки однією вузькоспеціалізованою моделлю, яка зможе краще забезпечувати дотримання правил спільноти.
Слоу визнає, що Nova не є моделлю з найвищим рейтингом, але це не має значення. Важливою є здатність моделі виконувати заплановану функцію — у цьому випадку розуміти, що таке «неприємна» поведінка на Reddit.
Майбутнє штучного інтелекту: спеціалізація замість загального інтелекту
Amazon робить ставку на те, що змагання за найрозумніший ШІ менш важливі, ніж здатність створювати корисний ШІ. Компанія позиціонує себе як платформу для підприємств, які потребують індивідуальних рішень, а не як пряму конкуренцію з OpenAI і Anthropic щодо продуктивності чистої моделі. Ця стратегія узгоджується з основною філософією AWS: надання інфраструктури та інструментів, які дозволяють іншим впроваджувати інновації.
Amazon робить ставку на те, що гонка моделей була комерціалізована, і компанія може досягти успіху, ставши місцем, де компанії можуть створювати спеціалізований ШІ для конкретних бізнес-задач.
Зрештою, успіх цього підходу залежатиме від прийняття розробником. Але якщо Amazon має рацію, майбутнє штучного інтелекту залежить не від того, хто має найвищий результат тестування, а від того, хто може принести справжню цінність.
