Amazon priorytetowo traktuje wykonalną sztuczną inteligencję, a nie wskaźniki przywództwa

4

Szef AI Amazona przekonuje, że pogoń za rankingami Big Language Model (LLM) odwraca uwagę od prawdziwego celu: stworzenia AI, która rozwiązuje konkretne problemy biznesowe. Rohit Prasad, starszy wiceprezes AGI w Amazonie, uważa, że ​​obecne testy porównawcze są niewiarygodne i nie odzwierciedlają prawdziwej użyteczności modelu. Twierdzi, że należy przenieść nacisk z wyników teoretycznych na możliwe do wykazania wyniki w świecie rzeczywistym.

Problem z testami porównawczymi AI

Branża sztucznej inteligencji ma obsesję na punkcie wskaźników porównawczych, ale są one niedoskonałe. Modele są trenowane na różnych zbiorach danych, a szacunki są często stronnicze lub niespójne. To sprawia, że ​​bezpośrednie porównania nie mają sensu. Prasad argumentuje, że jedynym uczciwym porównaniem byłoby wytrenowanie wszystkich modeli na identycznych danych, co jest niepraktyczne. Prawdziwym problemem jest to, że testy porównawcze nie mierzą wartości sztucznej inteligencji w praktycznych zastosowaniach.

Przedstawiamy Nova Forge: niestandardową sztuczną inteligencję na dużą skalę

Odpowiedzią Amazona jest Nova Forge, nowa usługa, która pozwala firmom trenować własne modele sztucznej inteligencji bez ponoszenia zwykle ogromnych kosztów. Forge zapewnia firmom dostęp do benchmarków z modelu Nova firmy Amazon na różnych etapach nauki. Dzięki temu mogą wprowadzać własne, zastrzeżone dane na początku procesu, kiedy model jest najbardziej podatny na uczenie się. Takie podejście pozwala uniknąć wad związanych z dostrajaniem modeli zamkniętych lub przetrenowaniem modeli z ciężarem otwartym, co może prowadzić do słabych wyników.

Forge zasadniczo demokratyzuje zaawansowany rozwój sztucznej inteligencji, oferując dostęp do narzędzi dostępnych wcześniej tylko dla dużych firm technologicznych. Amazon zbudował Forge wewnętrznie, ponieważ jego zespoły potrzebowały takich możliwości. Firma zawsze postępowała zgodnie ze schematem, w którym najpierw rozwiązuje się własne problemy, a następnie przekształca je w biznes.

Wczesny sukces na Reddicie dzięki Forge

Reddit jest jedną z pierwszych firm, które wykorzystały Forge do tworzenia niestandardowych modeli bezpieczeństwa opracowanych na podstawie danych zbieranych przez społeczność przez 23 lata. Dyrektor ds. technologii Reddit, Chris Slow, twierdzi, że narzędzie jest „rewolucyjne”, umożliwiając mu stworzenie modelu rozumiejącego niuanse wyjątkowej kultury ich platformy. Ich celem jest zastąpienie kilku istniejących systemów bezpieczeństwa jednym wysoce wyspecjalizowanym modelem, który może lepiej egzekwować zasady społeczności.

Slowe przyznaje, że Nova nie jest modelem najwyżej ocenianym, ale to nie ma znaczenia. Ważna jest zdolność modelu do pełnienia zamierzonej funkcji – w tym przypadku zrozumienie, co stanowi „paskudne” zachowanie na Reddicie.

Przyszłość sztucznej inteligencji: specjalizacja zamiast ogólnej inteligencji

Amazon obstawia, że wyścig o najmądrzejszą sztuczną inteligencję jest mniej ważny niż umiejętność tworzenia użytecznej sztucznej inteligencji. Firma pozycjonuje się jako platforma dla firm, które potrzebują niestandardowych rozwiązań, zamiast bezpośrednio konkurować z OpenAI i Anthropic w zakresie wydajności czysto modelowej. Strategia ta jest zgodna z podstawową filozofią AWS: zapewnianie infrastruktury i narzędzi, które umożliwiają innym wprowadzanie innowacji.

Amazon obstawia, że ​​wyścig modeli został skomercjalizowany i firma może odnieść sukces, stając się miejscem, w którym firmy mogą budować wyspecjalizowaną sztuczną inteligencję do konkretnych problemów biznesowych.

Ostatecznie powodzenie tego podejścia będzie zależeć od przyjęcia go przez programistów. Ale jeśli Amazon ma rację, przyszłość sztucznej inteligencji nie zależy od tego, kto uzyska najwyższy wynik w benchmarkach, ale od tego, kto może wnieść prawdziwą wartość.