Anthropic, přední vývojář umělé inteligence, oznámil vytvoření nového modelu s názvem Claude Mythos Preview. V rámci kroku, který znamená posun v přístupech ke správě vysoce výkonné umělé inteligence, se však společnost rozhodla neuvolnit model pro veřejnost.
Místo toho Anthropic omezuje přístup na malý okruh vůdců v oboru, aby řešil rostoucí problém: riziko použití pokročilé umělé inteligence jako zbraně v kybernetické válce.
Projekt Glasswing: Obranná koalice
Namísto rozsáhlého spuštění Anthropic zavádí Mythos prostřednictvím konsorcia známého jako Project Glasswing. Tato skupina zahrnuje více než 40 hlavních technologických hráčů, včetně:
- Technologičtí giganti: Apple, Amazon, Microsoft a Google.
- Dodavatelé zařízení a infrastruktury: Cisco a Broadcom.
- Ochránci otevřeného zdroje: Linux Foundation.
Cílem této koalice je využít pokročilé schopnosti uvažování modelu k identifikaci a opravě bezpečnostních zranitelností v kriticky důležitém softwaru a infrastruktuře dříve, než je mohou zneužít útočníci. Na podporu této iniciativy poskytuje Anthropic projektu až 100 milionů $ v kreditech Claude.
Proč na tom záleží: AI je „zúčtování“
Rozhodnutí skrýt Mythos před veřejností zdůrazňuje rostoucí napětí v odvětví umělé inteligence: rovnováhu mezi inovacemi a bezpečností. Jak se modely stávají schopnějšími porozumět složitému kódu, stávají se technologiemi dvojího použití. Na jedné straně mohou vývojářům pomoci chránit software; na druhou stranu je mohou hackeři využít k nalezení zero-day zranitelností (chyb, o kterých si tvůrci softwaru zatím nejsou vědomi).
Antropický management věří, že se blížíme ke kritickému inflexnímu bodu v kybernetické bezpečnosti.
„Naším cílem je zvýšit povědomí a poskytnout čestným hráčům výhodu v procesu ochrany veřejné a soukromé infrastruktury a kódu,“
– Jared Kaplan, hlavní vědec společnosti Anthropic
Logan Graham, vedoucí týmu pro testování bezpečnosti Anthropic, označil vydání za „zúčtování“ pro celé odvětví. To znamená, že současné postupy zabezpečení softwaru nemusí stačit v době, kdy umělá inteligence dokáže automatizovat vyhledávání sofistikovaných exploitů.
Změna paradigmatu řízení umělé inteligence
Omezením přístupu k Mythos na prověřenou skupinu „hráčů v dobré víře“ se Anthropic pokouší vytvořit precedens pro to, jak by se mělo zacházet s „hraničními modely“ – AI s potenciálně nebezpečnými schopnostmi. Tento přístup znamená posun od tradičního modelu „otevřeného vydání“ k více kontrolované strategii kolektivní obrany.
Tento krok vyvolává důležité otázky o budoucnosti tohoto odvětví:
Budou ostatní vývojáři umělé inteligence následovat tento omezující model při vytváření vysoce výkonných nástrojů?
– Bude soukromé konsorcium schopno účinně chránit globální digitální infrastrukturu?
– Jak se bude vyvíjet propast mezi „defenzivní AI“ a „ofenzivní AI“?
Závěr
Rozhodnutí Anthropic omezit přístup k Claude Mythos znamená novou éru vývoje AI, kde je schopnost chránit software považována za příliš nebezpečnou na to, aby byla ponechána v rukou široké veřejnosti. S Project Glasswing se společnost snaží vybudovat obranný štít, aby zůstala o krok napřed před kybernetickými hrozbami řízenými umělou inteligencí.
