Intent-Driven AI: Proč většina konverzačních AI selhává a jak to opravit

5

Většina projektů podnikové umělé inteligence selhává ne kvůli slabým modelům, ale kvůli chybné architektuře. Organizace spěchají s implementací vyhledávacích řešení založených na velkých jazykových modelech (LLM), ale zásadní nepochopení toho, jak uživatelé skutečně interagují s těmito systémy, vede k rostoucím nákladům a frustraci zákazníků. Nedávná studie Coveo zjistila, že 72 % dotazů podnikového vyhledávání selže na první pokus, a Gartner předpovídá, že mnoho implementací zaostane za očekáváním. Hlavní problém? Spoléhání na generování rozšíření vyhledávání (RAG), aniž byste nejprve pochopili, co uživatel chce.

Standardní problém RAG: Ignorování záměru

Standardní přístup RAG spočívající v vložení dotazu, načtení podobného obsahu a jeho předání LLM funguje v ukázkách, ale v aplikacích v reálném světě se rozpadá. Důvodem jsou tři klíčové chyby: mezera záměrů, přetížení kontextu a slepá relevance.

Standardní RAG zachází se záměrem, jako by to bylo totéž jako s kontextem, ale není tomu tak. Například uživatel, který zadá slovo „zrušit“, může znamenat zrušení služby, objednávky nebo schůzky. Bez tohoto rozlišení systémy často vracejí irelevantní dokumenty, což vede k frustraci.

Společnosti se topí v datech: katalogy produktů, články podpory, zásady a mnoho dalšího. Modely RAG získávají informace ze všech zdrojů bez rozdílu a pohřbívají užitečné informace v šumu. Pokud se zákazník zeptá, jak aktivovat nový telefon, nepotřebuje časté dotazy k fakturaci.

Konečně, vektorové vkládání nebere v úvahu čas. Akcie z minulého čtvrtletí vypadají stejně jako akcie tohoto čtvrtletí, ale prezentace zastaralých nabídek podkopává důvěru.

Záměr první: Před extrahováním klasifikujte

Řešením je nový architektonický model: Intent First. Místo načítání a následného směrování klasifikujte před načítáním. To znamená použití odlehčeného jazykového modelu k analýze požadavku na záměr a kontext a jeho odeslání do nejrelevantnějších zdrojů.

Nejde o nejlepší modely; jde o lepší architekturu. Architektury Intent First používají odlehčený jazykový model k analýze požadavku na záměr a kontext před jeho odesláním do nejrelevantnějších zdrojů obsahu (dokumenty, rozhraní API, agenti).

Jak to funguje: Rozdělení krok za krokem

Systém Intent First funguje ve dvou fázích:

  1. Služba klasifikace záměrů:
  2. Normalizuje a rozšiřuje dotaz.
  3. Předpovídá základní záměr pomocí modelu transformátoru.
  4. Načte dílčí záměr na základě hlavního (např. ORDER_STATUS, PROBLEM WITH_DEVICE ).
  5. Identifikuje cílové zdroje na základě mapování záměrů.

  6. Kontextová vyhledávací služba:

  7. Získává z filtrovaných zdrojů, s výjimkou nerelevantních.
  8. Přizpůsobí výsledky, pokud je uživatel ověřen.
  9. Vyhodnocuje dokumenty na základě relevance, novosti, personalizace a souladu se záměrem.

Kritická opatření: Zdravotní péče jako příklad

V odvětvích, jako je zdravotnictví, jsou nezbytná zvláštní opatření. Kategorie záměrů by měly zahrnovat klinické, pojišťovací, plánovací, fakturační a fakturační dotazy. Klinické otázky musí být doprovázeny prohlášením o vyloučení odpovědnosti a nikdy by neměly nahrazovat odbornou lékařskou pomoc. Složité požadavky by měly vždy směřovat k lidské podpoře.

Zvládání okrajových případů: Detekce frustrace

Systém musí řešit okrajové případy detekcí frustrace. Klíčová slova jako „strašný“, „nenávist“ nebo „nefungující“ by měla okamžitě změnit lidi, aby vás podpořili, a zcela obejít vyhledávání.

Výsledky a strategická nutnost

První uživatelé architektury Intent First zaznamenali výrazná zlepšení v udržení uživatelů. Když vyhledávání funguje, uživatelé se vracejí. Když to nefunguje, opustí kanál.

Trh s konverzační AI rychle roste, ale společnosti, které pokračují v nasazování standardních RAG architektur, budou i nadále krachovat. AI bude s jistotou poskytovat nesprávné odpovědi, uživatelé opustí digitální kanály a náklady na podporu porostou. „Intent First“ není o nejlepších modelech; jde o to pochopit co uživatel chce, než se mu pokusí pomoci.

Ukázka je jednoduchá. Výroba je obtížná. Ale model úspěchu ve výrobě je jasný: Záměr především.