Většina projektů podnikové umělé inteligence selhává ne kvůli slabým modelům, ale kvůli chybné architektuře. Organizace spěchají s implementací vyhledávacích řešení založených na velkých jazykových modelech (LLM), ale zásadní nepochopení toho, jak uživatelé skutečně interagují s těmito systémy, vede k rostoucím nákladům a frustraci zákazníků. Nedávná studie Coveo zjistila, že 72 % dotazů podnikového vyhledávání selže na první pokus, a Gartner předpovídá, že mnoho implementací zaostane za očekáváním. Hlavní problém? Spoléhání na generování rozšíření vyhledávání (RAG), aniž byste nejprve pochopili, co uživatel chce.
Standardní problém RAG: Ignorování záměru
Standardní přístup RAG spočívající v vložení dotazu, načtení podobného obsahu a jeho předání LLM funguje v ukázkách, ale v aplikacích v reálném světě se rozpadá. Důvodem jsou tři klíčové chyby: mezera záměrů, přetížení kontextu a slepá relevance.
Standardní RAG zachází se záměrem, jako by to bylo totéž jako s kontextem, ale není tomu tak. Například uživatel, který zadá slovo „zrušit“, může znamenat zrušení služby, objednávky nebo schůzky. Bez tohoto rozlišení systémy často vracejí irelevantní dokumenty, což vede k frustraci.
Společnosti se topí v datech: katalogy produktů, články podpory, zásady a mnoho dalšího. Modely RAG získávají informace ze všech zdrojů bez rozdílu a pohřbívají užitečné informace v šumu. Pokud se zákazník zeptá, jak aktivovat nový telefon, nepotřebuje časté dotazy k fakturaci.
Konečně, vektorové vkládání nebere v úvahu čas. Akcie z minulého čtvrtletí vypadají stejně jako akcie tohoto čtvrtletí, ale prezentace zastaralých nabídek podkopává důvěru.
Záměr první: Před extrahováním klasifikujte
Řešením je nový architektonický model: Intent First. Místo načítání a následného směrování klasifikujte před načítáním. To znamená použití odlehčeného jazykového modelu k analýze požadavku na záměr a kontext a jeho odeslání do nejrelevantnějších zdrojů.
Nejde o nejlepší modely; jde o lepší architekturu. Architektury Intent First používají odlehčený jazykový model k analýze požadavku na záměr a kontext před jeho odesláním do nejrelevantnějších zdrojů obsahu (dokumenty, rozhraní API, agenti).
Jak to funguje: Rozdělení krok za krokem
Systém Intent First funguje ve dvou fázích:
- Služba klasifikace záměrů:
- Normalizuje a rozšiřuje dotaz.
- Předpovídá základní záměr pomocí modelu transformátoru.
- Načte dílčí záměr na základě hlavního (např.
ORDER_STATUS,PROBLEM WITH_DEVICE). -
Identifikuje cílové zdroje na základě mapování záměrů.
-
Kontextová vyhledávací služba:
- Získává z filtrovaných zdrojů, s výjimkou nerelevantních.
- Přizpůsobí výsledky, pokud je uživatel ověřen.
- Vyhodnocuje dokumenty na základě relevance, novosti, personalizace a souladu se záměrem.
Kritická opatření: Zdravotní péče jako příklad
V odvětvích, jako je zdravotnictví, jsou nezbytná zvláštní opatření. Kategorie záměrů by měly zahrnovat klinické, pojišťovací, plánovací, fakturační a fakturační dotazy. Klinické otázky musí být doprovázeny prohlášením o vyloučení odpovědnosti a nikdy by neměly nahrazovat odbornou lékařskou pomoc. Složité požadavky by měly vždy směřovat k lidské podpoře.
Zvládání okrajových případů: Detekce frustrace
Systém musí řešit okrajové případy detekcí frustrace. Klíčová slova jako „strašný“, „nenávist“ nebo „nefungující“ by měla okamžitě změnit lidi, aby vás podpořili, a zcela obejít vyhledávání.
Výsledky a strategická nutnost
První uživatelé architektury Intent First zaznamenali výrazná zlepšení v udržení uživatelů. Když vyhledávání funguje, uživatelé se vracejí. Když to nefunguje, opustí kanál.
Trh s konverzační AI rychle roste, ale společnosti, které pokračují v nasazování standardních RAG architektur, budou i nadále krachovat. AI bude s jistotou poskytovat nesprávné odpovědi, uživatelé opustí digitální kanály a náklady na podporu porostou. „Intent First“ není o nejlepších modelech; jde o to pochopit co uživatel chce, než se mu pokusí pomoci.
Ukázka je jednoduchá. Výroba je obtížná. Ale model úspěchu ve výrobě je jasný: Záměr především.



























