Intent-First AI: waarom de meeste conversatie-AI faalt en hoe u dit kunt oplossen

12

De meeste AI-projecten voor ondernemingen mislukken niet vanwege zwakke modellen, maar vanwege een gebrekkige architectuur. Organisaties haasten zich om zoekoplossingen op basis van het Large Language Model (LLM) in te zetten, maar een fundamenteel misverstand over hoe gebruikers daadwerkelijk met deze systemen omgaan, drijft de kosten op en frustreert klanten. Uit een recent onderzoek van Coveo is gebleken dat 72% van de zakelijke zoekopdrachten bij de eerste poging mislukt, en Gartner voorspelt dat veel implementaties niet aan de verwachtingen zullen voldoen. Het kernprobleem? Een afhankelijkheid van Retrieval-Augmented Generation (RAG) zonder eerst te begrijpen wat de gebruiker wil.

Het probleem met standaard RAG: intentie genegeerd

De standaard RAG-aanpak – een zoekopdracht insluiten, soortgelijke inhoud ophalen en deze vervolgens doorgeven aan een LLM – werkt in demo’s, maar valt uiteen in echte toepassingen. Dit is te wijten aan drie belangrijke mislukkingen: de intentiekloof, de contextoverstroming en de blinde vlek op het gebied van versheid.

Standaard RAG behandelt intentie alsof het hetzelfde is als context, maar dat is niet zo. Als een gebruiker bijvoorbeeld ‘annuleren’ typt, kan dit betekenen dat een dienst, een bestelling of een afspraak wordt geannuleerd. Zonder dit te beseffen retourneren systemen vaak irrelevante documenten, wat tot frustratie leidt.

Bedrijven worden overspoeld met gegevens: productcatalogi, ondersteuningsartikelen, beleid en meer. RAG-modellen halen zonder onderscheid informatie uit alle bronnen en begraven nuttige informatie onder de ruis. Als een klant vraagt ​​hoe hij een nieuwe telefoon moet activeren, heeft hij geen veelgestelde vragen over facturering nodig.

Ten slotte zijn vectorinbeddingen tijdblind. De promotie van het afgelopen kwartaal lijkt identiek aan die van dit kwartaal, maar het presenteren van verouderde aanbiedingen tast het vertrouwen aan.

Intent-First: classificeren voor ophalen

De oplossing is een nieuw architectuurpatroon: Intent-First. In plaats van eerst op te halen en vervolgens te routeren, classificeert u voor het ophalen. Dit betekent dat u een lichtgewicht taalmodel gebruikt om de zoekopdracht te analyseren op intentie en context, en deze vervolgens naar de meest relevante bronnen verzendt.

Dit gaat niet over betere modellen; het gaat over betere architectuur. Intent-First-architecturen gebruiken een lichtgewicht taalmodel om een ​​query te ontleden op intentie en context, voordat deze naar de meest relevante inhoudsbronnen (documenten, API’s, agenten) wordt verzonden.

Hoe het werkt: een stapsgewijze analyse

Een Intent-First-systeem werkt via een proces in twee fasen:

  1. Service voor intentieclassificatie:
  2. Normaliseert en breidt de zoekopdracht uit.
  3. Voorspelt de primaire bedoeling met behulp van een transformatormodel.
  4. Extraheert de subintentie op basis van de primaire (bijvoorbeeld ORDER_STATUS, DEVICE_ISSUE ).
  5. Bepaalt doelbronnen op basis van intent mapping.

  6. Contextbewuste ophaalservice:

  7. Haalt op uit gefilterde bronnen, met uitzondering van irrelevante bronnen.
  8. Personaliseert resultaten als de gebruiker is geverifieerd.
  9. Scoort documenten op basis van relevantie, recentheid, personalisatie en intentiematch.

Kritieke waarborgen: gezondheidszorg als voorbeeld

In sectoren als de gezondheidszorg zijn aanvullende waarborgen van cruciaal belang. Intentiecategorieën moeten klinische, dekkings-, plannings-, facturerings- en accountgerelateerde vragen omvatten. Klinische vragen moeten disclaimers bevatten en mogen nooit professioneel medisch advies vervangen. Complexe vragen moeten altijd doorverwezen worden naar menselijke ondersteuning.

Randzaken afhandelen: frustratiedetectie

Het systeem moet randgevallen afhandelen door frustratie te detecteren. Zoekwoorden als ‘vreselijk’, ‘haat’ of ‘werkt niet’ zouden onmiddellijk moeten leiden tot een escalatie naar menselijke ondersteuning, waarbij zoekopdrachten volledig worden omzeild.

Resultaten en de strategische noodzaak

Early adopters van de Intent-First-architectuur hebben aanzienlijke verbeteringen gezien in het behoud van gebruikers. Wanneer zoeken werkt, keren gebruikers terug. Als het niet lukt, verlaten ze het kanaal.

De markt voor conversatie-AI bloeit, maar ondernemingen die standaard RAG-architecturen blijven inzetten, zullen blijven falen. AI zal zelfverzekerd verkeerde antwoorden geven, gebruikers zullen digitale kanalen verlaten en de ondersteuningskosten zullen stijgen. Intent-First gaat niet over betere modellen; het gaat erom dat je begrijpt wat een gebruiker wil voordat je hem probeert te helpen.

De demo is eenvoudig. De productie is moeilijk. Maar het patroon voor productiesucces is duidelijk: Intent First.