AI com intenção em primeiro lugar: por que a maioria da IA de conversação falha e como corrigi-la

14
AI com intenção em primeiro lugar: por que a maioria da IA de conversação falha e como corrigi-la

A maioria dos projetos empresariais de IA fracassa não por causa de modelos fracos, mas por causa de uma arquitetura defeituosa. As organizações estão correndo para implantar soluções de pesquisa baseadas em Large Language Model (LLM), mas um mal-entendido fundamental sobre como os usuários realmente interagem com esses sistemas está aumentando os custos e frustrando os clientes. Um estudo recente da Coveo descobriu que 72% das consultas de pesquisa corporativa falham na primeira tentativa, e o Gartner prevê que muitas implantações não atenderão às expectativas. A questão central? Confiar na geração aumentada de recuperação (RAG) sem primeiro entender o que o usuário deseja.

O problema com o RAG padrão: intenção ignorada

A abordagem RAG padrão – incorporar uma consulta, recuperar conteúdo semelhante e, em seguida, passá-lo para um LLM – funciona em demonstrações, mas falha em aplicações do mundo real. Isso se deve a três falhas principais: a lacuna de intenção, a inundação de contexto e o ponto cego de atualização.

O RAG padrão trata a intenção como se fosse o mesmo que contexto, mas não é. Por exemplo, um usuário digitando “cancelar” pode significar o cancelamento de um serviço, um pedido ou um compromisso. Sem discernir isto, os sistemas muitas vezes devolvem documentos irrelevantes, levando à frustração.

As empresas estão inundadas de dados: catálogos de produtos, artigos de suporte, políticas e muito mais. Os modelos RAG recuperam informações de todas as fontes indiscriminadamente, ocultando informações úteis sob o ruído. Se um cliente perguntar como ativar um novo telefone, ele não precisará de perguntas frequentes sobre cobrança.

Finalmente, os embeddings de vetores são cegos em termos de tempo. A promoção do último trimestre parece idêntica à deste trimestre, mas apresentar ofertas desatualizadas prejudica a confiança.

Intenção primeiro: classificar antes de recuperar

A solução é um novo padrão de arquitetura: Intent-First. Em vez de recuperar o roteamento, classifique antes de recuperar. Isso significa usar um modelo de linguagem leve para analisar a intenção e o contexto da consulta e, em seguida, despachá-la para as fontes mais relevantes.

Não se trata de modelos melhores; trata-se de uma arquitetura melhor. As arquiteturas Intent-First usam um modelo de linguagem leve para analisar uma consulta quanto à intenção e ao contexto, antes de despachá-la para as fontes de conteúdo mais relevantes (documentos, APIs, agentes).

Como funciona: uma análise passo a passo

Um sistema Intent-First opera por meio de um processo de duas etapas:

  1. Serviço de classificação de intenções:
  2. Normaliza e expande a consulta.
  3. Prevê a intenção primária usando um modelo de transformador.
  4. Extrai a subintenção com base na primária (por exemplo, ORDER_STATUS, DEVICE_ISSUE ).
  5. Determina as fontes alvo com base no mapeamento de intenções.

  6. Serviço de recuperação baseado no contexto:

  7. Recupera de fontes filtradas, excluindo as irrelevantes.
  8. Personaliza os resultados se o usuário estiver autenticado.
  9. Pontua documentos com base na relevância, atualidade, personalização e correspondência de intenção.

Salvaguardas Críticas: Cuidados de Saúde como Exemplo

Em setores como o da saúde, salvaguardas adicionais são cruciais. As categorias de intenção devem incluir consultas clínicas, de cobertura, de agendamento, de cobrança e relacionadas à conta. As perguntas clínicas devem incluir isenções de responsabilidade e nunca substituem o aconselhamento médico profissional. Consultas complexas devem sempre ser encaminhadas para suporte humano.

Lidando com casos extremos: detecção de frustração

O sistema deve lidar com casos extremos detectando frustração. Palavras-chave como “terrível”, “ódio” ou “não funciona” devem desencadear uma escalada imediata para o suporte humano, ignorando totalmente a pesquisa.

Resultados e o imperativo estratégico

Os primeiros a adotar a arquitetura Intent-First observaram melhorias significativas na retenção de usuários. Quando a pesquisa funciona, os usuários retornam. Quando falha, eles abandonam o canal.

O mercado de IA conversacional está em expansão, mas as empresas que continuarem a implementar arquiteturas RAG padrão continuarão a falhar. A IA dará respostas erradas com segurança, os usuários abandonarão os canais digitais e os custos de suporte aumentarão. Intent-First não se trata de modelos melhores; trata-se de entender o que um usuário deseja antes de tentar ajudá-lo.

A demonstração é fácil. A produção é difícil. Mas o padrão para o sucesso da produção é claro: Intenção em primeiro lugar.