AI, ориентированный на намерения: Почему большинство разговорных AI терпят неудачу и как это исправить

15
AI, ориентированный на намерения: Почему большинство разговорных AI терпят неудачу и как это исправить

Большинство корпоративных AI-проектов терпят неудачу не из-за слабых моделей, а из-за ошибочной архитектуры. Организации спешат внедрять поисковые решения на базе больших языковых моделей (LLM), но фундаментальное непонимание того, как пользователи фактически взаимодействуют с этими системами, приводит к росту затрат и разочарованию клиентов. Недавнее исследование Coveo показало, что 72% корпоративных поисковых запросов не удаются с первой попытки, а Gartner прогнозирует, что многие внедрения не оправдают ожиданий. Основная проблема? Зависимость от генерации с расширением поиска (RAG) без предварительного понимания того, что хочет пользователь.

Проблема стандартного RAG: Игнорирование намерения

Стандартный подход RAG — встраивание запроса, извлечение похожего контента, а затем передача его в LLM — работает в демонстрациях, но разваливается в реальных приложениях. Это связано с тремя ключевыми сбоями: разрыв в понимании намерения, перегрузка контекстом и слепота к актуальности.

Стандартный RAG рассматривает намерение так, как будто оно то же самое, что и контекст, но это не так. Например, пользователь, вводящий слово «отменить», может иметь в виду отмену услуги, заказа или встречи. Без различения этого системы часто возвращают нерелевантные документы, что приводит к разочарованию.

Компании захлебываются в данных: каталоги продуктов, статьи поддержки, политики и многое другое. RAG-модели извлекают информацию из всех источников без разбора, погребая полезную информацию под шумом. Если клиент спрашивает, как активировать новый телефон, ему не нужны часто задаваемые вопросы по выставлению счетов.

Наконец, векторные встраивания не учитывают время. Акция прошлого квартала выглядит так же, как и акция этого квартала, но представление устаревших предложений подрывает доверие.

Намерение прежде всего: Классифицируй, прежде чем извлекать

Решение — новая архитектурная модель: Намерение прежде всего. Вместо извлечения, а затем маршрутизации, классифицируй перед извлечением. Это означает использование легкой языковой модели для анализа запроса на предмет намерения и контекста, а затем отправка его в наиболее релевантные источники.

Это не о лучших моделях; это о лучшей архитектуре. Архитектуры «Намерение прежде всего» используют легкую языковую модель для анализа запроса на предмет намерения и контекста, прежде чем отправлять его в наиболее релевантные источники контента (документы, API, агенты).

Как это работает: Пошаговая разбивка

Система «Намерение прежде всего» работает в двух этапах:

  1. Сервис классификации намерений:

    • Нормализует и расширяет запрос.
    • Предсказывает основное намерение с помощью трансформаторной модели.
    • Извлекает поднамерение на основе основного (например, СТАТУС_ЗАКАЗА, ПРОБЛЕМА_С_УСТРОЙСТВОМ ).
    • Определяет целевые источники на основе сопоставления намерений.
  2. Сервис поиска с учетом контекста:

    • Извлекает из отфильтрованных источников, исключая нерелевантные.
    • Персонализирует результаты, если пользователь аутентифицирован.
    • Оценивает документы на основе релевантности, новизны, персонализации и соответствия намерению.

Критические меры предосторожности: Здравоохранение как пример

В таких отраслях, как здравоохранение, дополнительные меры предосторожности крайне важны. Категории намерений должны включать клинические, страховые, планирование, выставление счетов и запросы, связанные со счетом. К клиническим вопросам должны прилагаться отказы от ответственности и они никогда не должны заменять профессиональную медицинскую консультацию. Сложные запросы всегда должны направляться в службу поддержки людям.

Обработка крайних случаев: Обнаружение разочарования

Система должна обрабатывать крайние случаи, обнаруживая разочарование. Ключевые слова, такие как «ужасно», «ненавижу» или «не работает», должны немедленно переключать на поддержку людей, полностью обходя поиск.

Результаты и стратегическая необходимость

Ранние пользователи архитектуры «Намерение прежде всего» добились значительного улучшения удержания пользователей. Когда поиск работает, пользователи возвращаются. Когда он не работает, они покидают канал.

Рынок разговорного AI стремительно растет, но компании, которые продолжают развертывать стандартные архитектуры RAG, будут продолжать терпеть неудачу. AI уверенно будет давать неверные ответы, пользователи будут отказываться от цифровых каналов, а расходы на поддержку будут расти. «Намерение прежде всего» — это не о лучших моделях; это о понимании того, чего хочет пользователь, прежде чем пытаться ему помочь.

Демонстрация проста. Производство сложно. Но модель производственного успеха ясна: Намерение прежде всего.