додому Без рубрики ШІ, керований наміром: чому більшість розмовних ШІ дають збій і як це...

ШІ, керований наміром: чому більшість розмовних ШІ дають збій і як це виправити

ШІ, керований наміром: чому більшість розмовних ШІ дають збій і як це виправити

Більшість корпоративних проектів ШІ зазнають невдачі не через слабкі моделі, а через недоліки архітектури. Організації поспішають із впровадженням пошукових рішень на основі великої мовної моделі (LLM), але фундаментальне нерозуміння того, як користувачі насправді взаємодіють із цими системами, призводить до зростання витрат і розчарування клієнтів. Нещодавнє дослідження Coveo показало, що 72% запитів корпоративного пошуку зазнають невдачі з першої спроби, і Gartner прогнозує, що багато реалізацій не виправдають очікувань. Головна проблема? Покладення на генерацію розширення пошуку (RAG) без попереднього розуміння, чого хоче користувач.

Стандартна проблема RAG: ігнорування наміру

Стандартний підхід RAG, який передбачає вбудовування запиту, отримання подібного вмісту та передачу його в LLM, працює в демонстраційних версіях, але не працює в реальних програмах. Це пов’язано з трьома ключовими помилками: розрив намірів, перевантаження контексту та сліпота релевантності.

Стандартний RAG трактує намір так, ніби це те саме, що контекст, але це не так. Наприклад, користувач, який вводить слово «скасувати», може означати скасування послуги, замовлення або зустрічі. Без цього розрізнення системи часто повертають невідповідні документи, що призводить до розчарування.

Компанії потопають у даних: каталоги продуктів, статті підтримки, політики та багато іншого. Моделі RAG витягують інформацію з усіх джерел без розбору, ховаючи корисну інформацію під шумом. Якщо клієнт запитує, як активувати новий телефон, йому не потрібні поширені запитання щодо виставлення рахунків.

Нарешті, векторні вкладення не враховують час. Акції минулого кварталу виглядають так само, як і цього кварталу, але представлення застарілих пропозицій підриває довіру.

Намір спочатку: класифікуйте перед вилученням

Рішенням є нова архітектурна модель: Intent First. Замість отримання, а потім маршрутизації, класифікуйте перед отриманням. Це означає використання спрощеної мовної моделі для аналізу запиту щодо намірів і контексту, а потім надсилання його до найбільш відповідних джерел.

Справа не в найкращих моделях; мова йде про кращу архітектуру. Архітектури Intent First використовують спрощену мовну модель для аналізу запиту щодо наміру та контексту перед тим, як надсилати його до найбільш відповідних джерел вмісту (документів, API, агентів).

Як це працює: покрокова розбивка

Система Intent First працює в два етапи:

  1. Сервіс класифікації намірів:
  2. Нормалізує та розширює запит.
  3. Прогнозує основний намір за допомогою моделі трансформатора.
  4. Отримує піднамір на основі основного (наприклад, ORDER_STATUS, PROBLEM WITH_DEVICE ).
  5. Ідентифікує цільові джерела на основі відображення намірів.

  6. Сервіс контекстно-залежного пошуку:

  7. Отримується з відфільтрованих джерел, за винятком нерелевантних.
  8. Персоналізує результати, якщо користувач автентифікований.
  9. Оцінює документи на основі відповідності, новизни, персоналізації та узгодженості з наміром.

Важливі запобіжні заходи: охорона здоров’я як приклад

У таких галузях, як охорона здоров’я, необхідні додаткові запобіжні заходи. Категорії намірів мають включати клінічні, страхові, планування, виставлення рахунків і запити, пов’язані з виставленням рахунків. Клінічні запитання мають супроводжуватися застереженнями і ніколи не повинні замінювати професійну медичну консультацію. Складні запити завжди мають бути спрямовані до людської підтримки.

Обробка граничних випадків: виявлення невдач

Система повинна обробляти крайні випадки, виявляючи розчарування. Такі ключові слова, як «жахливо», «ненависть» або «не працює», повинні негайно переключити людей на підтримку вас, повністю минаючи пошук.

Результати та стратегічна необхідність

Перші користувачі архітектури Intent First відзначили значні покращення в утриманні користувачів. Коли пошук працює, користувачі повертаються. Коли це не працює, вони залишають канал.

Ринок розмовного штучного інтелекту стрімко зростає, але компанії, які продовжують розгортати стандартні архітектури RAG, продовжуватимуть зазнавати невдач. Штучний інтелект буде впевнено давати неправильні відповіді, користувачі відмовляться від цифрових каналів, а витрати на підтримку зростуть. «Intent First» не стосується найкращих моделей; мова йде про розуміння чого хоче користувач, перш ніж намагатися йому допомогти.

Демонстрація проста. Виробництво складне. Але модель успіху виробництва зрозуміла: Насамперед намір.

Exit mobile version