AI Intent-First: Mengapa Kebanyakan AI Percakapan Gagal & Cara Memperbaikinya

10

Sebagian besar proyek AI perusahaan gagal bukan karena model yang lemah, namun karena arsitektur yang cacat. Banyak organisasi yang terburu-buru untuk menerapkan solusi pencarian yang didukung Model Bahasa Besar (LLM), namun kesalahpahaman mendasar tentang bagaimana pengguna sebenarnya berinteraksi dengan sistem ini meningkatkan biaya dan membuat pelanggan frustrasi. Studi terbaru dari Coveo menemukan bahwa 72% kueri penelusuran perusahaan gagal pada percobaan pertama, dan Gartner memperkirakan bahwa banyak penerapan yang tidak akan memenuhi harapan. Masalah intinya? Ketergantungan pada Retrieval-Augmented Generation (RAG) tanpa terlebih dahulu memahami apa yang diinginkan pengguna.

Masalah RAG Standar: Niat Diabaikan

Pendekatan RAG standar—menyematkan kueri, mengambil konten serupa, lalu meneruskannya ke LLM—berfungsi dalam demo, namun tidak berfungsi dalam aplikasi dunia nyata. Hal ini disebabkan oleh tiga kegagalan utama: kesenjangan niat, banjir konteks, dan titik buta kesegaran.

RAG standar memperlakukan maksud seolah-olah sama dengan konteks, padahal sebenarnya tidak. Misalnya, pengguna mengetik “batal” bisa berarti membatalkan layanan, pesanan, atau janji temu. Tanpa menyadari hal ini, sistem sering kali mengembalikan dokumen yang tidak relevan, sehingga menimbulkan frustrasi.

Perusahaan kebanjiran data: katalog produk, artikel dukungan, kebijakan, dan banyak lagi. Model RAG mengambil dari semua sumber tanpa pandang bulu, mengubur informasi berguna di bawah noise. Jika pelanggan menanyakan cara mengaktifkan ponsel baru, mereka tidak memerlukan FAQ penagihan.

Terakhir, penyematan vektor tidak mengenal waktu. Promosi pada kuartal terakhir terlihat sama dengan promosi pada kuartal ini, namun menghadirkan penawaran yang sudah ketinggalan zaman akan mengikis kepercayaan.

Maksud-Pertama: Klasifikasikan Sebelum Mengambil

Solusinya adalah pola arsitektur baru: Intent-First. Daripada mengambil lalu merutekan, klasifikasikan sebelum mengambil. Ini berarti menggunakan model bahasa yang ringan untuk mengurai kueri untuk maksud dan konteks, lalu mengirimkannya ke sumber yang paling relevan.

Ini bukan tentang model yang lebih baik; ini tentang arsitektur yang lebih baik. Arsitektur Intent-First menggunakan model bahasa ringan untuk mengurai kueri maksud dan konteks, sebelum dikirim ke sumber konten yang paling relevan (dokumen, API, agen).

Cara Kerja: Perincian Langkah demi Langkah

Sistem Intent-First beroperasi melalui proses dua tahap:

  1. Layanan Klasifikasi Maksud:
  2. Menormalkan dan memperluas kueri.
  3. Memprediksi maksud utama menggunakan model transformator.
  4. Mengekstrak sub-maksud berdasarkan sub-maksud utama (misalnya, ORDER_STATUS, DEVICE_ISSUE ).
  5. Menentukan sumber target berdasarkan pemetaan niat.

  6. Layanan Pengambilan Sadar Konteks:

  7. Mengambil dari sumber yang difilter, tidak termasuk sumber yang tidak relevan.
  8. Personalisasi hasil jika pengguna diautentikasi.
  9. Menskor dokumen berdasarkan relevansi, kekinian, personalisasi, dan kecocokan maksud.

Perlindungan Kritis: Layanan Kesehatan sebagai Contoh

Dalam industri seperti layanan kesehatan, perlindungan tambahan sangatlah penting. Kategori maksud harus mencakup pertanyaan terkait klinis, cakupan, penjadwalan, penagihan, dan akun. Pertanyaan klinis harus menyertakan penafian dan jangan pernah menggantikan nasihat medis profesional. Kueri yang rumit harus selalu diarahkan ke dukungan manusia.

Menangani Kasus Edge: Deteksi Frustrasi

Sistem harus menangani kasus-kasus ekstrem dengan mendeteksi frustrasi. Kata kunci seperti “mengerikan”, “benci”, atau “tidak berfungsi” harus segera memicu peningkatan dukungan manusia, sehingga mengabaikan penelusuran sama sekali.

Hasil & Keharusan Strategis

Pengguna awal arsitektur Intent-First telah melihat peningkatan signifikan dalam retensi pengguna. Saat pencarian berhasil, pengguna kembali. Jika gagal, mereka meninggalkan saluran tersebut.

Pasar AI percakapan sedang booming, namun perusahaan yang terus menerapkan arsitektur RAG standar akan terus mengalami kegagalan. AI dengan yakin akan memberikan jawaban yang salah, pengguna akan meninggalkan saluran digital, dan biaya dukungan akan meningkat. Intent-First bukan tentang model yang lebih baik; ini tentang memahami apa yang diinginkan pengguna sebelum Anda mencoba membantu mereka.

Demonya mudah. Produksinya sulit. Namun pola keberhasilan produksi jelas: Niat Yang Utama.