https://a.storyblok.com/f/270183/1368x665/dc1f750437/25jun_dev_blog_knowledge-ai_voice-api.jpg

Des agents Voice plus intelligents : Utiliser l'IA des connaissances pour éviter les hallucinations de l'IA

Publié le July 21, 2025

Temps de lecture : 10 minutes

Introduction : L'IA générative pour les manuels d'instruction

Vous souvenez-vous de la dernière fois où vous avez utilisé un manuel d'instructions ? Peut-être était-ce pour construire un meuble ou réparer un micro-ondes, mais je suis sûr que l'expérience vous a parfois laissé perplexe. Les manuels d'instruction sont frustrants parce qu'il faut savoir comment les consulter pour trouver exactement le problème que l'on rencontre.

Cependant, les manuels d'instruction et les FAQ similaires ont ceci de formidable qu'ils regorgent d'instructions détaillées et précieuses pour les consommateurs finaux. Si seulement il existait un moyen de transformer toutes ces données en une expérience utilisateur agréable. C'est désormais possible, grâce à AI Studio Voice et le nouvelle Knowledge AI.

Imaginez que vos clients puissent poser des questions avec leurs propres mots - sans avoir besoin de commandes rigides et préprogrammées - et qu'ils reçoivent des réponses instantanées et précises. Avec l'essor de l'IA générative, la création de ces robots vocaux flexibles est devenue plus facile que jamais. Avec l Knowledge AIvous pouvez désormais apprendre à un voicebot à comprendre un large éventail de questions humaines et à définir précisément ses réponses à partir d'une base de connaissances prédéfinie. Cela signifie que vos clients recevront à chaque fois les bonnes informations, sans le moindre bruit.

Ce tutoriel vous apprendra à construire un voicebot FAQ IA en utilisant le site web et les supports de formation d'une entreprise pour répondre de manière flexible et précise à toutes les questions des utilisateurs.

A colorful book titled 'Toddler 911! User Manual' on the left and a chatbot icon inside a smartphone on the right, connected by a magenta arrow.Visual metaphor illustrating the mission to convert the Toddler 911 user manual into an interactive voice bot using Knowledge AI.

Notre mission : Transformer un manuel d'instruction en un agent LLM

Notre mission dans cet article est de transformer le site web et le manuel d'instructions d'une entreprise en un VoiceBot. Tout comme vous pouvez appeler une entreprise pour obtenir des informations de base, vous pouvez aussi vouloir obtenir de l'aide, comme lorsque vous suivez un manuel d'instructions pour un réfrigérateur ou un grille-pain en panne. Nous utiliserons Knowledge AI pour automatiser cette interaction et faire gagner à votre entreprise un temps précieux.

Quel manuel d'utilisation allons-nous transformer en un voicebot FAQ IA ? J'ai décidé qu'il serait amusant de créer une entreprise fictive avec un manuel d'instructions fictif, le tout généré par des LLM bien sûr ! Nous allons créer un agent vocal d'IA pour "Toddler 911 !". Cette entreprise aide les parents à "opérer" leurs enfants.

Consultez le Toddler 911 et son manuel d'instructions. Nous reviendrons l'utiliser plus tard. J'ai trouvé que l'IA avait fait des graphiques d'entreprise assez formidables sur chaque page !

Conditions préalables

  • Vous aurez besoin d'un Account de développeur Vonage.

  • Vous aurez besoin de référencer ou de télécharger les ressources dans le site Web de Toddler 911 ! Toddler 911 ! GitHub repo

Vonage API Account

To complete this tutorial, you will need a Vonage API account. If you don’t have one already, you can sign up today and start building with free credit. Once you have an account, you can find your API Key and API Secret at the top of the Vonage API Dashboard.

Comment créer une base de connaissances

Avant de construire l'agent, nous devons mettre en place notre base de connaissances. Celle-ci sera le référentiel qui guidera les réponses de notre Gen AI. Naviguez jusqu'à l'onglet Onglet Knowledge AI dans le tableau de bord d'AI Studio.

Knowledge AI introduit deux nouveaux concepts : les sources et les index. Les sources sont des éléments individuels d'information et de données. Par exemple, une source peut être une URL (page d'un site web) ou un fichier. Regroupées, les sources créent des index. Le volume complet d'informations à partir duquel les agents peuvent générer des réponses s'appelle un index.

Commençons par créer notre premier index.

Comment ajouter une source dans Knowledge AI

Dans l'onglet Onglet Knowledge AIcliquez sur Ajouter une source. Un formulaire s'ouvre alors pour ajouter une nouvelle source.

Screenshot of the 'Add Source' dialog in Vonage AI Studio, showing options to upload a local file or enter a URL. A note explains that only text will be extracted, ignoring images and tables. Supported file types include TXT, HTML, and PDF.Add a new knowledge source in Vonage AI Studio by uploading a local file or providing a URL.

Vous remarquerez que les sources peuvent être un fichier local (TXT, HTML ou PDF) ou une URL accessible au public.

Ajoutez les liens vers le site web de l'entreprise :

Ajoutez maintenant les liens vers le matériel de formation. Mais n'ajoutez pas n'ajoutez pas la mise à jour de la formation sur les salles de bains 2024. Nous l'ajouterons plus tard.

Dropdown list showing five selected sources: 'Toddler 911 About Us', 'Snack', 'Clean Up Toys', 'Products', and 'Landing Page.'Expanded view of the 'Toddler 911 FAQs' index showing all five selected content sources in Knowledge AI.

Maintenant que nous disposons de quelques sources, nous allons pouvoir poser des questions plus souples. Passons maintenant à la création d'un index.

Comment créer un index

Cliquez sur l'onglet Index dans le panneau de gauche. Cliquez ensuite sur Ajouter un index. Tout d'abord, donnez à votre index un nom agréable, comme "Toddler 911 FAQs". Vérifiez ensuite toutes les sources que vous venez de créer et cliquez sur Enregistrer et quitter.

Table displaying five Knowledge AI sources with names, text sizes, and modification dates, all marked as successfully ingested.Source dashboard for AI Studio showing five uploaded website sources for the Toddler 911 project with total text size of 40.15KB.

Vous devriez maintenant voir un index disponible.

Interface displaying a list of indexes in Knowledge AI. The index 'Toddler 911 FAQs' includes sources like 'Toddler 911 Products' and 'Clean Up Toys.'Screenshot of the AI Studio index dashboard showing a single index called 'Toddler 911 FAQs' connected to five content sources.

Comment tester les index

Knowledge AI vous permet de tester les index avant de les associer à des agents. Pour ce faire, survolez un index et une icône de lecture apparaîtra. Cliquez sur le symbole de lecture pour ouvrir le testeur d'index.

Knowledge AI index dashboard with a tooltip labeled 'Index Testing' above the 'Toddler 911 FAQs' entry, which has a play button next to it."Tooltip and UI showing that the 'Toddler 911 FAQs' index can be tested within the AI Studio interface.

Vous pouvez maintenant poser toutes les questions que vous souhaitez et l'agent de test récupérera les réponses à partir de votre index. Essayez de poser des questions à partir de l'entreprise, car les LLM peuvent avoir besoin d'un contexte supplémentaire dans certaines situations. J'ai notamment constaté que le LLM avait du mal à distinguer les informations complexes. Par exemple, sur la page "À propos de nous", on peut lire : "[...] le fondateur et le directeur de l'entreprise".Fondateur & Directeur créatif d'Imaginative Play : Dr. Seuss-Vous pouvez poser des questions à des sites comme "Qu'est-ce que Toddler 911 ?", ou des questions tirées du matériel de formation comme "Comment faire pour que mon enfant nettoie sa chambre ? Vous pouvez également essayer de poser des questions qui ne figurent pas dans l'index pour vous assurer que le LLM n'a pas d'hallucinations. Par exemple, essayez de demander : "Comment faire pour que mon enfant commence à aller aux toilettes ?

Il est important de procéder à des tests approfondis, car il peut s'avérer nécessaire de donner aux MFR un contexte supplémentaire dans certaines situations. J'ai notamment constaté que le LLM avait du mal à distinguer les informations complexes. Par exemple, sur la page "À propos de nous", on peut lire : "...Fondateur et directeur créatif d'Imaginative Play : Dr. Seuss - Un parent et un entrepreneur passionné par la création de solutions qui donnent du pouvoir aux familles".

Cependant, lorsque je demande "Qui est le fondateur ?", le LLM répond "Impossible de trouver une réponse pertinente". Lorsque j'actualise la question en demandant : "Qui est le fondateur et le directeur créatif du jeu imaginatif ?", le LLM répond : "Dr Seuss".

Comment maintenir votre base de connaissances à jour pour les nouvelles mises à jour ?

Nous avons montré que le LLM n'est pas encore en mesure de répondre aux questions du public. 2024 Mise à jour de la formation sur les salles de bains. Ajoutons donc cette source. Vous pouvez l'ajouter en tant qu'URL - PDF dans le nuage ou télécharger le PDF et le charger en tant que fichier local. Mettez à jour votre index pour inclure la nouvelle source.

Maintenant, essayez à nouveau le testeur et posez la question précédente, "Comment faire pour que mon enfant commence à aller aux toilettes ?Comment faire pour que mon enfant commence à aller aux toilettes?" Cette fois-ci, l'agent devrait vous donner une bonne réponse.

Vous pouvez poser des questions complémentaires telles que "Quel est un exemple de célébration d'un succès ?" ou "Que se passerait-il si mon enfant avait un accident ?". Les tests ont pour but de déceler les lacunes et les problèmes de votre index.

Screenshot of the Index view in Vonage AI Studio showing an active query in the Pre-order Information index. The right panel displays a user question about order confirmation time and an AI-generated response sourced from internal documentation. The index includes multiple topics and source tags.Test and refine your Knowledge AI responses by creating and querying an index based on uploaded sources.

Remarquez le petit symbole des livres dans la réponse de l'IA de la connaissance. Vous pouvez cliquer dessus pour voir quelles sources ont été utilisées pour générer la réponse. Vous pouvez vous en servir pour modifier les sources d'un index afin d'obtenir de meilleurs résultats.

Maintenant que nous disposons d'un index que nous pouvons assigner à notre agent d'IA générative, construisons notre agent !

Comment créer un VoiceBot d'AI Studio

Pour commencer, nous devons créer un agent WhatsApp. Vous pouvez ouvrir AI Studio à partir de Vonage tableau de bord du développeur de Vonage puis suivre les instructions figurant dans la documentation AI Studio. Il y a trois options importantes pour notre agent, sélectionnez :

  • Type : Téléphonie

  • Modèle : Partir de zéro

  • Événement : Inbound

Comment utiliser le nœud de collecte des données de l'utilisateur

  • Accueillons nos utilisateurs avec un message de bienvenue. Utilisons la fonction Parler . Puisque le nom de notre entreprise est prononcé comme "Toddler Nine One One" au lieu de Ninehundred and eleven, nous devrons utiliser la fonction SSML say-as de SSML :

<speak> Hello and welcome to Toddler <say-as interpret-as='digits'>911</say-as>!</speak>

  • Ensuite, nous acceptons la réponse de l'utilisateur à l'aide d'une fonction Collecter l'entrée . Nous stockons la réponse dans un paramètre appelé enquête. Ajoutons une simple invite, "Comment puis-je vous aider ?". Ajoutons également 2 pour le "nombre de tentatives" et une invite de relance "Désolé, je n'ai pas compris. Pouvez-vous demander à nouveau ?

Sauf indication contraire, tous les paramètres de ce billet de blog utilisent l'entité @sys.any. Pour plus d'informations sur les entités (différents types de paramètres) dans AI Studio, veuillez lire la documentation.

Comment utiliser le nœud AI Studio Q&A

Comme cet article se concentre sur l'IA de la connaissance, nous ne nous occuperons pas de la classification de l'intention de l'utilisateur ou de la création de flux multiples. Nous pouvons continuer directement avec le nœud Q&A de la section conversation.

A GIF showing a flow being edited in AI Studio. A user adds a FAQ block from the sidebar and connects it to a welcome message and input collection.Animated walkthrough showing how to add a FAQ node in AI Studio that uses Knowledge AI to answer user questions.

La configuration de notre nœud sera la suivante :

  • Index : Toddler 911 FAQs (en anglais) (ou votre nom d'index)

  • Paramètre d'entrée de l'utilisateur : enquête

  • Paramètre de réponse : ai_response

  • Temps d'attente : 2 secondes

    • Temps maximum pendant lequel AI Studio attendra une réponse. Si le temps de réponse dépasse 2 secondes, le chemin de sortie Échec est déclenché.

Comment gérer les réponses de l'IA générative

Maintenant que nous avons connecté notre nœud pour obtenir les réponses de la FAQ, envoyons-les à nos utilisateurs ! L'ensemble du flux ressemblera à ceci :

Flowchart showing a 'Toddler 911! Q&A' node connected to AI response, fallback nodes, a repeat collection step, and a thank you message ending in 'End Call'.Overview of the full FAQ conversation flow in AI Studio, including AI-generated responses, fallback handling, and repeat prompts.

Cela peut sembler compliqué, mais il s'agit surtout de gérer les erreurs et d'améliorer l'expérience de l'utilisateur. Le nœud FAQ crée 3 points de sortie : $ai_response (succès), Don't Know, et Failed. Ces points de sortie nous permettent de gérer les erreurs en fonction du résultat obtenu.

Pour le construire :

  1. Pour point de sortie $ai_response utiliser un nœud Speak et lui demander d'envoyer simplement le message $ai_response paramètre. Connecter notre $ai_response à ce nœud.

  2. Pour Ne pas savoir point de sortie : utiliser un nœud Speak et lui faire envoyer un message d'erreur. Quelque chose comme "Désolé, je ne sais pas comment répondre à cette question. Essayons une autre question". Connectez notre Ne sait pas à ce nœud.

  3. Pour Échec utiliser un nœud Speak et lui faire dire quelque chose comme : " Désolé, quelque chose a mal tourné ".Désolé, quelque chose s'est mal passé. Réessayons ". Connectez notre nœud Échec à ce nœud.

Comment faire une boucle pour des questions multiples

Nous voulons permettre à l'utilisateur de poser plusieurs questions à notre voicebot.

Pour le construire :

  1. Créer un nœud Collect Input appelé Collect Repeat qui enregistrera un nouveau paramètre appelé répétition. Comme précédemment, nous avons une invite : "Voulez-vous poser une autre question ?". Nous donnerons également deux tentatives et une invite de réessai : "Désolé, je n'ai pas compris. Veuillez réessayer."

  2. Utiliser un nœud de condition qui vérifiera la présence de répéter. Créer une condition pour vérifier si répétition est égale à oui, et une autre pour vérifier si répéter est égale à non.

  3. Reliez à nouveau la condition vraie au nœud Collecte de la demande, le premier nœud d'entrée de collecte que nous avons utilisé et qui stocke la valeur de la fonction enquête

  4. Reliez la condition "faux" à un formulaire de nœud de Speak avant, qui remerciera l'utilisateur d'avoir utilisé l'agent :

<speak> Thank you for using Toddler <say-as interpret-as='digits'>911</say-as>!</speak>

5. Connectez le nœud du message de remerciement à un nœud de Fin d'appel de fin d'appel.

Conclusion

👏Applaudissez-vous ! Vous avez réussi ! Vous avez créé votre premier agent Generative AI Voice. Maintenant, testons-le à l'aide du testeur.

Avez-vous reçu l'appel téléphonique ? Avez-vous pu poser des questions sur les différentes fonctions de Toddler 911 ! Avez-vous appris des choses sur le Dr Seuss et Big Bird ? Maintenant que vous avez fait fonctionner l'agent, comment pourriez-vous l'améliorer ? Nous pourrions peut-être créer des flux distincts pour la FAQ de l'entreprise et le manuel d'instructions en utilisant les éléments suivants Intents et de la classification.

Quel que soit le comportement de votre agent, faites-le nous savoir ! Rejoignez la Slack de la communauté des développeurs de Vonage et dites-moi ce que vous construisez dans la section #ai-studio dans le canal #ai-studio. Ou retrouvez-nous sur X, anciennement connu sous le nom de Twitter.

Partager:

https://a.storyblok.com/f/270183/384x384/e4e7d1452e/benjamin-aronov.png
Benjamin AronovDéfenseur des développeurs

Benjamin Aronov est un défenseur des développeurs chez Vonage. C'est un bâtisseur de communauté qui a fait ses preuves, avec une formation en Ruby on Rails. Benjamin apprécie les plages de Tel Aviv, où il vit. Sa base à Tel Aviv lui permet de rencontrer et d'apprendre de certains des meilleurs fondateurs de startups du monde. En dehors de la technologie, Benjamin aime voyager à travers le monde à la recherche du parfait pain au chocolat.