https://a.storyblok.com/f/270183/1368x665/dc1f750437/25jun_dev_blog_knowledge-ai_voice-api.jpg

Agentes de voz más inteligentes: Utilizar la IA del conocimiento para evitar las alucinaciones de la IA

Publicado el July 21, 2025

Tiempo de lectura: 9 minutos

Introducción: Inteligencia artificial generativa para manuales de instrucciones

¿Recuerda la última vez que utilizó un manual de instrucciones? Puede que fuera para construir unos muebles o arreglar un microondas, pero seguro que la experiencia te dejó confuso en alguna ocasión. Los manuales de instrucciones son frustrantes porque hay que saber buscar en ellos exactamente el problema que se tiene.

Sin embargo, lo bueno de los manuales de instrucciones y otras preguntas frecuentes similares es que están llenos de instrucciones detalladas y valiosas para los consumidores finales. Ojalá hubiera una forma de convertir todos esos datos en una experiencia de usuario agradable. Ahora la hay, con AI Studio Voice y el nueva IA del conocimiento.

Imagine que sus clientes pueden hacer preguntas con sus propias palabras -sin necesidad de comandos rígidos preprogramados- y recibir respuestas precisas al instante. Con el auge de la Inteligencia Artificial Generativa, crear robots de voz tan flexibles es ahora más fácil que nunca. Con IA del conocimientoahora puede entrenar a un robot de voz para que comprenda una amplia gama de preguntas humanas y elabore sus respuestas con precisión a partir de una base de conocimientos predefinida. Esto significa que sus clientes recibirán siempre la información correcta, sin ruido.

Este tutorial le enseñará a construir un robot de voz de AI FAQ utilizando el sitio web de una empresa y los materiales de formación para responder a cualquier pregunta de los usuarios de forma flexible y precisa.

A colorful book titled 'Toddler 911! User Manual' on the left and a chatbot icon inside a smartphone on the right, connected by a magenta arrow.Visual metaphor illustrating the mission to convert the Toddler 911 user manual into an interactive voice bot using Knowledge AI.

Nuestra misión: Convertir un manual de instrucciones en un agente LLM

Nuestra misión en este artículo es convertir la página web y el Manual de Instrucciones de una empresa en un VoiceBot. Del mismo modo que puedes llamar a una empresa para obtener información básica, es posible que también quieras obtener ayuda, como cuando sigues un Manual de Instrucciones para un frigorífico o una tostadora estropeados. Utilizaremos Knowledge AI para automatizar esta interacción y ahorrar a su empresa el valioso tiempo de sus empleados.

¿Qué manual de instrucciones convertiremos en un robot de voz AI FAQ? Bueno, he decidido que sería divertido crear una empresa ficticia con un manual de instrucciones ficticio, ¡todo generado por LLMs, por supuesto! Vamos a crear un AI Voice Agent para "Toddler 911!". Esta empresa ayuda a los padres a "operar" a sus hijos.

Echa un vistazo a la Toddler 911 y el manual de instrucciones. Volveremos a utilizarlo más adelante. ¡Me pareció que la IA hizo algunos gráficos de la empresa bastante fabuloso en cada página!

Requisitos previos

  • Necesitarás una Vonage Developer Account

  • Deberá consultar o descargar los recursos de la sección ¡Niño 911! GitHub repositorio

Vonage API Account

To complete this tutorial, you will need a Vonage API account. If you don’t have one already, you can sign up today and start building with free credit. Once you have an account, you can find your API Key and API Secret at the top of the Vonage API Dashboard.

Cómo crear una base de conocimientos

Antes de construir el agente, necesitamos configurar nuestra Base de Conocimientos. Este será el repositorio que guiará las respuestas de nuestra Gen AI. Navega hasta la pestaña Pestaña Conocimiento AI en el panel de AI Studio.

Knowledge AI introduce dos nuevos conceptos: Fuentes e Índices. Las fuentes son piezas individuales de información y datos. Por ejemplo, una fuente puede ser una URL (página de un sitio web) o un archivo. Agrupadas, las fuentes crean índices. El volumen total de información a partir del cual los agentes pueden generar respuestas se denomina índice.

Empecemos a crear nuestro primer índice.

Cómo añadir una fuente en Knowledge AI

Dentro de la pestaña pestaña Knowledge AIhaga clic en Añadir fuente. Se abrirá un formulario para añadir una nueva fuente.

Screenshot of the 'Add Source' dialog in Vonage AI Studio, showing options to upload a local file or enter a URL. A note explains that only text will be extracted, ignoring images and tables. Supported file types include TXT, HTML, and PDF.Add a new knowledge source in Vonage AI Studio by uploading a local file or providing a URL.

Observará que las fuentes pueden ser un archivo local (TXT, HTML o PDF) o una URL de acceso público.

Añada los enlaces al sitio web de la empresa:

Ahora añada los enlaces para el material de formación. Pero no añadir la actualización de la formación de baño 2024. Lo añadiremos más tarde.

Dropdown list showing five selected sources: 'Toddler 911 About Us', 'Snack', 'Clean Up Toys', 'Products', and 'Landing Page.'Expanded view of the 'Toddler 911 FAQs' index showing all five selected content sources in Knowledge AI.

Ahora que tenemos algunas fuentes, podremos hacer preguntas más flexibles. Pasemos a crear un Índice.

Cómo crear un índice

Haga clic en la pestaña Índice del panel izquierdo. A continuación, haga clic en Añadir índice. En primer lugar, asigne a su índice un nombre bonito, como "Preguntas frecuentes sobre el 911 para niños pequeños". A continuación, compruebe todas las fuentes recién creadas y pulse Guardar y Salir.

Table displaying five Knowledge AI sources with names, text sizes, and modification dates, all marked as successfully ingested.Source dashboard for AI Studio showing five uploaded website sources for the Toddler 911 project with total text size of 40.15KB.

Ahora debería ver un Índice disponible.

Interface displaying a list of indexes in Knowledge AI. The index 'Toddler 911 FAQs' includes sources like 'Toddler 911 Products' and 'Clean Up Toys.'Screenshot of the AI Studio index dashboard showing a single index called 'Toddler 911 FAQs' connected to five content sources.

Cómo probar los índices

Knowledge AI le permite probar los índices antes de conectarlos a los agentes. Para ello, pase el ratón sobre un índice y aparecerá un icono de reproducción. Haga clic en el símbolo de reproducción y se abrirá el Probador de Índices.

Knowledge AI index dashboard with a tooltip labeled 'Index Testing' above the 'Toddler 911 FAQs' entry, which has a play button next to it."Tooltip and UI showing that the 'Toddler 911 FAQs' index can be tested within the AI Studio interface.

Ahora puedes hacer las preguntas que quieras y el agente de pruebas recuperará las respuestas de tu Índice. Trata de hacer las preguntas desde la empresa, ya que los LLM pueden necesitar que se les dé un contexto extra en ciertas situaciones. Un caso que encontré fue que al LLM le costaba distinguir información compleja. Por ejemplo, en la página Quiénes somos, dice "Fundador y Director creativo de Imaginative Play: Dr. Seuss-como "¿Qué es Toddler 911?", o preguntas del material de formación como "¿Cómo consigo que mi hijo limpie su habitación?". También puedes intentar hacer preguntas que no estén en el Index para asegurarte de que el LLM no está alucinando. Por ejemplo, intenta preguntar: "¿Cómo consigo que mi hijo empiece a ir al baño?".

Es importante realizar pruebas minuciosas, ya que puede ser necesario dar a los LLM un contexto adicional en determinadas situaciones. Un caso que encontré fue que al LLM le costaba distinguir información compleja. Por ejemplo, en la página Quiénes somos, dice: "Fundador y director creativo de Imaginative Play: Dr. Seuss - Un padre y empresario apasionado por crear soluciones que empoderen a las familias".

Sin embargo, cuando pregunto: "¿Quién es el fundador?", el LLM responde: "Incapaz de encontrar una respuesta relevante". Cuando actualizo la pregunta a: "¿Quién es el fundador y director creativo del juego imaginativo?", el LLM responde: "Dr. Seuss".

Cómo mantener actualizada su base de conocimientos

Demostramos que el LLM aún no es capaz de responder a las preguntas del Actualización de la formación sobre baños 2024. Así que agreguemos eso como una nueva Fuente. Puedes añadirlo como una URL - Nube PDF o descargar el PDF y cargarlo como archivo local. Actualice su Índice para incluir la nueva Fuente.

Ahora prueba de nuevo el comprobador y haz nuestra pregunta anterior, "¿Cómo consigo que mi hijo empiece a ir al baño?" Esta vez deberías recibir una buena respuesta del agente.

Puede hacer preguntas de seguimiento como: "¿Cuál es un ejemplo de celebración del éxito?" o "¿Qué pasaría si mi hijo tuviera un accidente?". El objetivo de las pruebas es encontrar agujeros y áreas problemáticas en su Índice.

Screenshot of the Index view in Vonage AI Studio showing an active query in the Pre-order Information index. The right panel displays a user question about order confirmation time and an AI-generated response sourced from internal documentation. The index includes multiple topics and source tags.Test and refine your Knowledge AI responses by creating and querying an index based on uploaded sources.

Fíjate en el pequeño símbolo de los libros en la respuesta de Knowledge AI. Puede hacer clic en él para ver qué fuentes se utilizaron para generar la respuesta. Puedes utilizarlo para ajustar las fuentes de un índice y obtener mejores resultados.

Ahora que tenemos un Índice que podemos asignar a nuestro agente de IA Generativa, ¡construyamos nuestro agente!

Cómo crear un robot de voz de AI Studio

Para empezar necesitaremos crear un agente de WhatsApp. Puedes abrir AI Studio desde Vonage Desarrollador de Vonage y seguir las instrucciones que se encuentran en la documentación de AI Studio. Hay tres opciones importantes para nuestro agente, selecciona:

  • Tipo: Telefonía

  • Plantilla: Empezar de cero

  • Evento: Entrada

Cómo utilizar el nodo de recogida de datos del usuario

  • Saludemos a nuestros usuarios con un mensaje de bienvenida. Utilicemos la función Hable nodo. Como el nombre de nuestra empresa se dice como "Toddler Nine One One" en lugar de Ninehundred and eleven, tendremos que hacer uso del nodo SSML say-as SSML:

<speak> Hello and welcome to Toddler <say-as interpret-as='digits'>911</say-as>!</speak>

  • A continuación, aceptaremos la respuesta de nuestro usuario con un método Recoger entrada . Almacenaremos la respuesta en un parámetro llamado consulta. Añadamos un prompt sencillo, "¿En qué puedo ayudarle?". Además, añadamos 2 para "número de reintentos" y un prompt de reintento de "Lo siento, no lo he conseguido. ¿Puede preguntar de nuevo?".

A menos que se especifique lo contrario, todos los parámetros de esta entrada de blog utilizarán la entidad @sys.any. Para obtener más información sobre las entidades (diferentes tipos de parámetros) en AI Studio, por favor leer la documentación.

Cómo utilizar el nodo de preguntas y respuestas de AI Studio

Como este artículo se centra en la Inteligencia Artificial del Conocimiento, no nos molestaremos en clasificar nuestra Intención de Usuario o en crear múltiples flujos. Podemos continuar directamente con el nodo Q&A de la sección de conversación.

A GIF showing a flow being edited in AI Studio. A user adds a FAQ block from the sidebar and connects it to a welcome message and input collection.Animated walkthrough showing how to add a FAQ node in AI Studio that uses Knowledge AI to answer user questions.

La configuración para nuestro nodo será:

  • Índice: Preguntas frecuentes sobre el 911 para niños pequeños (o su nombre en el Índice)

  • Parámetro de entrada del usuario: consulta

  • Parámetro de respuesta: ai_respuesta

  • Tiempo de espera: 2 segundos

    • El tiempo máximo que AI Studio esperará una respuesta. Si el tiempo de respuesta supera los 2 segundos, se activará la ruta de salida Fallida.

Cómo manejar las respuestas generativas de la IA

Ahora que hemos conectado nuestro nodo para obtener respuestas a las FAQ, ¡vamos a enviarlas a nuestros usuarios! Todo el flujo tendrá este aspecto:

Flowchart showing a 'Toddler 911! Q&A' node connected to AI response, fallback nodes, a repeat collection step, and a thank you message ending in 'End Call'.Overview of the full FAQ conversation flow in AI Studio, including AI-generated responses, fallback handling, and repeat prompts.

Esto puede parecer un poco complicado, pero la mayor parte es la gestión de errores y la mejora de la experiencia del usuario. El nodo FAQ crea 3 puntos de salida: $ai_response (éxito), Don't Know, y Failed. Estos puntos de salida nos proporcionan un manejo de errores dependiendo del resultado que obtengamos.

Para construirlo:

  1. Para $ai_respuesta utilice un nodo Speak y haga que simplemente envíe el mensaje $ai_respuesta parámetro. Conecta nuestro $ai_respuesta a este nodo.

  2. Para No sé punto de salida:Utiliza un nodo Speak y haz que envíe un mensaje de error. Algo como "Lo siento, no sé cómo responder a eso. Probemos con otra pregunta". Conecta nuestro No sabe a este nodo.

  3. Para Fallido Utiliza un nodo Speak y haz que diga algo como "Lo sentimos, algo salió mal. Intentémoslo de nuevo". Conecta nuestro Fallido a este nodo.

Cómo hacer un bucle para varias preguntas

Queremos que el usuario pueda hacer varias preguntas a nuestro robot de voz.

Para construirlo:

  1. Crear un nodo Collect Input llamado Collect Repeat que guardará un nuevo Parámetro llamado repetir. Al igual que antes tengamos un prompt: "¿Le gustaría hacer otra pregunta?". También daremos 2 reintentos y un prompt de reintento de: "Lo siento, no lo he conseguido. Por favor, inténtelo de nuevo".

  2. Utilizar un Nodo Condición que comprobará si repetir. Cree una condición para comprobar si repetir es igual a yes, y otra para comprobar si repite es igual a no.

  3. Conecte de nuevo la condición true al nodo Collect Inquiry, el primer nodo de entrada collect que utilizamos y que almacena el valor de consulta

  4. Conecte la condición falsa a un formulario del nodo Speak anterior, que agradecerá al usuario el uso del agente:

<speak> Thank you for using Toddler <say-as interpret-as='digits'>911</say-as>!</speak>

5. Conecte el nodo de mensaje de agradecimiento a un Finalizar llamada llamada.

Conclusión

👏Date un aplauso. Lo has conseguido. Has creado tu primer agente de Voz Generativa AI. Ahora vamos a probarlo usando el probador.

¿Recibió la llamada telefónica? ¿Pudiste hacer preguntas sobre las diferentes funciones de Toddler 911? ¿Has aprendido algo sobre el Dr. Seuss y Big Bird? Ahora que has conseguido que el agente funcione, ¿cómo lo mejorarías? Tal vez podríamos crear flujos separados para las preguntas frecuentes de la empresa y el manual de instrucciones utilizando Intentos y Clasificación.

Se comporte como se comporte su agente, ¡háganoslo saber! Únete a la Slack de la comunidad de desarrolladores de Vonage y cuéntame qué estás construyendo en la etiqueta #ai-studio channel. O búscanos en X, antes conocido como Twitter.

Compartir:

https://a.storyblok.com/f/270183/384x384/e4e7d1452e/benjamin-aronov.png
Benjamin AronovDefensor del Desarrollador

Benjamin Aronov es desarrollador de Vonage. Es un constructor de comunidades con experiencia en Ruby on Rails. Benjamin disfruta de las playas de Tel Aviv, a la que llama hogar. Su base en Tel Aviv le permite conocer y aprender de algunos de los mejores fundadores de startups del mundo. Fuera de la tecnología, a Benjamin le encanta viajar por el mundo en busca del perfecto pain au chocolat.