Cómo crear un IVR sencillo con voz y entrada por tonos
En Respuesta de voz interactiva (IVR) le permite automatizar las interacciones telefónicas ofreciendo a quienes llaman un menú de opciones. Mientras que los IVR tradicionales se basan en la introducción de datos mediante teclado (DTMF), los sistemas modernos suelen incluir la conversión de voz a texto (ASR) para que la experiencia del usuario sea más natural. Puede consultar el IVR avanzado para más detalles.
En esta guía, crearás una aplicación Node.js que responde a una llamada y pide al usuario que pulse una tecla o hable. A continuación, la aplicación repetirá el mensaje a la persona que llama.
Requisitos previos
- Una cuenta API de Vonage. Regístrate gratis.
- Node.js instalado en su máquina.
- ngrok instalado en su máquina.
Inicializar la carpeta del proyecto
Antes de configurar tus recursos de Vonage, crea un hogar para tu código. Esto te asegura tener un destino para tus claves de seguridad más adelante.
Exponga su servidor local
Vonage needs to send webhooks to your local machine. Use ngrok to expose your server:
Note: Keep this terminal open and copy your ngrok URL. You'll need it in the next steps.
Aprovisiona tus recursos de Vonage
Configure su entorno utilizando la función Panel de API de Vonage.
Crear una aplicación de voz
- Vaya a Applications > Crear una nueva aplicación.
- Dé un nombre a su aplicación (por ejemplo, Simple-IVR-Speech-DTMF).
- Haga clic en Generar clave pública y privada.
- Mover el descargado
private.keyen la carpeta del proyecto simple-ivr. - En Capacidadesactivar Voz.
- Fije el Respuesta URL a su URL ngrok con
/webhooks/answerañadido. Ejemplo:https://{random-id}.ngrok.app/webhooks/answer. Establezca el método enGET. - Fije el URL del evento a su URL ngrok con
/webhooks/eventsañadido. Ejemplo:https://{random-id}.ngrok.app/webhooks/events. Establezca el método enPOST. - Haga clic en Generar nueva aplicación en la parte inferior.
Vincular un número virtual
- Vaya a Numbers de téléphone > Comprar Numbers y alquilar un número con Voz capacidades.
- Volver a Applicationsseleccione su aplicación IVR y vincule el nuevo número a ella.
Gestionar la llamada entrante
Cuando un usuario llama a tu número, Vonage solicita una NCCO (Objeto de control de llamada) de la URL de su respuesta. Cree un archivo llamado index.js y añade el siguiente código:
const express = require('express');
const bodyParser = require('body-parser');
const app = express();
app.use(bodyParser.json());
// 1. Initial greeting and input request
app.get('/webhooks/answer', (req, res) => {
const ncco = [
{
action: 'talk',
text: 'Hello. Please enter a digit or say something.',
bargeIn: true
},
{
action: 'input',
type: ['dtmf', 'speech'],
dtmf: { maxDigits: 1 },
speech: { language: 'en-us' },
eventUrl: [`${req.protocol}://${req.get('host')}/webhooks/input`]
}
];
res.json(ncco);
});
Procesamiento de voz y DTMF
Añade el controlador de entrada a tu index.js para procesar la carga útil que Vonage envía de vuelta una vez que el usuario interactúa con el menú.
// 2. Handle the user's response
app.post('/webhooks/input', (req, res) => {
let responseText = "I'm sorry, I didn't catch that.";
if (req.body.dtmf && req.body.dtmf.digits) {
responseText = `You pressed ${req.body.dtmf.digits}.`;
}
else if (req.body.speech && req.body.speech.results) {
const transcript = req.body.speech.results[0].text;
responseText = `You said: ${transcript}.`;
}
res.json([{ action: 'talk', text: responseText }]);
});
// 3. Log call events
app.post('/webhooks/events', (req, res) => {
res.sendStatus(200);
});
app.listen(3000, () => console.log(`IVR server running on port 3000`));
Probar el IVR
- Inicie su servidor:
node index.js. - Llama a tu número de Vonage:
- Teclado: Pulse 1. El IVR debe decir, Has pulsado 1.
- Discurso: Diga Hola. El IVR debería decir, Tú lo has dicho: Hola.
Próximos pasos
- Transferencia de llamadas: Añadir un
connectacción para conectar a la persona que llama con el departamento correspondiente en función de la información introducida por el usuario a través de número de teléfono, terminal SIP o su aplicación web utilizando el Client SDK. - Grabación de llamadas: Grabar y transcribir la llamada con
recordacción. - Voz AI: Pasar las entradas del usuario a su agente de IA para proporcionar a la persona que llama información valiosa.
- Personalización: Cambiar texto a voz voz o utilizar el flujo en tu OCN para reproducir archivos MP3 pregrabados en lugar de texto a voz.