Convertir las llamadas telefónicas en videoconferencias
La Video API de Vonage te permite crear casi cualquier experiencia de video que desees. Muchas veces, un participante puede estar en un área donde la cobertura de Internet no es buena, ya sea debido a problemas con la red celular o el ISP, pero aún así necesita unirse a una reunión. Le mostraremos cómo puede hacer que los participantes que no tienen vídeo llamen a una reunión y participen en ella.
En este tutorial
La Video API de Vonage te permite permitir que los usuarios se conecten a una reunión por video o que llamen a un usuario para que se una directamente. Repasaremos cómo poner en marcha una demostración con nuestras demostraciones existentes para que no tengas que escribir ningún código, pero también explicaremos qué hace el código en segundo plano.
- Ver la demostración - Echa un vistazo a la demo sin escribir código
- Cómo funciona la demostración - El lado del cliente - Qué hace el código del lado del cliente
- Cómo funciona la demostración - El lado del servidor - Qué hace el código del lado del servidor
Requisitos previos
Para completar el tutorial, necesitas:
- A Account de Vonage - para su clave y secreto API
Ver la demostración
Si quieres echar un vistazo a la demo antes de escribir ningún código, tenemos un servidor web de muestra y código JavaScript para probar cómo es una videollamada básica. Todo el código es de código abierto y está disponible públicamente, así que puedes probar la demo y luego usar el código para hacer tus propias modificaciones.
Iniciar el servidor Node.js
El vídeo de demostración requiere un servidor backend para manejar cosas como la creación de tokens de cliente para la autorización y la gestión general de la sesión. Mientras que usted puede construir esto en cualquier idioma que desee, tenemos un servidor pre-construido que puede utilizar para empezar en el Servidor de aprendizaje por vídeo de Vonage (Node.js) en Code Hub. Desde el Documentación para desarrolladores, haz clic en "Code Hub" en la barra de navegación superior y, a continuación, desplázate hacia abajo y busca la tarjeta de "Vonage Video Learning Server (Node.js)". Haz clic en ella para abrirla.
Obtendrás una descripción de lo que hace este proyecto. Por ahora, hagamos clic en "Obtener código" para que podamos cargarlo en el editor en línea Code Hub. Haz click en "Crear un nuevo entorno de desarrollo". Nombra el espacio de trabajo "Vonage Video Demo" ya que podemos usar este backend para múltiples demos. Esta demostración requiere que se le asigne un número, ya que el servidor de aprendizaje admite llamadas telefónicas a través de SIP. Aunque no lo utilizaremos en esta demostración, haz clic en "Asignar un número" para asignar un número existente de Vonage o compra uno nuevo para utilizarlo en demostraciones posteriores.

Code Hub creará una aplicación automáticamente para ti, incluyendo la configuración de las claves públicas y privadas que utilizará nuestra aplicación. Una vez creado el espacio de trabajo, entrarás en el editor de código, que es una versión en línea de Visual Studio Code. Siéntase libre de seguir a lo largo de las partes posteriores de esta demostración para ver el código, y puede editar este código según sea necesario para sus propios proyectos.

Para ejecutar la aplicación, haz clic en "Ver" en la parte superior del editor, y luego en "Terminal". Esto abrirá una línea de comandos en la que podemos ejecutar comandos. Todo lo que tenemos que hacer es escribir vcr deploy y se implementará el código. Esto tomará unos momentos, ya que empaqueta el código y lo ejecuta en los servidores de Vonage Code Hub. Deberemos tomar nota de la "dirección de host de instancia" que se muestra cerca del final.

Si todo funciona correctamente, debería poder visitar la "dirección del host de instancia" y aparecerá la siguiente página:

Probar el Front End
El servidor backend funciona directamente con todas nuestras demos preconstruidas, incluida esta demo individual. Vaya a https://github.com/Vonage-Community/video-api-web-samples/tree/main/SIPque es el código fuente de la parte front-end de esta demo. Esta muestra permite a múltiples usuarios con la URL unirse a un chat de voz a través de vídeo o un número de teléfono, y permitir a un anfitrión marcar a un número.
La forma más sencilla de ejecutar esta demo es hacer clic en el botón "Abrir en Stackblitz" del README.

Esto abrirá el proyecto en Stackblitz. Al igual que con el servidor backend, puede navegar por el código y modificarlo aquí si lo desea. Para este demo, todo lo que necesitamos hacer es abrir el proyecto js/config.js e introduzca la URL de la instancia de Code Hub en el archivo SAMPLE_SERVER_BASE_URL variable:

Una vez guardado el archivo, puede actualizar la vista de demostración en la parte derecha de Stackblitz y su navegador debería pedirle que permita su micrófono y cámara. Una vez que lo permitas, tu imagen debería aparecer en la esquina inferior de la barra lateral. Si copias la URL de Stackblitz encima del panel de demostración y lo visitas en tu dispositivo móvil, otro ordenador, o se lo das a un amigo, ¡cualquiera que se una debería estar conectado a tu demostración!
Cómo funciona la demostración
Configurar una aplicación de Vonage
Para que nuestra aplicación de video funcione, necesitamos que nuestro cliente y servidor se comuniquen con los servidores de Vonage. Code Hub configura esto por nosotros, pero si estás ejecutando el código localmente o quieres saber qué implica una aplicación de video, se configura como cualquier otra API. Necesitamos configurar una aplicación de Vonage para alojar toda la configuración de nuestra aplicación, además de ayudarnos a generar los elementos necesarios para realizar la autenticación.
Diríjase a su Panel de control del cliente de Vonage e inicie sesión. Una vez iniciada la sesión:
- Haz clic en "Applications" en "Build".
- Haga clic en "Crear una nueva aplicación".
- Dale un nombre a la aplicación, como "Demostración de vídeo básica".
- Haga clic en "Generar clave pública y privada", lo que le hará descargar un archivo llamado
private.key. Guarde este archivo para más tarde. - Desplácese hacia abajo y active "Vídeo". Dejaremos estos valores vacíos por ahora.
- Haga clic en "Generar nueva aplicación" para crear la aplicación.
Una vez creada la aplicación, anote el ID de la aplicación. Si está ejecutando el código localmente, lo necesitaremos para configurar el backend. Si está utilizando Code Hub, el código del servidor ya tiene acceso al ID de la Aplicación y a la Clave Privada.
El lado del cliente
La parte cliente de la demostración consta de varias partes: algunos elementos HTML para colocar las fuentes de vídeo, algo de JavaScript para obtener la información de inicio de sesión y comunicarse con los servidores de Vonage Video, y algo de código JavaScript para llamar al servidor backend para marcar.
Dado que se trata de una demostración para navegador, utilizamos el SDK de JavaScript que se encuentra en https://unpkg.com/@vonage/client-sdk-video@latest/dist/js/opentok.jse incluirlo en una etiqueta script en nuestro HTML en index.html.
Para añadir gente a una sala, sólo necesitamos dos elementos: algún sitio donde poner al usuario actual, por ejemplo, Tú, al que llamaremos "publicador". Luego necesitamos algún sitio donde poner a cualquier otra persona que se una, a la que "suscribirás". Los pondremos en un elemento "suscriptores".
Crearemos dos div y asignar a uno de ellos un ID de publisher y el otro un ID de subscriber. Haremos referencia a estos elementos en el JavaScript cuando se visite la página, y para cuando detectemos que otro usuario ha entrado en la videollamada.
A continuación, tenemos dos conjuntos de controles. El primero permite que nuestra videoconferencia habilite la función de marcación. Crearemos dos botones para habilitar esta funcionalidad.
Tendremos entonces un conjunto de controles que nos permitirán marcar a un usuario. Puede introducir un número de teléfono y hacer que nuestro sistema marque al usuario, y cuando acepte la llamada se le conectará a la conferencia.
Vídeo de manipulación
Por el lado de JavaScript, primero obtendremos información sobre la propia videollamada. Para conectarnos a la videollamada, necesitamos un ID de aplicación, un ID de sesión y un token.
- En ID de aplicación es un identificador que el SDK del cliente utiliza para hacer referencia a diferentes configuraciones para nuestra aplicación de video del lado de Vonage.
- En ID de sesión es una sesión de vídeo específica a la que queremos conectarnos, ya que una única Applications puede tener varias sesiones de vídeo concurrentes a la vez.
- En Ficha es un token de autenticación JWT que le permite unirse a una sesión específica con derechos específicos.
Aunque puede generar el identificador de sesión y el token con antelación, en el mundo real los generará bajo demanda. Nuestro código representa cómo lo harías. Vamos a mostrar cómo se crea la información en un poco, pero vamos a tomar esa información desde el servidor backend que desplegamos.
// src/app.js
// ...
} else if (SAMPLE_SERVER_BASE_URL) {
// Make a GET request to get the Vonage Video Application ID, session ID, and token from the server
fetch(SAMPLE_SERVER_BASE_URL + '/session')
.then((response) => response.json())
.then((json) => {
applicationId = json.applicationId;
sessionId = json.sessionId;
token = json.token;
// Initialize a Vonage Video Session object
initializeSession();
}).catch((error) => {
handleError(error);
alert('Failed to get Vonage Video sessionId and token. Make sure you have updated the config.js file.');
});
}
Una vez que tengamos toda la información de conexión, podemos seguir adelante y llamar al SDK JavaScript de Vonage Video, que se encarga de todo el trabajo para conectarnos a la Video API de Vonage en el front end. Primero, tomamos un objeto de sesión con OT.initSession(). A continuación, empezamos a escuchar en el streamCreated evento con session.on(). Esto nos permite establecer una llamada de retorno para que se ejecute cuando se cree un flujo desde otro editor. En este caso, utilizamos session.subscribe() para conectarse al evento entrante, y empujarlo en el subscriber div que configuramos en el HTML. También escuchamos el sessionDisconnected para saber cuando el otro usuario se desconecta, pero todo lo que hacemos para esta demostración es sólo registrar que nos dimos cuenta de que se fueron.
A continuación, creamos el publisher objeto con OT.initPublisher(). Le decimos a qué div debe adjuntarse (publisher), y algunas opciones básicas de formato. Esto conecta su cámara y micrófono a la Video API.
A continuación, llamamos session.connect() para conectarse a la sesión, utilizando el token JWT de conexión que obtuvimos del servidor. ¡Eso es todo lo que se necesita para que dos personas se unan a una sala!
// src/app.js
function initializeSession() {
const session = OT.initSession(applicationId, sessionId);
// Subscribe to a newly created stream
session.on('streamCreated', (event) => {
const subscriberOptions = {
insertMode: 'append',
width: '100%',
height: '100%'
};
session.subscribe(event.stream, 'subscriber', subscriberOptions, handleError);
});
session.on('sessionDisconnected', (event) => {
console.log('You were disconnected from the session.', event.reason);
});
// initialize the publisher
const publisherOptions = {
insertMode: 'append',
width: '100%',
height: '100%',
resolution: '1280x720'
};
const publisher = OT.initPublisher('publisher', publisherOptions, handleError);
// Connect to the session
session.connect(token, (error) => {
if (error) {
handleError(error);
} else {
// If the connection is successful, publish the publisher to the session
session.publish(publisher, handleError);
}
});
}
Atención de llamadas telefónicas
Todo el trabajo pesado para apoyar las llamadas será manejado por la propia Video API, y nuestro servidor backend. El código del lado del cliente sólo accederá a algunas rutas en el servidor backend para habilitar la llamada SIP, así como desconectarse de la conferencia telefónica cuando hayamos terminado. Habilitar la telefonía se hace pulsando el botón /sip/session/dial en nuestro servidor backend, que detallaremos más adelante.
// js/index.js
document.getElementById('btn-dial-conference').addEventListener('click', async () => {
const resp = await fetch(`${SAMPLE_SERVER_BASE_URL}/sip/session/dial`, {
method: "POST"
})
.then(res => res.json())
console.log(resp);
})
Esta misma ruta puede utilizarse para llamar a un usuario concreto. Basta con pasar el número de teléfono introducido en la interfaz del cliente:
// js/index.js
document.getElementById('btn-dial-number').addEventListener('click', async () => {
const msisdn = document.getElementById('phone').value;
const resp = await fetch(`${SAMPLE_SERVER_BASE_URL}/sip/session/dial`, {
method: "POST",
body: JSON.stringify({
msisdn
}),
headers: {
"Content-Type": "application/json"
}
})
.then(res => res.json())
console.log(resp);
})
Cuando un usuario entre en la multiconferencia, o nos conectemos con él marcando directamente, se añadirá un nuevo abonado a la lista de participantes. La Video API reenviará automáticamente el audio de la conexión SIP a todas las personas conectadas a la sesión de vídeo.
Por último, podemos finalizar cualquiera de los dos tipos de llamada accediendo a la función /sip/session/hangup en nuestro servidor:
// js/index.js
document.getElementById('btn-disconnect-conference').addEventListener('click', async () => {
const resp = await fetch(`${SAMPLE_SERVER_BASE_URL}/sip/session/hangup`, {
method: "POST"
})
.then(res => res.json())
console.log(resp);
})
El lado del servidor
La parte del lado del servidor de cualquier aplicación de Vonage Video se utiliza para manejar la creación de sesiones, la generación de tokens de autenticación y tareas administrativas como iniciar y detener archivos. Para esta demostración, todo lo que nos preocupa es crear sesiones y tokens para que los usuarios puedan unirse a la sala. Si bien la API en sí es una API REST y se la puede llamar como se desee, te recomendamos que utilices la función SDK de Vonage Node que maneja toda la autenticación y las llamadas HTTP por ti. Puede instalarlo en su propia aplicación con:
npm install -s @vonage/server-sdk
El código de demostración ya lo tiene preinstalado. Si está ejecutando el código localmente, tendrá que ejecutar:
npm install
para descargar todas las dependencias y, a continuación, copie .envcopy a un nuevo archivo llamado .env. Deberá rellenar la información solicitada en .env como el ID de la aplicación, la ubicación de la clave privada en el disco y tu clave y secreto de API de Vonage.
Creación de la sesión e incorporación a la misma
Lo primero que hacemos es buscar si ya tenemos una sesión para la sala que estamos generando. Mantenemos un diccionario en memoria en roomToSessionIdDictionaryy si la sala ya tiene una sesión, simplemente extraemos la sesión del diccionario. Luego usamos el Vonage Video Node SDK para crear un token de cliente llamando a vonage.video.generateClientToken()pasándole el ID de sesión y un objeto con alguna configuración. Por el momento todo lo que hacemos es configurar el usuario a un moderator para esta sencilla demostración. A continuación, devolvemos el ID de aplicación, el ID de sesión y el token configurados al front-end.
Si la sesión no existe, creamos una nueva con vonage.video.createSession(). Esto contacta a la API de Vonage y crea una sesión a la que los usuarios pueden conectarse. No tenemos ninguna configuración específica para esta sesión, pero aquí sería donde configuraríamos cosas como reglas de archivo y cómo se debe manejar la sesión, como enrutamiento o peer-to-peer. Entonces como antes creamos un token, y enviamos toda esa información de vuelta al navegador.
// routes/index.js
async function createSession(response, roomName, sessionProperties = {}, role = 'moderator') {
let sessionId;
let token;
console.log(`Creating ${role} creds for ${roomName}`);
if (roomToSessionIdDictionary[roomName]) {
sessionId = roomToSessionIdDictionary[roomName];
// generate token for user
token = vonage.video.generateClientToken(sessionId, { role })
response.setHeader('Content-Type', 'application/json');
response.send({
applicationId: appId,
sessionId: sessionId,
token: token
});
} else {
try {
// Create the session
const session = await vonage.video.createSession(sessionProperties);
roomToSessionIdDictionary[roomName] = session.sessionId;
// generate token for user
token = vonage.video.generateClientToken(session.sessionId, { role });
response.setHeader('Content-Type', 'application/json');
response.send({
applicationId: appId,
sessionId: session.sessionId,
token: token
});
} catch(error) {
console.error("Error creating session: ", error);
response.status(500).send({ error: 'createSession error:' + error });
}
}
}
Conexión al puente SIP
Vonage pone a tu disposición un puente SIP para que utilices la Video API. Todo lo que necesitas es un número de teléfono suscrito a través de tu panel de cliente de Vonage. Podemos usar ese número de teléfono como interfaz SIP para las llamadas entrantes. También usaremos la Funcionalidad de conversación de Voice API de Vonage para unir a varios usuarios en una conferencia de audio.
Lo primero que tenemos que hacer es marcar nuestra sesión de vídeo en la propia multiconferencia. Vamos a crear un token de cliente para la conexión SIP para unirse a la sesión de vídeo, a continuación, hacer una llamada a vonage.video.initiateSIPCall() con nuestra configuración SIP para unirlo todo.
// routes/index.js
const { msisdn } = req.body;
const sessionId = findSessionIdForRoom(req.params.room);
const conversation = findConversationFromSessionId(sessionId);
const token = vonage.video.generateClientToken(sessionId, {
data: JSON.stringify({
sip: true,
role: 'client',
name: conversation.conversationName,
})
})
const options = {
token,
sip: {
auth: {
username: process.env.VCR_API_ACCOUNT_ID, // Your Vonage API Key
password: process.env.VCR_API_ACCOUNT_SECRET, // Your Vonage API Secret
},
uri: `sip:${process.env.CONFERENCE_NUMBER}@sip.nexmo.com;transport=tls`,
secure: false,
}
}
// ...
await vonage.video.intiateSIPCall(sessionId, options)
.then(data => {
// Update the conversation with connection data
conversation.connectionId = data.connectionId;
conversation.streamId = data.streamId;
sipConversationToSessionIdDictionary[sessionId] = conversation;
res.send(data)
})
¿Dónde se establece la conversación? Cuando iniciamos la llamada SIP, esto hace que nuestro puente SIP marque a un número de conferencia a través del Voice API. Nuestro número de conferencia se configura a través del Panel de Control del Cliente para golpear el /sip/vapi/answer en nuestro servidor backend. Si está utilizando Cloud Runtime esto se configura automáticamente, pero si está configurando esto a mano tendrá que ir a la configuración de la Aplicación para esta aplicación, y luego establecer la "URL de respuesta" a https://your-domain.com/sip/vapi/answerdonde your-domain es el nombre de dominio en el que se despliega la demo.
La ruta devolverá un NCCO Conversación acción que crea una Voice API Conversation, uniendo a todos.
// routes/index.js
router.get('/sip/vapi/answer', async function (req, res) {
const ncco = new NCCOBuilder();
const conversation = findConversationFromSessionId(findSessionIdForRoom('session'));
// If the call is not from the SIP connector, then announce we are connecting
// to the conference call
if (!req.query['SipHeader_X-OpenTok-SessionId']) {
ncco.addAction(new Talk('Please wait while we connect you'));
}
// Call an individual user
if (req.query['SipHeader_X-learningserver-msisdn']) {
ncco.addAction(new Connect({type: 'phone', number: req.query['SipHeader_X-learningserver-msisdn']}, process.env.CONFERENCE_NUMBER));
} else {
ncco.addAction(new Conversation(conversation.conversationName, null, true, true, false, null, null, false));
}
res.send(ncco.build());
});
En este punto, un usuario puede marcar el número de la conferencia y la Voice API lo unirá todo. Si un usuario marca nuestro número de conferencia, se enrutará a la API de voz. /sip/vapi/answer punto final. Añadimos una acción adicional que indica a la persona que llama que se está conectando a la conferencia y, a continuación, se le conecta.
Marcar a un usuario
En general, el proceso es el mismo para llamar a un usuario que para establecer una multiconferencia. La única diferencia es que pasamos un número para marcar al usuario. /sip/:room/dial y añadimos ese número como opción a las cabeceras SIP.
// routes/index.js
router.post("/sip/:room/dial", async function (req, res) {
// Set up client token and SIP options as before
// Add a header that will get passed to the Voice API
if (msisdn) {
options.sip.headers = {
"X-learningserver-msisdn": msisdn
}
}
//Initiate the call as before
await vonage.video.intiateSIPCall(sessionId, options)
.then(data => {
// Update the conversation with connection data
conversation.connectionId = data.connectionId;
conversation.streamId = data.streamId;
sipConversationToSessionIdDictionary[sessionId] = conversation;
res.send(data)
})
});
Cuando se realiza la llamada SIP, ese adicional X-learningserver-msisdn como parte de la llamada a la Voice API que acepta nuestro servidor backend. Esto hace que nuestro código añada un paso NCCO adicional para marcar primero el número de teléfono solicitado a través de una línea Conectar la acción de la OCNCy cuando contesten, hazles un puente hacia la conversación.
// routes/index.js
router.get('/sip/vapi/answer', async function (req, res) {
// Find the conversation info as before
// If this header exists, call the user to bridge them in
if (req.query['SipHeader_X-learningserver-msisdn']) {
ncco.addAction(new Connect({type: 'phone', number: req.query['SipHeader_X-learningserver-msisdn']}, process.env.CONFERENCE_NUMBER));
} else {
ncco.addAction(new Conversation(conversation.conversationName, null, true, true, false, null, null, false));
}
res.send(ncco.build());
});
Colgados
Cuando hayamos terminado, la interfaz de usuario nos da la opción de desconectarnos directamente de la llamada SIP. Esto es manejado por el /sip/:room/hangup ruta y simplemente desconecta la conexión de la llamada SIP de la sesión.
// routes/index.js
router.post("/sip/:room/hangup", async function (req, res) {
// Get the session ID
// Look up the connection from calls ID
const sessionId = findSessionIdForRoom(req.params.room)
const conversation = findConversationFromSessionId(sessionId);
await vonage.video.disconnectClient(sessionId, conversation.connectionId)
.then(data =>
res.send(data)
)
.catch(error => res.status(500).send(error));
});
Si no colgamos manualmente, estaremos atentos a los eventos de Voice API que nos indican cuándo ha finalizado una conversación. Una conversación finalizará automáticamente cuando todos los participantes se hayan desconectado. Esperamos hasta recibir un completed y cuando lo hagamos nos aseguramos de realizar la misma desconexión de la sesión que en el caso anterior.
// routes/index.js
// This must be all because VAPI sometimes sends events as POST no matter what
// your event URL config is set to. This is a known bug.
router.all('/sip/vapi/events', async function (req, res) {
if (req.query.status === "completed") {
const conversation = findConversationFromSessionId(findSessionIdForRoom('session'));
await vonage.video.disconnectClient(findSessionIdForRoom('session'), conversation.connectionId)
.then(data => res.send(data))
.catch(error => res.status(500).send(error));
} else {
res.send();
}
})
Conclusión
En este tutorial, viste lo que se incluye en el servidor backend para transferir llamadas de telefonía a través de SIP, cómo crear un cliente web para que los usuarios se unan a una sesión y se vean y escuchen entre sí, y un vistazo a lo fácil que es usar Vonage Code Hub y Stack Blitz para probar muestras rápidamente.