
Ahora recibe audio con el conector de audio de la API de Video de Vonage
Tiempo de lectura: 1 minuto
Introducción
Ya se han escrito algunas entradas en el blog sobre la función Audio Connector de la Video API de Vonage ("Mejora tus aplicaciones de video de Vonage con Audio Connector", "Video + AI: Traducciones en vivo con Audio Connector"y "Video + AI: Procesamiento de audio configurable para Video Applications"). En cada uno de ellos, te conectas a un servidor WebSocket y procesas el audio de la videollamada para hacer cosas como traducir, transcribir y tomar notas de la reunión.
Mediante el ajuste bidireccional a verdadero al iniciar el Conector de Audio, puedes enviar audio a la videollamada. Esto abre un mundo de nuevas posibilidades. En referencia al caso de uso de traducción mencionado anteriormente que devolvía sólo texto traducido, ¡ahora puede traducirse a audio!
Ejemplo de caso práctico
Con Large Language Models y otras herramientas de IA, el audio devuelto puede generarse como respuesta al audio enviado desde la videollamada. Por ejemplo, imaginemos que un grupo de amigos planea un viaje al extranjero. Todos pueden entrar en una videollamada con un asesor de viajes de IA en cualquier momento, donde pueden hacer todas sus preguntas y discutir sus ideas durante el tiempo que necesiten. El asesor de viajes de IA podrá responder basándose en datos en tiempo real extraídos de multitud de fuentes. Mantener una conversación de audio es una experiencia de usuario mucho mejor. Una vez que se han decidido todos los detalles del viaje, el asesor de viajes de IA puede pasar esa información a un agente de viajes para que se encargue de completar la reserva.
Pruébelo
¿Quieres probarlo? Aquí tienes una aplicación Web de ejemplo que es una videollamada básica que incluye un servidor WebSocket que devolverá el audio de la videollamada. Es un buen proyecto de inicio para tener una idea de cómo funcionan las cosas.
Conclusión
Con la nueva función bidireccional del conector de audio, ahora puedes enviar y recibir audio en tiempo real, lo que abre la puerta a la traducción, la transcripción y las conversaciones basadas en IA. Si tienes alguna pregunta, no dudes en ponerte en contacto con nosotros en la Comunidad Slack.