https://a.storyblok.com/f/270183/1368x665/269dabdace/25sep_dev-blog_audio-connector.jpg

Vonage Video API Audio Connectorで音声を受信できるようになりました。

最終更新日 September 16, 2025

所要時間:1 分

はじめに

の Audio Connector 機能については、すでにいくつかのブログ記事が書かれています。 Vonage Video API("Audio ConnectorでVonage Videoアプリケーションを強化する", "Video + AI: Audio Connectorによるライブ翻訳「およびVideo + AI: Videoアプリケーションのための設定可能なオーディオ処理").それぞれ、WebSocketサーバーに接続し、ビデオ通話の音声を処理して、翻訳、テープ起こし、会議メモの作成などを行う。

を設定する。 双方向フラグを に設定します。に設定することで、ビデオ通話にオーディオを送り返すことができます。これにより、新しい可能性が広がります。前述の翻訳ユースケースを参照すると、翻訳されたテキストが返されますが、それを音声に翻訳することができます!

使用例

Large Language Modelsやその他のAIツールを使えば、ビデオ通話から送信された音声に対する応答として、返された音声を生成することができる。例えば、友人グループが海外旅行を計画しているとしよう。彼らは全員、いつでもAIトラベル・アドバイザーとビデオ通話をすることができ、そこで必要な時間、あらゆる質問をしたり、アイデアを話し合ったりすることができる。AIトラベル・アドバイザーは、多数のソースから引き出されたリアルタイムのデータに基づいて回答することができる。音声による会話は、より良いユーザー体験となる。旅行の詳細がすべて決まったら、AIトラベルアドバイザーはその情報を旅行代理店に伝え、予約を完了させることができる。

試してみる

試してみたい?ここに Webサンプルアプリケーションこれは基本的なビデオ通話で、ビデオ通話から音声をエコーバックするWebSocketサーバーが含まれています。どのように動作するか感触をつかむには良いスターター・プロジェクトです。

結論

Audio Connectorの新しい双方向機能により、音声をリアルタイムで送受信できるようになり、翻訳、テープ起こし、AIを活用した会話への扉が開かれます。ご質問がありましたら、お気軽に コミュニティ・スラック.

シェア:

https://a.storyblok.com/f/270183/384x384/1a06993970/dwanehemmings.png
Dwane HemmingsJavaScript開発者支援