Vonage Video API AIの機能とソリューション
Vonage Videoは、APIとSDKを提供し、VonageやサードパーティのAIツールやその他のサービスを使用して、ライブビデオセッションからビデオとオーディオストリームの両方にアクセスし、これらのストリームを変更することができます。
これらの変更は、進行中のVonageビデオセッション内でリアルタイムに行うことができます。つまり、セッションに参加しているメンバーは、その場で変更を体験することができます。
AIによるビデオアプリケーションの強化
について ボネージ・メディア・プロセッサー は、VideoクライアントSDKを介して生のオーディオおよびビデオストリームにアクセスし、個々のビデオおよびオーディオトラックに対して変換処理を実行します。これにより、Vonageでオーディオ・ストリームやビデオ・ストリームを変更したり、サードパーティ・サービスを経由して必要な変更を加えることができます。
Live Captions API は、ビデオ・セッション内でリアルタイム・キャプションのための音声ストリームのトランスクリプションを可能にします。 このサービスは、画面上のキャプション、トランスクリプション、翻訳など、自動音声認識(ASR)や音声テキスト化(STT)のユースケースに即時トランスクリプションを提供するために使用されます。

同様に オーディオ・コネクター のような独自のマネージドAIサービスに送ることができます。 マイクロソフトのAzure AIスピーチサービス.
ビデオセッションのポストコール文字起こしは、録音されたファイルに基づいて文字起こしと要約を提供します。これは、会議のメモ、会議の要約、コンプライアンスのユースケースに便利です。
私たちは、あなたが始めるのに役立つ機能やサンプルコードと一緒に様々なユースケースを集めました。また 関連リソース をご覧いただくか、こちらの表をご覧ください。
| 私は... | 機能名 | コードリファレンス(ドキュメント、サンプル、ハウツー) |
|---|---|---|
| スピーチからテキストへ | ||
| テープ起こしで会議を録音する | ポストコール・テープ起こし | ドキュメンテーション, サンプルアプリ, ウェビナー |
| ミーティングの概要 | ポストコール・テープ起こし(サマリー付き | ドキュメンテーション, サンプルアプリ |
| 会議にキャプションを追加する | ライブ・キャプション | ドキュメンテーション, サンプルアプリ, ウェビナー |
| リアルタイムでメモを取る | ライブ・キャプション | ドキュメンテーション |
| ユーザーを別の言語に翻訳する(テキスト) | オーディオ・コネクター | ブログ記事 |
| 適度なユーザー・オーディオ | シグナリング、パブリッシャーミュート | ブログ記事 |
| 基本的なメディア処理 | ||
| ビデオの背景をぼかす (Web) | 背景ぼかし | 背景ぼかし/置き換え, サンプルアプリ |
| ビデオの背景をぼかす(ネイティブ) | メディアプロセッサAPI | ドキュメンテーション |
| ビデオの背景を置き換える(ウェブ) | 背景交換 | 背景ぼかし/置き換え |
| ビデオの背景を置き換える(ネイティブ) | メディアプロセッサAPI | ドキュメンテーション |
| ストリームに透かしを追加する | メディアプロセッサAPI | 透かしとQRコード |
| QRコードの追加 | メディアプロセッサAPI | 透かしとQRコード |
| バックグラウンド・ノイズの除去 | ノイズ抑制 | ノイズ抑制 |
| エフェクトでオーディオを変調 | メディアプロセッサAPI | |
| コンピュータビジョン | ||
| 誰かが手を挙げたときに気づく | メディアプロセッサAPI | ブログ記事 |
| 画面外を見ている人を検出する | メディアプロセッサAPI | ブログ記事 |
| フレーム内のオブジェクトを見る | メディアプロセッサAPI | 画像解析 |
| ボットとエージェントAI | ||
| 発信者の感情をリアルタイムで把握する | オーディオ・コネクター | センチメント分析 |
| 従来のチャットボット | オーディオ・コネクター | |
| ユーザーの発話を別の言語に自動翻訳 | オーディオ・コネクター | |
| AIパイプラインの構築(STT→LLM/AIエージェント→TTS) | オーディオ・コネクター | サンプルアプリ |
| 音声合成AIエージェント処理 | オーディオ・コネクター | |
| ビデオセッションにAI音声アナウンスを流す | オーディオ・コネクター |
関連リソース
- メディア・プロセッサー:ビデオストリームをキャプチャし、変更する方法をご覧ください。
- オーディオ・コネクター:Vonageビデオセッションの生オーディオにアクセスし、変更する方法をご紹介します。
- ブログ記事:AIを使ってVonageビデオ・ライブ・セッションをどのように改善できるか、チュートリアルの例をご覧ください。