
ライブキャプションAPIがGAに
所要時間:1 分
Vonage Live Captions API Vonage Live Captions APIが一般に利用可能になりました。この機能は Video API内のこの機能 のこの機能は、アクセシビリティを改善し、騒がしい環境でのユーザー体験を向上させ、より良いコミュニケーションのためのリアルタイムキャプションを可能にします。この記事では、主な利点、APIの仕組み、開始方法について説明します。
ライブ・キャプションを提供する理由
アクセシビリティ:通話に参加するすべての人が聞き取れるとは限りません。
ノイズの多い環境:最高のノイズキャンセリングヘッドホン/イヤホンを使っても、大音量の場所では難しいことがあります。
文脈を取り戻す:誰かの発言を聞き逃した?フィードにはまだキャプションが表示されています。
ユーザー設定:Youovの世論調査によると YouGovキャプションや字幕がある方がいいという人がかなり多い。私もそうだ。
(ボーナス)翻訳:キャプションを視聴者の言語に変換するもう一つのステップです。
YouGov poll results showing subtitle preferences when watching TV or movies in one’s native language, broken down by age group.
ライブキャプションAPIの仕組み
Live Captions APIは、Media Routerを通過する音声ストリーム(VideoおよびSIPダイアルイン参加者の両方から)を受信し、トランスクリプションサービスに転送します。
Architecture diagram showing audio streams from two WebRTC clients routed through a Video Media Router to AWS Transcribe, which returns individual transcribed text streams.
開発者のメリット
ライブキャプションは、すべてのプロジェクトでデフォルトで有効になっています。
アプリケーションはすでにメディア・ルーターにメディア・ストリームを送信している。
書き写すために別のストリームを送信することで、ユーザーのコンピューターやモバイル機器にさらに負担をかける必要はありません。
サードパーティのトランスクリプション・ライブラリやサービスを利用する必要がない。
アプリケーションでライブキャプションを有効にする
より詳しい説明は ライブ・キャプション・ドキュメント.
まず、Vonageの認証情報を使ってLive Captions APIエンドポイントにPOSTリクエストを行います。次に クライアントSDKを使用して、キャプションの送受信を開始または停止できます。
試してみる
Basic Live Captions APIのデモを即座に Stackblitzにデプロイし、config.jsで実行中のサーバーURLを指定します。ソースコードはGitHubの リポジトリ.
結論
Live Captions API は、アクセシビリティを強化し、Video アプリケーションのユーザー体験を向上させる強力なツールです。フィードバックやご質問を遠慮なくお寄せください。
ぜひご連絡ください。私たちの コミュニティ・スラック・チャンネル.X の場合は VonageDevアカウントをフォローしてください。