https://d226lax1qjow5r.cloudfront.net/blog/blogposts/live-captions-api-is-now-ga/live-captions-ga.png

ライブキャプションAPIがGAに

最終更新日 September 4, 2023

所要時間:1 分

Vonage Live Captions API Vonage Live Captions APIが一般に利用可能になりました。この機能は Video API内のこの機能 のこの機能は、アクセシビリティを改善し、騒がしい環境でのユーザー体験を向上させ、より良いコミュニケーションのためのリアルタイムキャプションを可能にします。この記事では、主な利点、APIの仕組み、開始方法について説明します。

ライブ・キャプションを提供する理由

アクセシビリティ:通話に参加するすべての人が聞き取れるとは限りません。

ノイズの多い環境:最高のノイズキャンセリングヘッドホン/イヤホンを使っても、大音量の場所では難しいことがあります。

文脈を取り戻す:誰かの発言を聞き逃した?フィードにはまだキャプションが表示されています。

ユーザー設定:Youovの世論調査によると YouGovキャプションや字幕がある方がいいという人がかなり多い。私もそうだ。

(ボーナス)翻訳:キャプションを視聴者の言語に変換するもう一つのステップです。


Survey table from YouGov asking if people prefer subtitles on or off when watching shows in their native language. Among all UK adults, 28% prefer subtitles on, 65% off. In the 18–24 age group, 61% prefer subtitles on, while in the 50–64 group, only 13% do. Preferences shift toward subtitles off with increasing age.YouGov poll results showing subtitle preferences when watching TV or movies in one’s native language, broken down by age group.

ライブキャプションAPIの仕組み

Live Captions APIは、Media Routerを通過する音声ストリーム(VideoおよびSIPダイアルイン参加者の両方から)を受信し、トランスクリプションサービスに転送します。

Diagram of a transcription flow where WebRTC client A and B send audio to a Video Media Router, which forwards A’s and B’s audio streams to AWS Transcribe. AWS returns transcribed text of each stream separately back to the router.Architecture diagram showing audio streams from two WebRTC clients routed through a Video Media Router to AWS Transcribe, which returns individual transcribed text streams.

開発者のメリット

  • ライブキャプションは、すべてのプロジェクトでデフォルトで有効になっています。

  • アプリケーションはすでにメディア・ルーターにメディア・ストリームを送信している。

  • 書き写すために別のストリームを送信することで、ユーザーのコンピューターやモバイル機器にさらに負担をかける必要はありません。

  • サードパーティのトランスクリプション・ライブラリやサービスを利用する必要がない。

アプリケーションでライブキャプションを有効にする

より詳しい説明は ライブ・キャプション・ドキュメント.

まず、Vonageの認証情報を使ってLive Captions APIエンドポイントにPOSTリクエストを行います。次に クライアントSDKを使用して、キャプションの送受信を開始または停止できます。

試してみる

Basic Live Captions APIのデモを即座に Stackblitzにデプロイし、config.jsで実行中のサーバーURLを指定します。ソースコードはGitHubの リポジトリ.

結論

Live Captions API は、アクセシビリティを強化し、Video アプリケーションのユーザー体験を向上させる強力なツールです。フィードバックやご質問を遠慮なくお寄せください。

ぜひご連絡ください。私たちの コミュニティ・スラック・チャンネル.X の場合は VonageDevアカウントをフォローしてください。

シェア:

https://a.storyblok.com/f/270183/400x400/04765919bb/zachary-powell-1.png
Zachary Powellシニア・アンドロイド・デベロッパー・アドボケイト