ポスト・コール・トランスクリプション

価格

要約の有無にかかわらず、テープ起こしの料金は、参加者の人数にかかわらず、1分あたり0.04510ドル/0.04100ユーロです。個別のアーカイブ料金のみが適用されます。

機能概要

通話後の書き起こしは、記録管理の改善、顧客サービスの向上、生産性の向上、より良いデータ分析に役立ちます。Vonage Video APIサーバーは、人工知能やその他の最先端技術を使用して、通話後の書き起こしを生成します。

REST APIを使用してアーカイブを開始するときに、トランスクリプションを有効にします。

アーカイブ録画が完了すると、テープ起こしがJSONファイルとして利用できるようになります。

アーカイブの開始時に転写を有効にする

Vonage Video REST API を使用してアーカイブを開始する場合は、次のように設定します。 hasAudio そして hasTranscription プロパティ true を、start archive REST メソッドに送信した JSON プロパティに追加します:

また、オプションで transcriptionProperties オブジェクトに hasSummary (ブール)または primaryLanguageCode (String)プロパティを使用します。設定時 hasSummary をtrueに設定すると、AIが作成した要約が書き起こしに含まれます。falseまたはmissに設定すると(デフォルト値は false) の場合、書き起こしの要約は含まれません。トランスクリプションが "en-US"(デフォルト)以外の言語である場合、プロパティ primaryLanguageCode を持つ。 対応言語コード.

application_id="12345abc" json_web_token="jwt_string" # replace with a JSON web token data='{ "sessionId": "1_MX40NzY0MDA1MX5-fn4", "hasAudio": true, "hasVideo": true, "hasTranscription": true, "transcriptionProperties": { "hasSummary": true, "primaryLanguageCode": "ja-JP" }, "name": "archive_test", "outputMode": "individual" }' curl \ -i \ -H "Content-Type:application/json" \ -X POST \ -H "X-OPENTOK-AUTH:$json_web_token" \ -d "$data" \ https://video.api.vonage.com/v2/project/$application_id/archive

セット outputMode (POSTデータ内)を "individual".トランスクリプションは 個別ストリーム・アーカイブ だけである。

の値を設定する。 application_id をアプリケーションIDに設定します。の値を設定します。 json_web_token をJSONウェブトークンに変換します ( REST API 認証 文書)。

その他のアーカイブオプションについては アーカイブRESTメソッドの開始.

start archive REST メソッドの呼び出しに対するレスポンスには以下が含まれます。 hasTranscription そして transcription プロパティは、レスポンスの他の文書化されたプロパティに追加される:

{
  "createdAt" : 1384221730555,
  "duration" : 0,
  "hasAudio" : true,
  "hasVideo" : true,
  "id" : "b40ef09b-3811-4726-b508-e41a0f96c68f",
  "name" : "The archive name you supplied",
  "outputMode" : "individual",
  "applicationId" : "12345abc",
  "reason" : "",
  "resolution" : "640x480",
  "sessionId" : "flR1ZSBPY3QgMjkgMTI6MTM6MjMgUERUIDIwMTN",
  "size" : 0,
  "status" : "started",
  "streamMode" : "auto",
  "hasTranscription" : true,
  "transcription" : {
    "hasSummary": true,
    "primaryLanguageCode": "ja-JP",
    "reason": "",
    "status": "requested",
    "url": ""
  }
}

参照 転写ステータスの取得 を参照してください。

において 自動的にアーカイブされたセッションこの場合、テープ起こしは自動的に開始されません。2番目のアーカイブを開始する必要があります。 multiArchiveTag オプションで、転写のために 同時アーカイブ).

トランスクリプションのサポートは現在、Vonage Video REST APIで利用可能で、Vonage Server SDKsを通じて有効化および管理できます。

転写ステータスの取得

のRESTメソッドのレスポンスは、以下のようになる。 リスト・アーカイブ そして アーカイブ情報の検索 が含まれる。 hasTranscription そして transcription プロパティー

{
    "id" : "b40ef09b-3811-4726-b508-e41a0f96c68f",
    "event": "archive",
    "createdAt" : 1723584124,
    "duration" : 328,
    "name" : "the archive name",
    "partnerId" : "123456abc",
    "reason" : "",
    "sessionId" : "2_MX40NzIwMzJ-flR1ZSBPERUIDIwMTN-MC45NDQ2MzE2NH4",
    "size" : 18023312,
    "status" : "uploaded",
    "hasTranscription" : true,
    "transcription": {
      "status": "available",
      "url": "URL for downloading the transcription, if available",
      "reason": "The reason for failure, if status is set to failed",
      "hasSummary": true,
      "primaryLanguageCode": "The configured language code"
    }
}

について hasTranscription プロパティはブール値で、アーカイブでトランスクリプションが有効になっているかどうかを示します。

について transcription プロパティは、以下のプロパティを持つオブジェクトである:

  • status (String) - 転写のステータスで、以下のいずれかに設定できる:

    • "requested" - について hasTranscription プロパティが true アーカイブの開始コール中に、トランスクリプションが開始されていない。
    • "failed" - 転写に失敗しました。を確認してください。 reason プロパティをご覧ください。
    • "started" - テープ起こしは進行中だ。
    • "available" - テープ起こしはVonageからダウンロードできます。をチェックしてください。 url 財産である。
    • "uploaded" - 書き起こしは、Video API アカウントで指定した S3 バケットまたは Azure コンテナからダウンロードできます。アーカイブ ストレージ ターゲットのアーカイブ ID フォルダで transcription.zip を探してください。以下を参照してください。 アーカイブ・ストレージ.
  • url (String) - 転写ファイルをダウンロードするための URL。 status に設定されている。 "available".

  • reason (String) - 転写に失敗した理由。 status に設定されている。 "failed".

  • hasSummary (Boolean) - AIが作成した要約を書き起こしに含めるかどうかを示す。

  • primaryLanguageCode (String) - 転写用に設定された言語コード。

に対してアーカイブステータスのコールバックを設定することもできます。 Video APIアカウント.参照 アーカイブステータスの変更.コールバックデータには hasTranscription そして transcription の特性を持つ。

転写形式

トランスクリプションは圧縮されたZIPファイルとして提供される。非圧縮ファイルはJSONデータを含むテキストファイルです。

トランスクリプションには、テキストの個々のセグメントが含まれる。各セグメントは、個々のオーディオチャンネル(セッションのオーディオストリームの1つ)に対応しています。

JSONは以下のトップレベルのプロパティを持つ:

  • job_id - トランスクリプションのユニークなID。

  • timestamp - 転写ファイルが作成されたISO 8601の日付文字列。

  • number_of_channels - トランスクリプションに含まれる、アーカイブ内の個々のオーディオチャンネルの数。

  • reliability - 1つのプロパティを持つオブジェクト: score.その score は、転写の総合的な信頼性の推定値を示す数値である(0~1.0)。

  • summary - を設定した場合 hasSummary プロパティの transcriptionProperties 対象 true アーカイブを開始すると、このプロパティが含まれます。AIが生成した書き起こしの要約が設定される。

  • confidence - 2つのプロパティを持つオブジェクト: overall そして channels.その overall プロパティは転写全体の推定信頼度(0~1.0)である。この channels プロパティは、転写における各チャンネルの推定信頼度を列挙した配列である。

  • channels_metadata - 各オーディオチャンネルを定義するオブジェクトの配列。各オブジェクトは id プロパティは、ビデオ・ストリームIDである。接続データを識別するために クライアントトークンの作成 を各ユーザに各ユーザーは セッション監視コールバック を使用して、各ストリームの接続のストリームIDと接続データを取得する。そして、これらを使って、ストリームのユーザーをトランスクリプションで特定することができる。

  • segments - トランスクリプトの個々のセグメントを含むオブジェクト。各セグメントオブジェクトには、以下のプロパティがあります:

    • text - セグメントの書き起こしテキスト。

    • formatted - セグメントのフォーマットされたテキスト(句読点付き)。

    • confidence - 0から1.0までの数値で、セグメントの転写の推定信頼度を表す。

    • channel - セグメントのオーディオチャンネルを示す整数。

  • raw_data - トランスクリプションセグメント内の各単語の配列オブジェクト。各オブジェクトには、以下のプロパティが含まれます:

    • word - という言葉だ。

    • confidence - 0から1.0までの数値で、転写された単語の推定信頼度を表す。

    • start_ms - 書き起こし開始位置からの単語開始位置のオフセット(ミリ秒単位)。

    • end_ms - 書き起こし開始位置からの単語終了位置のオフセット(ミリ秒単位)。

The output of a transcription JSON file.

トランスクリプションのダウンロード

アーカイブのトランスクリプションファイルをダウンロードするには、REST API経由とDeveloper Dashboard経由の2つの方法があります。

REST APIによるダウンロード

を呼び出すことで、特定のアーカイブのトランスクリプションファイルをダウンロードすることができます。 アーカイブ情報を取得する REST メソッド をチェックする。 transcription.url プロパティを指定する。もし transcription.status プロパティが "available" または "uploaded"その transcription.url プロパティには、転写ファイルをダウンロードするための URL が含まれます。

HTTPのGETリクエストを使って、URLから転写ファイルをダウンロードする。例えば

transcription_url="https://example.com/path/to/transcription.zip" # replace with the transcription URL curl -o transcription.zip $transcription_url

開発者ダッシュボードからダウンロード

をクリックすると、特定の通話のトランスクリプションをダウンロードできます。 フォールバックストレージ オプションは、以下の手順で有効にした:

  1. 開発者ダッシュボードを開き、次の場所に移動する。 ビデオログ.
  2. アプリケーションリストからアプリケーションを選択し 探索.オプション 録音ID または セッションID で結果を絞り込む。
  3. 結果リストで、該当するセッションを探す。
  4. マウスを ステータス そのセッションの 書き起こしダウンロード ボタンをクリックする。
Download transcriptions

制限/既知の問題

  • トランスクリプションは、個々のストリーム・アーカイブに対してのみ利用可能で、構成されたアーカイブに対しては利用できません。

  • トランスクリプションは暗号化されたアーカイブとは互換性がありません。

  • この機能は現在 Vonage Video REST API でサポートされており、Vonage Video サーバ SDK ではサポートされていません。

  • テープ起こしの最長時間は120分です。

  • ポストコール・トランスクリプションは、すべてに完全に準拠しているわけではない。 地域メディアゾーン (下記参照)。

Regional Media Zone Support Available
USA Yes
EU Yes
Canada Based on requirement
Germany Based on requirement
Australia Based on requirement
Japan Based on requirement
South Korea Based on requirement
Singapore Based on requirement

よくある質問

  • 1つのセッションから何本のストリームを分析できますか?
    • 最大50ストリーム、最大120分。
  • ポストコール・トランスクリプションは、ルーティング・セッションとリレー・セッションの両方で機能しますか?
    • ポストコール・トランスクリプション機能は、Vonage Mediaサーバを使用するRoutedセッションを対象としています。
  • 顧客が設定したS3バケットへのトランスクリプションのアップロードが失敗した場合、リトライまたはフォールバックのメカニズムはアーカイブのアップロードと同様に機能しますか?
    • はい、PCTの再試行メカニズムは、通常のアーカイブアップロードとまったく同じように動作します。
  • トランスクリプションがフォールバックされ、Vonageクラウドにアップロードされる場合、トランスクリプションのダウンロードリンクを取得するためにHTTP GETリクエストを使用する必要がありますか?
    • トランスクリプションのステータスが変更されると、顧客はダウンロードURLを含むコールバックを受け取る必要があります。コールバックが登録されていない場合、ダウンロードリンクはHTTP GETリクエストでのみ取得できます。
  • トランスクリプションのダウンロードリンクを受信すると、直接ダウンロードすることができます。テープ起こしのダウンロードに認証を導入する予定はありますか?
    • リンクに認証を導入する予定はない。ダウンロードリンクには短い有効期限があります。その期間内にアクセスされなかった場合は、新しいリンクを取得するために新たなリクエストを行う必要があります。
  • 複数のユーザーがセッションに参加しているにもかかわらず、トランスクリプションファイルは1つのJSONファイルです。どのようにユーザーを区別するのでしょうか?
    • ファイル内の各トランスクリプション・エントリーは、各ストリームに割り当てられた特定のチャンネル番号に関連付けられている。ファイルには以下も含まれる。 channels_metadata各チャンネルIDに対応するストリームID情報を提供する。

対応言語

言語 コード
アフリカーンス語(南アフリカ) af-ZA
アムハラ語(エチオピア) am-ET
アラビア語(アラブ首長国連邦) アーエーイー
アラビア語(バーレーン) ar-BH
アラビア語(アルジェリア) ar-DZ
アラビア語(エジプト) アールイージー
アラビア語(イスラエル) アーイル
アラビア語(イラク) アーアイキュー
アラビア語(ヨルダン) アール・ジョー
アラビア語(クウェート) アールケーダブリュー
アラビア語(レバノン) ar-LB
アラビア語(モロッコ) アル・マ
アラビア語(モーリタニア) アールエムアール
アラビア語(オマーン) アーオーエム
アラビア語(パレスチナ自治区) アーピーエス
アラビア語(カタール) アーQA
アラビア語(サウジアラビア) アルサ
アラビア語(シリア) アーエスワイ
アラビア語(チュニジア) アーティーエヌ
アラビア語(イエメン) アーイェー
アゼルバイジャン語(アゼルバイジャン) アズアズ
ブルガリア語(ブルガリア) bg-BG
ベンガル語(バングラデシュ) bn-BD
ベンガル語(インド) bn-IN
ボスニア語(ボスニア・ヘルツェゴビナ) bs-BA
カタロニア語(スペイン) サー
チェコ cs-CZ
デンマーク語(デンマーク) ダDK
ドイツ語(オーストリア) 脱AT
ドイツ語(スイス) 脱CH
ドイツ語(ドイツ) ディーディーイー
ギリシャ エルジーアール
英語(オーストラリア) ja-AU
英語(カナダ) エン・カリフォルニア
英語(イギリス) エンGB
英語(ガーナ) エンGH
英語(香港) エン・エイチケー
英語(アイルランド) エンアイイー
英語(インド) エン・イン
英語(ケニア) エン・ケイ
英語(ナイジェリア) エン・NG
英語(ニュージーランド) エン・ニュージーランド
英語(フィリピン) エンピーエイチ
英語(パキスタン) エンピーケー
英語(シンガポール) エンエスジー
英語(タンザニア) エンティーゼット
英語(アメリカ) エン・アメリカ
英語(南アフリカ) エン・ザ
スペイン語(アルゼンチン) エスエーアール
スペイン語(ボリビア) エス・ボー
スペイン語(チリ) エスシーエル
スペイン語(コロンビア) エスシーオー
スペイン語(コスタリカ) エスシーアール
スペイン語(ドミニカ共和国) エスド
スペイン語(エクアドル) エスイーシー
スペイン語(スペイン) エスイーエス
スペイン語(グアテマラ) エスジーティー
スペイン語(ホンジュラス) エスエイチエヌ
スペイン語(メキシコ) エスエムエックス
スペイン語(ニカラグア) エスエヌアイ
スペイン語(パナマ) エスパ
スペイン語(ペルー) エスピーイー
スペイン語(プエルトリコ) エスピーアール
スペイン語(パラグアイ) エスピーワイ
スペイン語(エルサルバドル) エスエスブイ
スペイン語(アメリカ) エスユーエス
スペイン語(ウルグアイ) エスユーワイ
スペイン語(ベネズエラ) エスブイ
エストニア語(エストニア) イーイー
バスク(スペイン) ユーロイーエス
ペルシャ語(イラン) ファ
フィンランド語(フィンランド) フィフィ
フランス語(ベルギー) fr-BE
フランス語(カナダ) カリフォルニア州
フランス語(スイス) fr-CH
フランス fr-FR
ガリシア語(スペイン) グローイーエス
グジャラート語(インド) グイン
ヒンディー語(インド) ハイイン
クロアチア語(クロアチア) hr-HR
ハンガリー語(ハンガリー) フー・フー
アルメニア語 hy-AM
インドネシア語(インドネシア) イドアイディー
アイスランド語(アイスランド) is-IS
イタリア語(スイス) イット・チー
イタリア語(イタリア) イット・アイティー
ヘブライ語(イスラエル) iw-IL
日本語(日本) ja-JP
ジャワ語 jv-ID
グルジア語 カGE
カザフ(カザフスタン) kk-KZ
クメール語 km-KH
カンナダ語(インド) ナイン
韓国語 ko-KR
ラオス ロLA
リトアニア語(リトアニア) lt-LT
ラトビア語(ラトビア) LV
マケドニア語(北マケドニア) mk-MK
マラヤーラム語(インド) ml-IN
モンゴル語 mn-MN
マラーティー語(インド) mr-IN
マレー語(マレーシア) ms-MY
ビルマ語(ミャンマー) マイエムエム
ネパール語(ネパール) エヌエヌピー
オランダ語(ベルギー) nl-BE
オランダ語 NL
ノルウェー語(ノルウェー) ノーノー
ポーランド語(ポーランド) プラプラ
ポルトガル語(ブラジル) pt-BR
ポルトガル語(ポルトガル) pt-PT
ルーマニア語(ルーマニア) ro-RO
ロシア語 RU
キンヤルワンダ(ルワンダ) rw-RW
シンハラ語(スリランカ) シー・エル・ケー
スロバキア語(スロバキア) エスケーエスケー
スロベニア語(スロベニア) エスエルエスアイ
アルバニア語(アルバニア) スクエアアル
セルビア語(セルビア) SR-RS
南ソト(南アフリカ) st-ZA
スンダ語(インドネシア) su-ID
スウェーデン語(スウェーデン) エスブイエスイー
スワヒリ語(ケニア) sw-KE
スワヒリ語(タンザニア) sw-TZ
タミル語(インド) タイン
タミル語(スリランカ) タLK
タミル語(マレーシア) タミー
タミル語(シンガポール) ta-SG
テルグ語(インド) ティー・イン
タイ th-TH
トルコ語 tr-TR
ツォンガ(南アフリカ) ts-ZA
ウクライナ語(ウクライナ) uk-UA
ウルドゥー語(インド) ウル・イン
ウルドゥー語(パキスタン) ウル・ピー・ケー
ウズベク語(ウズベキスタン) ウズユーゼット
ベンダ(南アフリカ) ヴェー・ザー
ベトナム人 vi-VN
ホーサ語(南アフリカ) xh-ZA
ズールー(南アフリカ) zu-ZA