技術詳細

Vonage Voice APIを使用すると、開発者は2つの補完的なモデルを使用して音声通話をプログラムで管理することができます:

  • ひとつは アプリケーションによって開始されるREST APIコールまたはSDKを使用する。
  • もうひとつは Vonageからお客様のアプリケーションに要求されます。を使用している。 ウェブフック そして エヌシーシーオー (Nexmo Call Control Object - Nexmoは現在Vonageである)の説明を参照してください。

この2つのアプローチは、シンプルな通知から高度なコンタクトセンターフローやAI統合まで、様々なコールフローやプログラム可能な音声ユースケースを実装するための柔軟なコールハンドリングをサポートします。

さらに、Vonage Voice APIでは以下のことが可能です:

  • すでに使用しているウェブ技術で拡張性のあるアプリを構築。
  • NCCOでインバウンドコールとアウトバウンドコールのフローをJSONでコントロール。
  • インバウンドまたはアウトバウンドコールの録音と保存。
  • 電話会議の開催
  • 性別やアクセントの異なる40言語で音声合成メッセージを送信。

内容

この文書では、以下について学ぶことができる:

はじめに

Vonage Voice API を使用するために必要なすべての手順については、Vonage Voice API を使用するために必要なすべての手順を参照してください。 はじめに を案内する。

音声通話の開始

バックエンドアプリケーションから音声通話を開始するには、HTTPエンドポイントを使用します:

POST /calls

このメソッドは、電話番号またはSIPエンドポイントへのアウトバウンドコールを開始する。HTTP 経由で直接使用することも、任意の VonageサーバーSDK.

参照 電話をかける のコード・スニペットで、アウトバウンド・コールの開始について詳しく学ぶことができます。

通話が接続されると、VonageはWebhookまたは静的URLから(NCCOの形で)指示を要求し、通話をどのように進めるべきかを決定します。

NCCOとの通話指示

アン エヌシーシーオー (Nexmo Call Control Object)はJSONベースの構造体で、通話中に何が起こるかを定義します。通話がつながったときに、Vonageのウェブフック・リクエストに応答してこのオブジェクトを返します。

一般的なNCCOの行動には以下が含まれる:

  • talk - テキストを音声に変換し、通話相手に聞かせる
  • stream - オーディオファイルを再生する
  • record - 通話音声を録音する
  • connect - 他の参加者を会話に参加させる

NCCOコマンドの全リストは NCCOリファレンス.

アクティブコールの制御

通話が開始されると、REST APIエンドポイントを使用して、通話を動的に制御することもできる:

  • PUT /calls/{uuid} - 通話ステータスの更新(切断、転送、ミュートなど)
  • PUT /talk そして DELETE /talk - 通話中に音声合成を開始または停止する
  • PUT /talk そして DELETE /stream - オーディオファイルのストリーミングを開始または停止する

これらのアクションにより、ユーザーのアクションとアプリケーションロジックに基づいて、コールの動作をリアルタイムで変更できます。

参照 Voice API リファレンス REST API エンドポイントの完全なリストについては、こちらをご覧ください。

さらに読む