https://d226lax1qjow5r.cloudfront.net/blog/blogposts/processing-voice-calls-with-amazon-transcribe-comprehend/voiceapi_amazon-comprehend_1200x600.png

Amazon Transcribe & Comprehendで音声通話を処理する

最終更新日 May 12, 2021

所要時間:1 分

このチュートリアルでは、Amazon Transcribe & Comprehendのリファレンス接続のセットアップについて説明します。また、Vonage Voice APIを使用したサンプルアプリケーションのセットアップについても説明します。この通話は、参照接続にWebSocketを接続することで、各パーティーのスピーチに対してセンチメント分析を伴う個別のリアルタイム文字起こしを取得します。

AWSのAIプラットフォームは、文字起こしエンジンAmazon Transcribeや感情分析エンジンAmazon Comprehendを含む高度な機能を提供している。

このチュートリアルでは、Amazon Transcribe & Comprehendのリファレンス接続と、Vonage Voice APIを使用したサンプルアプリケーションのセットアップについて説明します。

このサンプル・アプリケーションでは、ある当事者が Vonage プラットフォーム上の電話番号に電話をかけ、その電話番号から別の当事者に電話をかけます。両当事者は互いに通話し、各当事者の音声ストリームはWebSocket経由でリファレンス接続に送信され、リアルタイムでトランスクリプションされます。その後、トランスクリプトがリファレンス接続に送信され、リアルタイムのセンチメント分析が行われる。

各パーティは、個別のリアルタイムの書き起こしおよび感情分析を行います。このサンプル・アプリケーションでは、音声電話会議の参加者は2人です。個別のトランスクリプションとセンチメント分析は、電話会議の参加者がさらに増えても同じように機能します。

最初のセクションでは、Amazon Transcribe & Comprehendのリファレンス接続を設定し、各パーティーのVoiceをリアルタイムでストリーミングできるようにします。 ウェブソケットを介した音声ストリーミングを可能にします。Amazon Transcribe & Amazon Comprehendとの間の音声チャンクの送信、トランスクリプト、センチメント分析結果は、(安全な)HTTPリクエストを介して行われます。また、トランスクライブとセンチメントスコアは、Webhooksを使用してVoice APIアプリケーションにリレーバックされます。

次のセクションでは、Vonage Voice APIを使用するサンプルアプリケーションを設定します。 サンプル・アプリケーションを設定します。を使用するサンプル・アプリケーションを設定します:

  • 着信に対応する

  • 第二パーティーに電話する

  • 各パーティにWebSocketを確立する

  • 各当事者の成績証明書を別々に受け取る

  • センチメント分析のためにトランスクリプトを提出する

  • 各政党のスピーチ文のセンチメントスコアを別々に受け取る

Vonage API Account

To complete this tutorial, you will need a Vonage API account. If you don’t have one already, you can sign up today and start building with free credit. Once you have an account, you can find your API Key and API Secret at the top of the Vonage API Dashboard.

This tutorial also uses a virtual phone number. To purchase one, go to Numbers > Buy Numbers and search for one that meets your needs.

下の図は、サンプルの統合アーキテクチャーの概要を示している。

この記事のサンプル・アプリケーションは、PSTN(携帯電話、固定電話、VoIP電話、PBX内線など)を介して接続する2つの当事者との電話会議を処理します。

Example overview of a simple integration architecture

Amazon TranscribeとAmazon Comprehendのリファレンス接続のセットアップ

  • 次のサイトへ https://github.com/nexmo-community/transcribe-comprehend-multi-sub,

  • このリポジトリに記載されている指示に従ってください、

  • で説明されている展開タイプのいずれかを選択します。 Transcribe および Comprehend のリファレンス接続の実行セクションを参照してください、

  • サーバーのパブリックホスト名とポートをメモしてください(例 xxxx.ngrok.io, myserver.mycompany.com:40000または <docker_host_name>:<proxy_port>次のセクション「サンプルVonage Voice APIアプリケーションのセットアップ」で必要になります。 transcribe_comprehend_reference_connectionの引数として)。).

サンプルVonage Voice APIアプリケーションのセットアップ

  • 次のサイトへ https://github.com/nexmo-community/transcribe-comprehend-client,

  • このリポジトリに記載されている指示に従ってください、

  • で説明されている展開タイプのいずれかを選択します。 Transcribe & Comprehend クライアント アプリケーションの実行セクションを参照してください、

  • 電話番号 リンクされている電話番号Voice APIアプリケーションにリンクされている電話番号と CALLEE_NUMBERを控えておいてください。 Vonage Voice APIアプリケーションの認証情報と電話番号の設定」セクションで説明したように、Voice APIアプリケーションにリンクされている電話番号とCALLEE_NUMBERを控えておいてください。で説明したCALLEE_NUMBERを使用します。これらは次のセクション「サンプルアプリケーションのテストドライブ」で参照します。

サンプルアプリケーションのテストドライブ

  • 電話番号 電話番号に電話をかける。Voice APIアプリケーションにリンクされた電話番号に電話をかけると、"Please wait, we are connecting your call "というメッセージが表示されます、

  • 電話番号のあるパーティー CALLEE_NUMBERというメッセージが聞こえます、

  • 発呼側と着呼側の双方が通話できるようになった、

  • をご覧ください。 リファレンス接続アプリケーション・コンソールと サンプル Vonage Voice API アプリケーションコンソールに表示されます。

シェア:

https://a.storyblok.com/f/270183/400x401/43538b1c0b/tony-chan.png
Tony Chanシニア・ソリューション・エンジニア

Vonageのカスタマー・ソリューション・エンジニア。製品管理、ネットワークおよびシステム運用、カスタマーサポート、品質保証、ソフトウェア開発チームマネージャーなどの経歴を持ち、以前はフランス、現在は米国の電気通信業界で働いている。プログラマブルなVoice、Messaging、Video、多要素認証サービスを用いて、グローバルな大企業や中小企業のソリューション開発を支援している。