https://d226lax1qjow5r.cloudfront.net/blog/blogposts/speech-to-text-with-nexmo-and-azure-speech-dr/Speech-To-Text-with-Nexmo-and-Microsoft-Azure.png

Martyn Daviesヴォネージの卒業生

元Vonage開発者教育ディレクター。クリエイティブ・デベロッパー、プロダクト・マネージャー、ハック・デイ・オーガナイザーの経歴を持つマーティンは、放送局や大手レコード会社での勤務を経て、2012年よりテクノロジー・アドボケイトとして活動している。世界中の開発者を教育し、力を与えている。

NexmoとMicrosoft Azureによる音声テキスト化

最終更新日 April 19, 2021

#azure

#voice-api

所要時間：3 分

インバウンドの電話を受信し、リアルタイムで自動的に書き起こすのに役立つものが必要だと感じたことがあれば、それは幸運なことです。 Nexmo-to-Azureスピーチサービスコネクター.

最近、このコネクターのコードとデプロイメント・オプションを更新したので、解決しようとしている問題にマッチする場合、デプロイ、修正、拡張がさらに簡単になりました。

もし、あなたがすでにネクスモを気に入り、早く始めたいと思っているのであれば、次のページで詳細をご覧ください。ネクスモ・コミュニティGithubレポジトリをご覧ください。

Azureのスピーチ・サービスとアプリの連携方法

マイクロソフトのAzureプラットフォームは、次のような素晴らしいセットを提供している。コグニティブ・サービスを提供している。このアプリは音声テキストAPIを介してリアルタイムでストリーミングされる音声を認識する。ウェブソケットを介してリアルタイムにストリーミングされる音声を認識します。 Nexmo通話コントロールオブジェクト.

簡単に言えば、あなたは 文字通りAPIを呼び出して話しかける。Azure Speechが音声認識を行い、コンソールにフレーズが返される。

Nexmo Azure Speech Service

独自のインスタンスを実行する

このアプリは Nexmo Extendこのプログラムは、便利で再利用可能なアプリケーションを作成し、Nexmoを次のような他の優れたサービスプロバイダーと組み合わせて使用できるようにするものです。 Microsoft Azure, Googleクラウドそしてアマゾンウェブサービス.

デプロイも簡単で、ワンクリックですぐにこのアプリケーションのインスタンスを使用することができます。

ワンクリック・デプロイ・オプション

GitHubリポジトリのReadmeの上部にあるボタンを使って、アプリをHerokuまたはAzureにデプロイするオプションがある。

しかし、もしあなたがこのアプリをデプロイし、ブラウザから直接コードを扱う安全な（壊れにくい！）方法を持ちたいのであれば、以下を試してみてほしい。 Glitchでアプリをリミックスするでアプリをリミックスして、コードベースの拡張をすぐに始めてください。

Dockerによるデプロイと実行

このアプリはDockerで実行またはデプロイすることもできる。一番手っ取り早い方法は、リポジトリをクローンし、ルートディレクトリからDocker Composeを使って実行することです：

docker-compose up

どのデプロイメントオプションを選択しても、アプリが実行されている新しい hostnameNexmoのバーチャル番号をリンクしてセットアップを完了します。

アプリとNexmoの連携

Vonage API Account

To complete this tutorial, you will need a Vonage API account. If you don’t have one already, you can sign up today and start building with free credit. Once you have an account, you can find your API Key and API Secret at the top of the Vonage API Dashboard.

This tutorial also uses a virtual phone number. To purchase one, go to Numbers > Buy Numbers and search for one that meets your needs.

ダッシュボードの使用

Voiceアプリケーションの作成
イベントのURLを追加 https://<your_new_hostname>/ncco
回答URLを追加 https://<your_new_hostname>/event
クリック Create Application
をクリックし Numbersをクリックし、最近作成したバーチャル番号をリンクする。
次のステップで使用する仮想番号をコピーする。

コマンドラインインターフェイスの使用

CLIは以下の手順でインストールできます。をインストールすることができます。.次に、新しいNexmoアプリケーションを作成します。 answer_urlと event_urlを設定します。

nexmo app:create ms-speech-to-text http:///ncco http:///event

アプリケーションIDが返されます。それをメモしておいてください。

新しいバーチャル番号を借りる

すでに番号をお持ちでない場合は、番号を借りる必要があります。CLIを使ってこれを実現できる：

nexmo number:buy

仮想番号をアプリケーションにリンクする

最後に、新しい番号を作成したアプリケーションにリンクさせる：

nexmo link:app YOUR_NUMBER YOUR_APPLICATION_ID

試してみる

さて、アプリを起動した状態で、どこにデプロイしたにせよ、アプリに割り当てた番号に電話をかけ、話し始めてください。短いポーズの後、あなたが話したことがリアルタイムでコンソールに書き出されます。

この延長方法

次の論理的なステップは、Azure Speech Serviceが返すフレーズを、それを消費して受信したものに対応する別のサービスにプッシュし始めることだろう。

これを行うには on_return_message関数を修正することで実現できる：

if data['RecognitionStatus'] == "Success":
    # Extend From here to handle your transcription messages
    print(data["DisplayText"])

Requestsライブラリ（これはすでに依存関係にあるので、再度インストールする必要はない）を使えば、次のことができる。 POSTフレーズをJSONオブジェクトとして別のAPIに送り、そこで消費され、その後処理される。この機能を追加するには if文の末尾を on_return_messageを次のように変更する：

if data['RecognitionStatus'] == "Success":
    # Extend From here to handle your transcription messages
    print(data["DisplayText"])

    url = "http://<another_api>/<endpoint>"
    headers = {'Content-Type': 'application/json'}
    
    resp = requests.post(url, headers=headers, data=json.dumps({'phrase': data["DisplayText"]}))

    if resp.status_code == 200:
        print(resp.content)
    else:
        print(resp.status_code)
        print(resp.content)

Azure Speech Service から新しいフレーズが返されるたびに {"phrase":"Words returned by the app."}オブジェクトが送信されます。

次にどうするかはあなた次第だ！

このアプリケーションを拡張する場合、またはこのアプリケーションの動作について質問がある場合は、次のチャンネルにアクセスしてください。 NexmoコミュニティSlackチャンネル私たちが喜んでお手伝いし、どんな提案にも耳を傾けます。

Martyn Daviesヴォネージの卒業生

シェア:

NexmoとMicrosoft Azureによる音声テキスト化

Azureのスピーチ・サービスとアプリの連携方法

独自のインスタンスを実行する

ワンクリック・デプロイ・オプション

Dockerによるデプロイと実行

アプリとNexmoの連携

Vonage API Account

ダッシュボードの使用

コマンドラインインターフェイスの使用

新しいバーチャル番号を借りる

仮想番号をアプリケーションにリンクする

試してみる

この延長方法

シェア:

シェア:

NexmoとMicrosoft Azureによる音声テキスト化

Azureのスピーチ・サービスとアプリの連携方法

独自のインスタンスを実行する

ワンクリック・デプロイ・オプション

Dockerによるデプロイと実行

アプリとNexmoの連携

Vonage API Account

Ready to start building?

ダッシュボードの使用

コマンドラインインターフェイスの使用

新しいバーチャル番号を借りる

仮想番号をアプリケーションにリンクする

試してみる

この延長方法

シェア: