https://d226lax1qjow5r.cloudfront.net/blog/blogposts/transcribe-a-conference-call-using-amazon-transcribe-dr/Blog_Transcribe_Conference-Call_1200x600.png

Amazon TranscribeとVonageを使って電話会議を書き起こす

最終更新日 May 10, 2021

所要時間:1 分

時々、私は自分が未来に生きているという事実を思い出す。少なくとも、80年代に夢見た未来に。

私の最初の仕事のひとつは、派遣先の会社に対するクレームに発展したカスタマー・サービスの電話を書き写すことだった。当時も今も、私はタイピングが下手で、この試練は決して楽しいものではなかった。

もしコンピューターがこれを自動でやってくれるなら、素晴らしいことだと思った。当時のZXスペクトラムやBBCマイクロでは、その可能性はあまりなかった。

数十年前のことだが、録音された音声を書き起こす機能は特に目新しいものではない。新しいのは、このテクノロジーが広く利用できるようになったことと、APIの力によって、さまざまなワークフローに簡単に組み込むことができるようになったことです。

私と同じように、電話会議に多くの時間を費やし、その中で話されたことを参照する必要がよくあります。もし自動で書き起こせたら、自分の好きな時に見直すことができるのに、と思いませんか?それを証明するデモアプリがあります!

アプリケーション

私たちのデモアプリは、Vonage Voice APIを使用して、任意の数の発信者を会議に接続し、その音声をAmazon Transcribe APIにパイプします。書き起こしの準備ができると、それをローカルにダウンロードし、それを解析して各参加者が何を話したかを表示する。現時点では少し基本的だが、ボタンをクリックするだけで、すべての会議を見たり、トランスクリプトを見たりできるような素晴らしいインターフェイスに拡張するのは簡単だろう。

以下の図に示すように、ここにはいくつかの可動部分がある:

Diagram showing the functionality of the Amazon Transcribe Call demoDiagram showing the functionality of the Amazon Transcribe Call demo

私たちはVonage Voice APIを使用して電話会議を作成します。会議が終了すると、生の通話音声がAmazonのS3クラウドストレージサービスにアップロードされる。

音声がストレージバケットに表示されると、AmazonのCloudwatchサービスを使ってイベントをトリガーする。このイベントはサーバーレスのLambda関数を起動し、トランスクリプトが利用可能になったことをアプリケーションに通知する。その後、アプリケーションはトランスクリプトをダウンロードし、内容を解析する。

お試しあれ!

デモのソースコードと、デモを実行するために必要な手順は次のとおりです。 こちら.

さらに チュートリアルがあります。

ぜひ一度試していただき、感想をお聞かせいただければ幸いです。私たちは 恍惚もしあなたがこのレポをフォークして、さらに良いものにしてくれたら、私たちは大喜びです!

シェア:

https://a.storyblok.com/f/270183/384x384/637d0e41eb/marklewin.png
Mark Lewinヴォネージの卒業生

元Vonageのテクニカルライター。APIをいじり、文書化するのが大好き。