
Amazon TranscribeとVonageを使って電話会議を書き起こす
所要時間:1 分
時々、私は自分が未来に生きているという事実を思い出す。少なくとも、80年代に夢見た未来に。
私の最初の仕事のひとつは、派遣先の会社に対するクレームに発展したカスタマー・サービスの電話を書き写すことだった。当時も今も、私はタイピングが下手で、この試練は決して楽しいものではなかった。
もしコンピューターがこれを自動でやってくれるなら、素晴らしいことだと思った。当時のZXスペクトラムやBBCマイクロでは、その可能性はあまりなかった。
数十年前のことだが、録音された音声を書き起こす機能は特に目新しいものではない。新しいのは、このテクノロジーが広く利用できるようになったことと、APIの力によって、さまざまなワークフローに簡単に組み込むことができるようになったことです。
私と同じように、電話会議に多くの時間を費やし、その中で話されたことを参照する必要がよくあります。もし自動で書き起こせたら、自分の好きな時に見直すことができるのに、と思いませんか?それを証明するデモアプリがあります!
アプリケーション
私たちのデモアプリは、Vonage Voice APIを使用して、任意の数の発信者を会議に接続し、その音声をAmazon Transcribe APIにパイプします。書き起こしの準備ができると、それをローカルにダウンロードし、それを解析して各参加者が何を話したかを表示する。現時点では少し基本的だが、ボタンをクリックするだけで、すべての会議を見たり、トランスクリプトを見たりできるような素晴らしいインターフェイスに拡張するのは簡単だろう。
以下の図に示すように、ここにはいくつかの可動部分がある:
Diagram showing the functionality of the Amazon Transcribe Call demo
私たちはVonage Voice APIを使用して電話会議を作成します。会議が終了すると、生の通話音声がAmazonのS3クラウドストレージサービスにアップロードされる。
音声がストレージバケットに表示されると、AmazonのCloudwatchサービスを使ってイベントをトリガーする。このイベントはサーバーレスのLambda関数を起動し、トランスクリプトが利用可能になったことをアプリケーションに通知する。その後、アプリケーションはトランスクリプトをダウンロードし、内容を解析する。
お試しあれ!
デモのソースコードと、デモを実行するために必要な手順は次のとおりです。 こちら.
さらに チュートリアルがあります。
ぜひ一度試していただき、感想をお聞かせいただければ幸いです。私たちは 恍惚もしあなたがこのレポをフォークして、さらに良いものにしてくれたら、私たちは大喜びです!