https://d226lax1qjow5r.cloudfront.net/blog/blogposts/transcribe-a-conference-call-using-amazon-transcribe-dr/Blog_Transcribe_Conference-Call_1200x600.png

Transkribieren einer Telefonkonferenz mit Amazon Transcribe und Vonage

Zuletzt aktualisiert am May 10, 2021

Lesedauer: 2 Minuten

Hin und wieder werde ich daran erinnert, dass ich in der Zukunft lebe. Zumindest in der Zukunft, von der ich in den 80er Jahren geträumt habe.

Einer meiner ersten Jobs bestand darin, Kundendienstanrufe zu transkribieren, die sich irgendwie in Beschwerden gegen das Unternehmen verwandelt hatten, für das ich als Zeitarbeiter arbeitete. Ich war damals - und bin es immer noch - eine lausige Schreibkraft, und das war immer eine Tortur, die mir keinen Spaß machte.

Wäre es nicht toll, dachte ich, wenn Computer gut genug wären, um dies automatisch zu tun. Mit den damaligen ZX Spectrums und BBC Micros war das kaum möglich.

Ein paar Jahrzehnte später ist die Fähigkeit, Voice-Aufnahmen zu transkribieren, nicht mehr besonders neu. Neu ist die weit verbreitete Verfügbarkeit dieser Technologie und - dank der Leistungsfähigkeit von APIs - die Leichtigkeit, mit der sie in eine Vielzahl von Arbeitsabläufen integriert werden kann.

Wenn es Ihnen so geht wie mir, verbringen Sie viel Zeit in Telefonkonferenzen und müssen oft nachlesen, was in diesen Gesprächen gesagt wurde. Wäre es nicht toll, wenn Sie diese automatisch transkribieren lassen könnten, damit Sie sie in aller Ruhe noch einmal durchgehen können? Nun, das können Sie, und ich habe die Demo-App, um es zu beweisen!

Die Anwendung

Unsere Demo-App verwendet die Vonage Voice API, um eine beliebige Anzahl von Anrufern in einer Konferenz zu verbinden, und leitet dann die Audiodaten an die Amazon Transcribe API weiter. Wenn die Transkription fertig ist, wird sie lokal heruntergeladen und dann analysiert, um anzuzeigen, was von jedem Teilnehmer gesagt wurde. Es ist im Moment noch etwas einfach, aber es könnte leicht erweitert werden, um eine schöne Schnittstelle zu präsentieren, die es Ihnen ermöglichen würde, alle Ihre Konferenzen zu sehen und die Abschrift mit einem Klick auf eine Schaltfläche anzuzeigen.

Hier gibt es einige bewegliche Teile, wie in der folgenden Abbildung dargestellt:

Diagram showing the functionality of the Amazon Transcribe Call demoDiagram showing the functionality of the Amazon Transcribe Call demo

Wir verwenden die Vonage Voice API, um eine Telefonkonferenz zu erstellen. Wenn die Konferenz beendet ist, wird die Rohfassung des Anrufs in den Cloud-Speicherdienst S3 von Amazon hochgeladen.

Wenn das Audio in unserem Speicher-Bucket erscheint, verwenden wir den Cloudwatch-Service von Amazon, um ein Ereignis auszulösen. Dieses Ereignis löst wiederum eine serverlose Lambda-Funktion aus, die unsere Anwendung benachrichtigt, dass das Transkript verfügbar ist. Die Anwendung lädt dann das Transkript herunter und parst den Inhalt.

Probieren Sie es aus!

Der Quellcode für die Demo und die Schritte, die Sie durchführen müssen, um sie auszuführen, sind hier.

Darüber hinaus haben wir ein Anleitung die zeigt, wie es zusammengesetzt wurde.

Wir würden uns freuen, wenn Sie es ausprobieren und uns Ihre Meinung mitteilen würden. Wir wären ekstatisch wenn Sie das Repo forken und es noch besser machen!

Teilen Sie:

https://a.storyblok.com/f/270183/384x384/637d0e41eb/marklewin.png
Mark LewinVonage Ehemalige

Ehemaliger technischer Redakteur bei Vonage. Liebt es, mit APIs zu spielen und sie zu dokumentieren.