Technische Details

Die Vonage Voice API ermöglicht es Entwicklern, Sprachanrufe mit Hilfe von zwei komplementären Modellen programmatisch zu verwalten:

  • Eine ist initiiert durch Ihre Anwendungmit Hilfe von REST-API-Aufrufen oder SDKs.
  • Das andere ist von Vonage aus Ihrer Anwendung angefordert, mit Webhaken und NCCO (Nexmo Call Control Object - Nexmo ist jetzt Vonage) Anweisungen.

Dieser duale Ansatz unterstützt eine flexible Anrufabwicklung zur Implementierung verschiedener Anrufabläufe und programmierbarer Sprachanwendungsfälle, von einfachen Benachrichtigungen bis hin zu ausgefeilten Contact-Center-Abläufen und KI-Integration.

Darüber hinaus ermöglicht die Vonage Voice API Folgendes:

  • Erstellen Sie Anwendungen, die mit den von Ihnen bereits verwendeten Webtechnologien skalierbar sind.
  • Steuern Sie mit NCCO den Fluss eingehender und ausgehender Anrufe in JSON.
  • Eingehende und ausgehende Anrufe aufzeichnen und speichern.
  • Erstellen Sie Telefonkonferenzen.
  • Senden Sie Text-to-Speech-Nachrichten in 40 Sprachen mit verschiedenen Geschlechtern und Akzenten.

Inhalt

In diesem Dokument erfahren Sie mehr über:

Erste Schritte

Informationen zu allen notwendigen Schritten, um die Vonage Voice API in Betrieb zu nehmen, finden Sie in der Erste Schritte Leitfaden.

Starten eines Sprachanrufs

Um einen Sprachanruf von Ihrer Backend-Anwendung aus zu starten, verwenden Sie den HTTP-Endpunkt:

POST /calls

Diese Methode initiiert einen ausgehenden Anruf an eine Telefonnummer oder einen SIP-Endpunkt. Sie können sie direkt über HTTP oder über eine Vonage Server SDKs.

Siehe die Anrufe tätigen Codefragment, um mehr über das Einleiten ausgehender Anrufe zu erfahren.

Wenn die Verbindung hergestellt ist, fordert Vonage Anweisungen (in Form eines NCCO) von Ihrem Webhook oder Ihrer statischen URL an, um zu bestimmen, wie der Anruf fortgesetzt werden soll.

Gesprächsanweisungen mit NCCOs

Eine NCCO (Nexmo Call Control Object) ist eine JSON-basierte Struktur, die definiert, was während eines Anrufs passieren soll. Sie geben es als Antwort auf die Webhook-Anfrage von Vonage zurück, wenn der Anruf verbunden wird.

Zu den üblichen NCCO-Aktionen gehören:

  • talk - Text in Sprache umwandeln und dem Anrufer vorspielen
  • stream - Abspielen einer Audiodatei
  • record - Aufzeichnung des Telefongesprächs
  • connect - Verbinden Sie einen anderen Teilnehmer mit dem Gespräch

Die vollständige Liste der NCCO-Befehle finden Sie in der NCCO-Referenz.

Steuerung eines aktiven Anrufs

Sobald ein Anruf läuft, können Sie ihn auch dynamisch über REST-API-Endpunkte steuern:

  • PUT /calls/{uuid} - Aktualisieren des Anrufstatus (z. B. Auflegen, Weiterleiten, Stummschalten)
  • PUT /talk und DELETE /talk - Text-to-Speech während des Anrufs starten oder stoppen
  • PUT /talk und DELETE /stream - Streaming von Audiodateien starten oder stoppen

Mit diesen Aktionen können Sie das Anrufverhalten in Echtzeit ändern, basierend auf Benutzeraktionen und Ihrer Anwendungslogik.

Siehe die Voice API-Referenz für eine vollständige Liste der REST-API-Endpunkte.

Weitere Lektüre