https://a.storyblok.com/f/270183/1368x665/430960f1d9/26feb_dev-blog_what-is-voip_1368x665.png

Was ist VoIP?

Zuletzt aktualisiert am February 17, 2026

Lesedauer: 9 Minuten

VoIP (Voice over Internet Protocol) ist eine Technologie, die es ermöglicht, Sprachanrufe über das Internet statt über herkömmliche Telefonnetze zu führen. Durch die Umwandlung von Ton in digitale Datenpakete ermöglicht VoIP die Sprach- und Videokommunikation in Echtzeit über IP-basierte Netze - und damit alles, von Geschäftstelefonsystemen bis hin zu Videokonferenzanwendungen und mobilen Netzwerken.

Ursprünglich in den 1970er Jahren entwickelt, wurde VoIP erst in den späten 1990er und frühen 2000er Jahren kommerziell nutzbar, als ein weit verbreiteter Internetzugang und verbesserte Netzwerktechnologien die Einführung in großem Umfang ermöglichten. Bis 2020 war VoIP zu einer unverzichtbaren Infrastruktur geworden und bildete das Rückgrat der modernen Kommunikation für Unternehmen und Verbraucher in fast allen Branchen.

Voice- und Videoanrufe sind heute so alltäglich, dass die dahinter stehende Technologie oft unbemerkt bleibt. Aber was bedeutet es eigentlich, wenn Sprachanrufe als Datenpakete übertragen werden? Welche technischen Herausforderungen löst VoIP, und warum ist es zur Grundlage der modernen Kommunikation geworden? In diesem Beitrag beantworten wir diese Fragen, erläutern, wie VoIP funktioniert, und zeigen Ihnen, wie Sie es selbst ausprobieren können, indem Sie die Vonage Voice API.

Dieser Blogbeitrag ist so strukturiert, dass er verschiedenen Lese- und Lernstilen gerecht wird. Jeder Abschnitt ist atomar aufgebaut, Sie können ihn also in der Reihenfolge lesen, die Ihnen am besten gefällt:

Von der Telefonleitung zum Internet: Wie Voice digital wurde

VoIP ist auch als IP-Telefonie bekannt. VoIP ist eine Reihe von Technologien, die in erster Linie für die Sprachkommunikation über Internetprotokollnetze (IP) verwendet werden. Mit anderen Worten: VoIP ermöglicht es, ein Telefongespräch über das Internet statt über das traditionelle öffentlichen Telefonnetz (PSTN) oder einfachen alten Telefondienst (POTS).

Um zu verstehen, warum VoIP so revolutionär ist, ist es wichtig zu wissen, wie Telefongespräche ursprünglich funktionierten.

Wie Telefongespräche vor dem Internet funktionierten

Die meiste Zeit des 20. Jahrhunderts wurden Telefongespräche über physische Drähte abgewickelt. Wenn Sie den Hörer abnahmen und eine Nummer wählten, wurde Ihr Anruf über einen speziellen Pfad aus Kupferkabeln über eine leitungsvermittelten Netzwerk. Die Schallwellen Ihrer Stimme wurden in elektrische Signale umgewandelt und über diesen Weg hin und her übertragen. Diese Verbindung blieb während der gesamten Dauer des Gesprächs bestehen, auch in Momenten der Stille.

Dieses System funktionierte, hatte aber seine Grenzen. Es erforderte eine teure Infrastruktur, war nicht leicht zu skalieren und nicht sehr flexibel. Nach Beendigung des Anrufs wurde die Verbindung getrennt und konnte nicht für andere Zwecke wiederverwendet werden. Was passiert, wenn die gesamte Infrastruktur ausfällt? Gibt es eine Möglichkeit, diese Verbindungen beständiger und zuverlässiger zu machen?

In den 1960er Jahren entwickelte sich eine neue Technologie als Antwort auf diese Frage - das Internet. Als Computer und das Internet immer mehr Verbreitung fanden, stellten sich Ingenieure eine einfache Frage: Was wäre, wenn Voice auf die gleiche Weise übertragen werden könnte wie E-Mails und Webseiten?

A stylized illustration of the evolution of communication from analog to digital.Umwandlung von Voice in Daten

Das Internet sendet die Informationen nicht in einem einzigen, kontinuierlichen Strom. Stattdessen wird alles in kleine Pakete aufgeteilt, die in einem Prozess namens Paketvermittlung. Jedes Paket hat einen Kopf und eine Nutzlast: Der Header teilt dem Paket mit, wohin es gehen soll, und wenn es sein Ziel erreicht hat, wird die Nutzlast des Pakets extrahiert und entweder von einem Betriebssystem, einer Anwendungssoftware oder von Protokollen einer höheren Schicht verarbeitet. Mit anderen Worten: Ein Paket ist wie ein Briefumschlag mit einer Adresse, die dem Netz mitteilt, wohin es gehen soll; der Brief im Inneren des Umschlags enthält die Daten. Genau das passiert unter der Haube, wenn Sie eine E-Mail senden, eine Website aufrufen, ein Video online streamen oder einen Anruf mit einer virtuellen Nummer tätigen.

Packet Switching löst die Frage, wie Daten effizient über Netzwerke übertragen werden können - aber Voice stellt eine besondere Herausforderung dar. Die menschliche Sprache ist kontinuierlich und analog, während Computernetze mit diskreten digitalen Daten arbeiten. Um Voice über das Internet zu übertragen, müssen die Schallwellen zunächst in eine digitale Form umgewandelt werden, die komprimiert, übertragen und am anderen Ende wieder rekonstruiert werden kann.

Dies ist der Grund lineare prädiktive Kodierung (LPC) zum Einsatz.

LPC ist eine Technik, die in der Sprachverarbeitung eingesetzt wird, um gesprochene Sprache in einem kompakten digitalen Format darzustellen. Anstatt jedes Detail eines Sprachsignals zu übertragen, analysiert LPC kurze Sprachsegmente und identifiziert Muster, die zur Vorhersage kommender Töne verwendet werden können. Nur die wesentlichen Informationen, die für die Wiederherstellung der Voice benötigt werden, werden über das Netzwerk gesendet.

Wenn Sie also in ein VoIP-fähiges Gerät wie ein Smartphone oder einen Laptop sprechen, ist Ihre Stimme:

  1. Erfasst durch ein Mikrofon

  2. Komprimierung in digitale Daten mittels LPC oder einer ähnlichen Technik

  3. Aufteilung in kleine Päckchen

  4. Weiterleitung über das Internet

  5. Zusammengebaut und als Ton am anderen Ende wiedergegeben

All dies geschieht innerhalb von Millisekunden, so dass sich das Gespräch natürlich und in Echtzeit anfühlt.

Warum dies eine große Sache war

Die Umwandlung von Voice in Internetdaten hat alles verändert.

Denn VoIP nutzt die gleichen Netze wie Websites, Apps und Video-Streaming:

  • Anrufe sind billiger - vor allem Ferngespräche und internationale Gespräche

  • Sie brauchen keine speziellen Telefonleitungen

  • Voice, Video und Messaging können in einer einzigen Anwendung zusammenarbeiten

Dieser Wandel legte den Grundstein für moderne Kommunikationsmittel wie Videoanrufe, virtuelle Telefonnummern und Cloud-basierte Kontaktzentren.

Kurz gesagt, VoIP funktioniert, weil das Internet gelernt hat, wie man menschliche Gespräche überträgt - und nicht nur Text und Bilder. Und als Voice nur noch eine Form von Daten war, wurde die Kommunikation schneller, billiger und viel flexibler.

Was ist VoIP und wie wird es verwendet?

Voice over Internet Protocol ist eine Methode zur Übertragung von Schallwellen, die in Datenpakete komprimiert werden, über digitale Netze im Internet. Diese Datenpakete werden mit Hilfe von Kopfzeilen, die die Router leiten, durch die Netze geleitet und enthalten Nutzlasten mit Daten und Anweisungen. Sobald die Pakete ihr Ziel erreicht haben, werden sie wieder zusammengesetzt und mit Hilfe eines Codec. Codec (ein Portmanteau aus Coder/Decoder) bezieht sich auf eine Hardware- oder Softwarekomponente, die einen Datenstrom oder ein Signal kodiert oder dekodiert.

Damit VoIP funktioniert, sind in der Regel folgende Voraussetzungen zu erfüllen:

  1. Eine Internetverbindung

  2. Ein VoIP-fähiges Gerät, z. B. ein Smartphone mit einer VoIP-App darauf

  3. Ein VoIP-Dienstanbieter

  4. Ein Session Border Controller (SBC) zur Verwaltung von Anrufweiterleitung und Sicherheit

Sitzungsprotokolle und Schutzmaßnahmen

VoIP setzt ein Session Initiation Protocol (SIP), um Sprach- und Video-Sitzungen aufzubauen, aufrechtzuerhalten und zu beenden. SIP ist ein textbasiertes Protokoll, das auf dem Hypertext Transfer Protocol (HTTP) und dem Simple Mail Transfer Protocol (SMTP) basiert. Wie IP-Adressen dienen SIP-Adressen der Weiterleitung von Kommunikationsdatenpaketen zwischen VoIP-fähigen Geräten. Sobald eine Sitzung initiiert ist, sind andere Protokolle für die Kodierung, Übertragung und Dekodierung von Datenpaketen zuständig.

Session Border Controllers (SBC) bieten Sicherheit für diese Sitzungen. Sie sind auch für die Konnektivität, die Dienstqualität, die Durchsetzung von Vorschriften sowie für Statistiken und Abrechnungsinformationen zuständig. Wenn eine Sitzung die Verbindung zwischen zwei VoIP-fähigen Geräten ist, dann ist der SBC der Supervisor, der dafür sorgt, dass alles geschützt und in Ordnung ist.

Wie VoIP die Technik vorantreibt, die wir jeden Tag benutzen

Während es bei VoIP ursprünglich um die Sprachübertragung ging, bildet das Konzept der Kommunikation über das Internet die Grundlage für die so genannte IP-Telefonie. IP-Telefonie umfasst sowohl die Sprach- als auch die Text- und Faxkommunikation. Applications wie WhatsApp und Signal nutzen IP-Telefonie. Heutzutage sind VoIP und IP-Telefonie fester Bestandteil der modernen Mobilfunkinfrastruktur, wobei 4G- und 5G-Netze auf IP-basierten Sprachtechnologien beruhen.

Heute geht es bei VoIP nicht mehr nur darum, herkömmliche Telefongespräche zu ersetzen. VoIP und IP-Telefonie bilden die Grundlage für viele unserer wichtigsten modernen Kommunikationsmittel.

Videokonferenzen: Mehr als nur Video

Wenn Sie an einem Videoanruf auf Plattformen wie Zoom, Google Meet oder Microsoft Teams teilnehmen, arbeitet VoIP hinter den Kulissen. Während Ihre Kamera das Video bearbeitet, wird Ihre Stimme erfasst, in digitale Daten umgewandelt und über das Internet mit Hilfe von VoIP-Prinzipien gesendet.

Wie Sie wahrscheinlich schon bei Ihren eigenen Videokonferenzerfahrungen festgestellt haben, ist der Ton in der Regel der wichtigste Teil eines Videoanrufs. Selbst wenn das Video einfriert oder in der Qualität nachlässt, bleibt das Gespräch durch eine klare Audioübertragung erhalten. VoIP ermöglicht es, Sprachdaten anzupassen, zu komprimieren und zu priorisieren, damit sich die Gespräche natürlich anfühlen auch wenn die Internetverbindung nicht perfekt ist.

Messaging-Apps und Voice-Notizen

Messaging-Apps wie WhatsApp, Slack und Discord setzen stark auf die VoIP-Technologie. Wenn Sie eine Sprachnachricht senden, einen Voice-Chat starten oder einen In-App-Anruf tätigen, verwenden Sie kein herkömmliches Telefonnetz. Stattdessen wird Ihre Stimme als Internetdaten übertragen - genau wie Textnachrichten und Bilder.

Das können diese Apps bieten:

  • Kostenlose oder kostengünstige Voice- und Video-Anrufe

  • Länderübergreifende Gruppenanrufe

  • Nahtloser Wechsel zwischen Text, Voice und Video

Aus der Sicht des Benutzers fühlt sich alles wie eine einfache Anwendung an. Unter der Haube ist es VoIP, das diese Flexibilität möglich macht.

Mobile Netzwerke und Wi-Fi-Anrufe

VoIP und IP-Telefonie sind fester Bestandteil der modernen mobilen Infrastruktur. Viele Smartphones unterstützen jetzt Wi-Fi-Anrufe, mit denen Sie über eine drahtlose Internetverbindung telefonieren können, anstatt sich ausschließlich auf Mobilfunkmasten zu verlassen.

Neuere Mobilfunkstandards nutzen auch internetbasierte Voice-Technologien, um klarere Anrufe und schnellere Verbindungszeiten zu ermöglichen. Mit anderen Worten: Auch "normale" Telefongespräche werden zunehmend über VoIP-ähnliche Systeme geführt.

VoIP ist ein Beweis für das menschliche Bedürfnis nach Kommunikation. Vom einfachen Telefon bis hin zu den technologischen Errungenschaften der Paketvermittlung, Codecs und Protokolle inspiriert unser Bedürfnis, miteinander zu sprechen, weiterhin zu Innovationen.

A stylized illustration of developers working on apps.

Versuchen Sie VoIP!

Der folgende Code und ein Vonage Account sind alles, was Sie brauchen, um die Vonage Voice API zu nutzen und einen eingehenden Anruf über VoIP zu tätigen:

curl -X POST https://api.nexmo.com/v1/calls\
  -H "Authorization: Bearer $JWT"\
  -H "Content-Type: application/json"\
  -d '{"to":[{"type": "phone","number": "'$VOICE_TO_NUMBER'"}],
      "from": {"type": "phone","number": "'$VONAGE_VIRTUAL_NUMBER'"},
      "ncco": {"action": "talk",
                    "text": "This is a text to speech call from Vonage"}]}'

Möchten Sie eine vollständige Vonage Voice-Anwendung erstellen? Lernen Sie, wie man einen eingehenden Telefonanruf mit Python bearbeiten.

Um VoIP in Aktion zu sehen, sehen Sie sich die unten stehende Demo zum Aufbau eines automatischen Voice-Broadcasting-Systems an:

Zusammenfassung

VoIP ist die Technologie, die Sprachkommunikation über das Internet und nicht über herkömmliche Telefonnetzwerke ermöglicht. In diesem Beitrag haben wir die Funktionsweise von VoIP untersucht und die Entwicklung der Sprachübertragung von den frühen analogen Telefonen bis hin zu paketvermittelten digitalen Netzen nachgezeichnet. Wir haben uns die Kerntechnologien angesehen, die VoIP möglich machen, darunter Paketvermittlung, Codecs und IP-basierte Kommunikation, und wir haben gesehen, wie VoIP moderne Tools wie Videokonferenzen, Messaging-Apps und mobile Netzwerke unterstützt.

Schließlich zeigt der Beitrag, wie einfach es ist, VoIP mit der Vonage Voice API aus erster Hand zu erleben, indem er historische Zusammenhänge mit praktischen, realen Anwendungen verbindet.

Weitere Lektüre

  • Besuchen Sie den Vonage Entwickler YouTube-Kanal für weitere Demos und Tutorials

  • Sind Sie bereit zu bauen? Erfahren Sie mehr über die APIs von Vonage hier

  • Tutorials für alle unsere APIs in verschiedenen Sprachen finden Sie hier

Haben Sie eine Frage oder möchten Sie uns mitteilen, was Sie gerade bauen?

Bleiben Sie auf dem Laufenden und halten Sie sich über die neuesten Nachrichten, Tipps und Veranstaltungen für Entwickler auf dem Laufenden.

Teilen Sie:

https://a.storyblok.com/f/270183/400x400/2c4345217d/liz-acosta.jpeg
Liz AcostaAdvokat für Entwickler

Liz Acosta ist Developer Advocate bei Vonage. Ihr Karriereweg von der Filmstudentin über die Marketingspezialistin und die Ingenieurin zur Developer Advocate mag zwar unkonventionell erscheinen, ist aber ziemlich typisch für Developer Relations! Liz liebt Pizza, Pflanzen, Möpse und Python.