
Teilen Sie:
Benjamin Aronov ist ein Entwickler-Befürworter bei Vonage. Er ist ein bewährter Community Builder mit einem Hintergrund in Ruby on Rails. Benjamin genießt die Strände von Tel Aviv, das er sein Zuhause nennt. Von Tel Aviv aus kann er einige der besten Startup-Gründer der Welt treffen und von ihnen lernen. Außerhalb der Tech-Branche reist Benjamin gerne um die Welt auf der Suche nach dem perfekten Pain au Chocolat.
Klügere Voice-Agenten: KI-Wissen nutzen, um KI-Halluzinationen zu vermeiden
Lesedauer: 9 Minuten
Einführung: Generative KI für Bedienungsanleitungen
Erinnern Sie sich an das letzte Mal, als Sie eine Gebrauchsanweisung benutzt haben? Vielleicht war es für den Bau von Möbeln oder die Reparatur einer Mikrowelle, aber ich bin sicher, dass die Erfahrung Sie manchmal verwirrt hat. Bedienungsanleitungen sind frustrierend, weil man wissen muss, wie man sie nach genau dem Problem durchsucht, das man hat.
Das Tolle an Bedienungsanleitungen und ähnlichen FAQs ist jedoch, dass sie voller detaillierter und wertvoller Anweisungen für den Endverbraucher sind. Wenn es doch nur einen Weg gäbe, all diese Daten in ein angenehmes Benutzererlebnis zu verwandeln. Jetzt gibt es sie, mit AI Studio Voice-Agenten und der neuen Wissens-KI.
Stellen Sie sich vor, dass Ihre Kunden in der Lage sind, Fragen in ihren eigenen Worten zu stellen - ohne starre, vorprogrammierte Befehle - und sofortige, präzise Antworten zu erhalten. Mit dem Aufkommen der generativen KI ist die Erstellung solcher flexibler Voicebots einfacher denn je geworden. Mit Wissens-KIkönnen Sie einen Sprachroboter darauf trainieren, eine breite Palette menschlicher Fragen zu verstehen und seine Antworten präzise aus einer vordefinierten Wissensdatenbank zusammenzustellen. Das bedeutet, dass Ihre Kunden jedes Mal die richtigen Informationen erhalten, ohne dass es zu Störungen kommt.
In diesem Tutorial lernen Sie, wie Sie einen KI-FAQ-Sprachroboter erstellen, der die Website und das Schulungsmaterial eines Unternehmens nutzt, um jede Benutzerfrage flexibel und präzise zu beantworten.
Visual metaphor illustrating the mission to convert the Toddler 911 user manual into an interactive voice bot using Knowledge AI.
Unser Auftrag: Eine Gebrauchsanweisung in einen LLM-Agenten verwandeln
Unsere Aufgabe in diesem Artikel ist es, die Website und die Gebrauchsanweisung eines Unternehmens in einen VoiceBot zu verwandeln. So wie Sie vielleicht bei einem Unternehmen anrufen, um sich über grundlegende Informationen zu informieren, möchten Sie vielleicht auch Hilfe erhalten, z. B. wenn Sie einer Bedienungsanleitung für einen kaputten Kühlschrank oder Toaster folgen. Wir werden Knowledge AI einsetzen, um diese Interaktion zu automatisieren und Ihrem Unternehmen wertvolle Mitarbeiterzeit zu sparen.
Welches Benutzerhandbuch werden wir in einen KI-FAQ-Voicebot verwandeln? Nun, ich habe beschlossen, dass es Spaß machen würde, ein fiktives Unternehmen mit einer fiktiven Gebrauchsanweisung zu schaffen, die natürlich von LLMs erstellt wird! Wir werden einen AI Voice Agent für "Toddler 911!" erstellen. Dieses Unternehmen hilft Eltern, ihre Kinder zu "bedienen".
Sehen Sie sich die Toddler 911 Website und Gebrauchsanweisung. Wir werden später darauf zurückkommen, um es zu benutzen. Ich fand, dass die KI auf jeder Seite einige ziemlich tolle Firmengrafiken gemacht hat!
Voraussetzungen
Sie benötigen einen Vonage Developer Account
Sie müssen auf die Ressourcen in der Kleinkind 911! GitHub Repo
Vonage API-Konto
Um dieses Tutorial durchzuführen, benötigen Sie ein Vonage API-Konto. Wenn Sie noch keines haben, können Sie sich noch heute anmelden und mit einem kostenlosen Guthaben beginnen. Sobald Sie ein Konto haben, finden Sie Ihren API-Schlüssel und Ihr API-Geheimnis oben auf dem Vonage-API-Dashboard.
Wie man eine Wissensdatenbank erstellt
Bevor wir den Agenten aufbauen, müssen wir unsere Wissensdatenbank einrichten. Dies wird das Repository sein, aus dem die Antworten unserer Gen-KI stammen werden. Navigieren Sie zur Registerkarte Registerkarte Wissen AI im AI Studio Dashboard.
Mit Knowledge AI werden zwei neue Concepts eingeführt: Quellen und Indizes. Quellen sind einzelne Informationen und Daten. Eine Quelle kann zum Beispiel eine URL (Seite auf einer Website) oder eine Datei sein. Zusammengefasst bilden Quellen Indizes. Die gesamte Informationsmenge, aus der Agenten Antworten generieren können, wird als Index bezeichnet.
Beginnen wir mit der Erstellung unseres ersten Index.
Hinzufügen einer Quelle in Knowledge AI
Auf der Registerkarte Registerkarte Wissen AIklicken Sie auf Quelle hinzufügen. Daraufhin wird ein Formular zum Hinzufügen einer neuen Quelle geöffnet.
Add a new knowledge source in Vonage AI Studio by uploading a local file or providing a URL.
Sie werden feststellen, dass Quellen entweder eine lokale Datei (TXT, HTML oder PDF) oder eine öffentlich zugängliche URL sein können.
Fügen Sie die Links zur Unternehmenswebsite hinzu:
Landing Page URLName der Quelle: Toddler 911 Landing Page
Über uns URLName der Quelle: Toddler 911 Über uns
Produkte URLName der Quelle: Toddler 911 Produkte
Fügen Sie nun die Links für das Schulungsmaterial hinzu. Aber fügen Sie nicht fügen Sie noch nicht das 2024 Bathroom Training Update hinzu. Das fügen wir später hinzu.
Einen Snack zubereiten URL, Name der Quelle: Kleinkind 911 Training - Snack
Spielzeug aufräumen URL, Name der Quelle: Kleinkind 911 Training - Snack
Expanded view of the 'Toddler 911 FAQs' index showing all five selected content sources in Knowledge AI.
Da wir nun einige Quellen haben, können wir flexiblere Fragen stellen. Fahren wir mit der Erstellung eines Index fort.
Wie man einen Index erstellt
Klicken Sie auf die Registerkarte Index in der linken Leiste. Klicken Sie dann auf Index hinzufügen. Geben Sie Ihrem Index zunächst einen schönen Namen wie "Toddler 911 FAQs". Überprüfen Sie dann alle neu erstellten Quellen und klicken Sie auf Speichern & Beenden.
Source dashboard for AI Studio showing five uploaded website sources for the Toddler 911 project with total text size of 40.15KB.
Sie sollten nun einen Index sehen.
Screenshot of the AI Studio index dashboard showing a single index called 'Toddler 911 FAQs' connected to five content sources.
Wie man Indizes testet
Mit Knowledge AI können Sie Indizes testen, bevor Sie sie mit Agenten verknüpfen. Bewegen Sie dazu den Mauszeiger über einen Index und ein Play-Symbol wird angezeigt. Klicken Sie auf das Play-Symbol und es öffnet sich der Index-Tester.
Tooltip and UI showing that the 'Toddler 911 FAQs' index can be tested within the AI Studio interface.
Sie können nun beliebige Fragen stellen und der Testagent wird die Antworten aus Ihrem Index abrufen. Versuchen Sie, Fragen aus dem Unternehmen zu stellen, da LLMs in bestimmten Situationen einen zusätzlichen Kontext benötigen könnten. In einem Fall habe ich festgestellt, dass der LLM Schwierigkeiten hatte, komplexe Informationen zu unterscheiden. Auf der Seite Über uns heißt es zum Beispiel: "Gründerin & Kreativer Direktor von Imaginative Play: Dr. Seuss-auf der Seite "Was ist Toddler 911?", oder Fragen aus dem Schulungsmaterial wie "Wie bringe ich mein Kind dazu, sein Zimmer aufzuräumen?". Sie können auch versuchen, Fragen zu stellen, die nicht im Index enthalten sind, um sicherzustellen, dass das LLM nicht halluziniert. Versuchen Sie zum Beispiel zu fragen: "Wie bringe ich mein Kind dazu, die Toilette zu benutzen?".
Gründliche Tests sind wichtig, da LLMs in bestimmten Situationen einen zusätzlichen Kontext benötigen könnten. In einem Fall fiel es dem LLM schwer, komplexe Informationen zu erkennen. Auf der Seite Über uns heißt es zum Beispiel: "Gründer und kreativer Direktor von Imaginative Play: Dr. Seuss - Ein Elternteil und Unternehmer, der sich leidenschaftlich für die Schaffung von Lösungen einsetzt, die Familien stärken."
Als ich jedoch frage: "Wer ist der Begründer?", antwortet der LLM: "Ich konnte keine relevante Antwort finden". Als ich die Frage auf "Wer ist der Begründer und kreative Leiter des phantasievollen Spiels?" aktualisiere, antwortet der LLM: "Dr. Seuss".
Wie Sie Ihre Wissensdatenbank für neue Updates auf dem neuesten Stand halten
Wir haben gezeigt, dass das LLM noch nicht in der Lage ist, die Fragen der Teilnehmer zu beantworten. 2024 Badezimmer Training Update. Fügen wir das also als neue Quelle hinzu. Sie können es entweder als URL hinzufügen - Cloud-PDF oder die PDF-Datei herunterladen und als lokale Datei hochladen. Aktualisieren Sie Ihren Index, um die neue Quelle aufzunehmen.
Versuchen Sie nun den Tester erneut und stellen Sie unsere vorherige Frage: "Wie bringe ich mein Kind dazu, die Toilette zu benutzen?" Diesmal sollten Sie eine nette Antwort von dem Agenten erhalten.
Sie können Folgefragen stellen wie: "Was ist ein Beispiel für das Feiern von Erfolgen?" oder "Was wäre, wenn mein Kind einen Unfall hätte?". Der Test zielt darauf ab, Lücken und Problembereiche in Ihrem Index zu finden.
Test and refine your Knowledge AI responses by creating and querying an index based on uploaded sources.
Beachten Sie das kleine Buchsymbol in der KI-Antwort. Sie können darauf klicken, um zu sehen, welche Quellen verwendet wurden, um die Antwort zu generieren. Damit können Sie die Quellen für einen Index optimieren, um bessere Ergebnisse zu erzielen.
Da wir nun einen Index haben, den wir unserem generativen KI-Agenten zuweisen können, können wir unseren Agenten erstellen!
Wie man einen AI Studio VoiceBot erstellt
Zu Beginn müssen wir einen WhatsApp-Agenten erstellen. Sie können AI Studio über das Vonage Entwickler-Dashboard und folgen Sie dann den Anweisungen in der AI Studio Dokumentation. Es gibt drei wichtige Optionen für unseren Agenten, wählen Sie:
Art: Telefonie
Vorlage: Von Grund auf neu beginnen
Veranstaltung: Inbound
So verwenden Sie den Knoten Benutzereingaben sammeln
Begrüßen wir unsere Benutzer mit einer Willkommensnachricht. Verwenden wir die Sprechen Knoten. Da unser Firmenname als "Toddler Nine One One" anstelle von Ninehundred and eleven ausgesprochen wird, müssen wir die SSML say-as Tag verwenden:
<speak> Hello and welcome to Toddler <say-as interpret-as='digits'>911</say-as>!</speak>Als nächstes akzeptieren wir die Antwort des Benutzers mit einer Eingabe sammeln Knoten. Wir speichern die Antwort in einem Parameter namens Anfrage. Fügen Sie eine einfache Aufforderung hinzu: "Wie kann ich Ihnen helfen?". Fügen Sie außerdem 2 für "Anzahl der Wiederholungsversuche" und die Aufforderung "Tut mir leid, dass ich das nicht verstanden habe. Können Sie noch einmal fragen?".
Wenn nicht anders angegeben, verwenden alle Parameter in diesem Blog-Beitrag die Entität @sys.any. Für weitere Informationen über Entitäten (verschiedene Arten von Parametern) in AI Studio, lesen Sie bitte lesen Sie bitte die Dokumentation.
So verwenden Sie den AI Studio Q&A-Knoten
Da sich dieser Artikel auf Knowledge AI konzentriert, werden wir uns nicht mit der Klassifizierung unseres User Intent oder der Erstellung mehrerer Flows befassen. Wir können direkt mit dem Q&A-Knoten aus dem Konversationsbereich fortfahren.
Animated walkthrough showing how to add a FAQ node in AI Studio that uses Knowledge AI to answer user questions.
Die Konfiguration unseres Knotens wird sein:
Index: Toddler 911 FAQs (oder Ihr Indexname)
Benutzer-Eingabeparameter: Anfrage
Antwort-Parameter: ai_response
Wartezeit: 2 Sekunden
Die maximale Zeit, die AI Studio auf eine Antwort warten wird. Wenn die Antwortzeit 2 Sekunden überschreitet, wird der Exit Path Failed ausgelöst.
Der Umgang mit generativen KI-Antworten
Nun, da wir unseren Knotenpunkt zum Abrufen von FAQ-Antworten eingerichtet haben, können wir sie an unsere Benutzer senden! Der gesamte Ablauf wird wie folgt aussehen:
Overview of the full FAQ conversation flow in AI Studio, including AI-generated responses, fallback handling, and repeat prompts.
Das sieht vielleicht etwas kompliziert aus, aber das meiste davon ist Fehlerbehandlung und Verbesserung der Benutzerfreundlichkeit. Der FAQ-Knoten erzeugt 3 Exit-Points: $ai_response (Erfolg), Don't Know und Failed. Diese Exit-Points bieten uns eine Fehlerbehandlung in Abhängigkeit von dem Ergebnis, das wir zurückbekommen.
Um es auszubauen:
Für $ai_Antwort Exit-Punkt: Verwenden Sie einen Speak-Knoten und lassen Sie ihn einfach die $ai_Antwort Parameter. Verbinden Sie unsere $ai_response Exit-Punkt mit diesem Knoten.
Für Nicht wissen Ausstiegspunkt: Verwenden Sie einen Speak-Knoten und lassen Sie ihn eine Fehlermeldung senden. So etwas wie Sorry, ich weiß nicht, wie ich das beantworten soll. Versuchen wir es mit einer anderen Frage." Verbinden Sie unsere Nicht wissen Exit-Punkt mit diesem Knoten.
Für Gescheiterte Exit-Punkt: Verwenden Sie einen Speak-Knoten und lassen Sie ihn etwas sagen wie: "Sorry, etwas ist schief gelaufen. Versuchen wir es noch einmal.". Verbinden Sie unsere Gescheiterte Exit-Punkt mit diesem Knoten.
Schleife für mehrere Fragen
Wir möchten dem Benutzer die Möglichkeit geben, unserem Voicebot mehrere Fragen zu stellen.
Um es auszubauen:
Erstellen Sie einen Collect Input-Knoten namens Collect Repeat, der einen neuen Parameter namens Wiederholung. Genau wie zuvor können wir eine Eingabeaufforderung erstellen: "Möchten Sie eine weitere Frage stellen?". Wir geben auch 2 Wiederholungsversuche und die Aufforderung: "Sorry, das habe ich nicht verstanden. Bitte versuchen Sie es noch einmal."
Verwenden Sie einen Bedingungsknoten der eine Prüfung gegen wiederholen. Erstellen Sie eine Bedingung, um zu prüfen, ob Wiederholung gleich ja ist, und eine weitere, um zu prüfen, ob Wiederholung gleich nein ist.
Verbinden Sie die wahre Bedingung wieder mit dem Knoten Collect Inquiry, dem ersten von uns verwendeten Collect Input-Knoten, der den Wert für Anfrage
Verbinden Sie die falsche Bedingung mit einem Speak-Node-Formular, das dem Benutzer für die Nutzung des Agenten danken wird:
<speak> Thank you for using Toddler <say-as interpret-as='digits'>911</say-as>!</speak>5. Verbinden Sie den Knoten der Dankesnachricht mit einem Knoten Anruf beenden Knoten.
Schlussfolgerung
👏Geben Sie sich selbst einen Applaus! Du hast es geschafft! Sie haben Ihren ersten Generative AI Voice-Agenten erstellt. Testen wir jetzt mit dem eingebauten Tester.
Haben Sie den Telefonanruf erhalten? Konntest du Fragen zu den verschiedenen Funktionen von Toddler 911! stellen? Haben Sie etwas über Dr. Seuss und Big Bird erfahren? Wie würden Sie den Agenten verbessern, nachdem Sie ihn nun zum Laufen gebracht haben? Vielleicht könnten wir separate Abläufe für die FAQs des Unternehmens und die Gebrauchsanweisung erstellen, indem wir Absichten und Klassifizierung.
Wie auch immer sich Ihr Agent verhält, lassen Sie es uns wissen! Treten Sie der Vonage Entwickler-Community Slack und erzählen Sie mir, was Sie im #ai-studio Kanal. Oder finden Sie uns auf X, früher bekannt als Twitter.
Teilen Sie:
Benjamin Aronov ist ein Entwickler-Befürworter bei Vonage. Er ist ein bewährter Community Builder mit einem Hintergrund in Ruby on Rails. Benjamin genießt die Strände von Tel Aviv, das er sein Zuhause nennt. Von Tel Aviv aus kann er einige der besten Startup-Gründer der Welt treffen und von ihnen lernen. Außerhalb der Tech-Branche reist Benjamin gerne um die Welt auf der Suche nach dem perfekten Pain au Chocolat.
