
Partager:
Karl est un défenseur des développeurs pour Vonage, qui se concentre sur la maintenance de nos SDK de serveur Ruby et sur l'amélioration de l'expérience des développeurs pour notre communauté. Il aime apprendre, fabriquer des objets, partager ses connaissances et tout ce qui a trait à la technologie du web.
Choisissez votre propre aventure avec AI Studio de Vonage
Temps de lecture : 12 minutes
Vonage AI Studio est une plateforme sans code/à faible code permettant de créer des flux conversationnels sur différents canaux de communication. Il utilise une interface glisser-déposer pour connecter des modules et des actions dans des flux complexes qui peuvent automatiser des processus et se connecter à de nombreux services différents. Les flux conversationnels d'AI Studio sont construits sur les algorithmes propriétaires de compréhension du langage naturel (NLU) de Vonage AI pour permettre des interactions conversationnelles où les utilisateurs peuvent communiquer en " langage naturel " sans être obligés d'utiliser certains mots-clés, de choisir parmi une liste d'options ou de formuler leurs questions d'une manière spécifique.
AI Studio est disponible depuis un certain temps dans la version Developer Preview. Il est depuis peu disponible pour une utilisation générale, ce qui est très excitant, et j'ai donc voulu souligner ce fait en écrivant sur certaines de ses capacités. J'aurais pu adopter plusieurs approches pour y parvenir, comme la construction d'un flux de type service client "réel". Pour cet article, cependant, j'ai voulu essayer quelque chose d'un peu différent et explorer certaines des fonctionnalités d'AI Studio d'une manière amusante et intéressante.
Dans ma jeunesse, j'adorais lire des livres intitulés "Choisissez votre propre aventure". Ces livres, plutôt que de suivre une structure narrative linéaire, vous permettaient de prendre des décisions à certains moments de l'histoire, puis de tourner à la page appropriée du livre en fonction de votre décision. J'ai pensé qu'il serait intéressant de construire ma propre histoire "choisissez votre propre aventure" avec AI Studio.
'The Warlock of Firetop Mountain' book cover
Agents
Dans l'interface d'AI Studio, chaque flux de conversation est créé en tant qu'"agent". Différents types d'agents sont disponibles en fonction de vos cas d'utilisation, tels que Voice, SMS, WhatsApp et HTTP.
AI Studio screenshot: Agent Creation
Pour mon histoire " choisissez votre propre aventure ", j'ai décidé de créer un agent Voice. Les agents Voice d'AI Studio combinent la reconnaissance vocale automatisée (ASR) propriétaire de Vonage avec ses capacités NLU pour fournir des interactions vocales naturalistes.
Lors de la création d'un agent, plusieurs paramètres doivent être définis, tels que le nom de l'agent, le pays, la langue et le fuseau horaire.
Pour les agents Voice, vous devez en outre choisir la voix que votre agent utilisera pour "parler", en utilisant les capacités de synthèse vocale d'AI Studio. Toutefois, lorsque vous créez les différents éléments de votre flux conversationnel, vous avez également la possibilité d'utiliser des enregistrements audio.
AI Studio screenshot: Agent Set up
En savoir plus sur Les agents.
Flux
Les flux sont des combinaisons de différents nœuds de conversation connectés entre eux sur le canevas drag-and-drop d'AI Studio.
AI Studio screenshot: Intro flow
Vous pouvez placer tous les nœuds de votre flux entier sur le même canevas. Cependant, pour les flux importants et complexes, il peut être plus facile de les diviser en sous-flux. C'est l'approche que j'ai adoptée pour mon histoire, qui comporte quatre parties principales. Le flux principal plante le décor de l'aventure. À la fin de ce flux, l'histoire arrive à une "bifurcation" et l'aventurier doit choisir le chemin à suivre. C'est là que j'ai créé quelques flux secondaires, la bifurcation menant soit à un flux de rivière, soit à un flux de forêt. Ces deux sous-flux convergent à nouveau pour la partie finale de l'aventure dans le flux du château.
AI Studio screenshot: sub-flows
Vous créez et gérez des sous-flux dans l'onglet Flux du menu AI Studio.
AI Studio screenshot: Flows tab of the menu
Dans un scénario réel, vous pouvez créer des sous-flux pour les différentes fonctions commerciales auxquelles un client peut vouloir accéder, telles que les ventes, l'assistance, la facturation, etc.
En savoir plus sur Flux.
Nœuds de conversation
Comme indiqué précédemment, les flux sont des combinaisons de différents nœuds de conversation connectés entre eux. Il existe différents types de nœuds de conversation, qui remplissent chacun une fonction spécifique au sein du flux conversationnel global. Examinons-en quelques-uns.
AI Studio screenshot: Conversation Nodes tab
Le nœud de départ
Toutes les histoires ont un début, et tous les flux de conversation dans AI Studio ont besoin d'un nœud de départ. En plus de servir de point de départ à votre flux, les nœuds de départ vous permettent de définir certaines options pour l'ensemble du flux. Les options exactes que vous pouvez choisir dépendent du type de flux que vous souhaitez créer. Pour un flux Voice Call, vous pouvez choisir d'enregistrer l'appel et de configurer un webhook qui répond à un événement de déconnexion d'appel. Aucun de ces éléments n'est nécessaire pour mon récit d'aventure, c'est pourquoi j'ai utilisé le nœud uniquement comme point de départ.
AI Studio screenshot: Start Node setup
Nœud de parole
Le nœud Speak a pour but de fournir des informations à l'appelant. Lors de la configuration du nœud, vous avez la possibilité de saisir du texte, qui sera lu avec la Voice que vous avez définie grâce aux fonctionnalités de synthèse vocale d'AI Studio, ou d'enregistrer de la parole.
Comme mon "flux d'aventure" vise avant tout à raconter une histoire passionnante, je me suis beaucoup appuyé sur ce nœud à plusieurs moments du flux pour la mise en scène et la description de diverses parties du récit.
AI Studio screenshot: Speak Node
En savoir plus sur le nœud Speak.
Collecter le nœud d'entrée
Il s'agit de l'un des principaux types de nœuds disponibles pour la création d'un flux conversationnel. Les flux conversationnels d'AI Studio sont essentiellement des interactions entre deux parties : l'utilisateur et l'agent d'AI. Dans toute interaction, les deux parties doivent pouvoir contribuer, et c'est là que le nœud Collect Input entre en jeu.
Ce nœud permet essentiellement de créer un paramètre et de collecter des données auprès de l'utilisateur afin de définir la valeur de ce paramètre. Vous définissez un nom de paramètre et une invite, qui est essentiellement une question ou une déclaration visant à obtenir une réponse de l'utilisateur. Vous pouvez également autoriser un certain nombre de tentatives pour répondre à la question et avoir la possibilité d'utiliser une invite de relance spécifique.
Dans mon histoire, j'ai utilisé ce nœud à plusieurs endroits où le protagoniste doit prendre certaines décisions, comme accepter ou non la quête, choisir l'embranchement à prendre, explorer ou non un bâtiment abandonné, etc. Il existe de nombreux scénarios dans le monde réel où vous pourriez vouloir ou devoir recueillir des informations auprès d'un utilisateur, qu'il s'agisse de lui demander pourquoi il contacte votre entreprise ou d'obtenir des informations spécifiques telles qu'une commande, un numéro de compte ou certaines coordonnées.
AI Studio screenshot: Collect Input Node
En savoir plus sur le nœud Nœud de collecte des données d'entrée.
Lorsque vous recueillez des données dans le cadre d'un flux de conversation représentant une sorte de choix de l'utilisateur, c'est généralement parce que vous souhaitez orienter le flux d'une manière particulière en réponse à ce choix. La manière dont un agent AI Studio évalue les données de l'utilisateur et y répond est déterminée à l'aide de nœuds de conditions ou de classification, et c'est là que se produit une grande partie de la "magie" d'AI Studio. L'entrée de l'utilisateur est définie comme un paramètre, qui est ensuite utilisé dans le contexte des nœuds de conditions et de classification.
Nœud de classification
Le nœud Classification est un moyen de déterminer ce qu'il faut faire en réponse à une entrée utilisateur. Dans votre flux, il suivra généralement un nœud Collect Input. Les nœuds de classification sont formidables pour les flux de conversation naturels car, au lieu de contraindre les choix de l'utilisateur à un ensemble très spécifique de valeurs (pensez aux SVI avec des options telles que "Dites '1' pour les ventes, '2' pour l'assistance..."), ils permettent à l'utilisateur de s'exprimer de manière naturelle.), ils permettent à l'utilisateur de s'exprimer de manière naturelle, par exemple en disant "support", "support client", "le service de support client" ou même "j'ai besoin d'aide". Le nœud de classification a pour tâche de déterminer ce qu'il faut faire en fonction des données fournies par l'utilisateur. Pour ce faire, il utilise des intentions.
Intentions
L'une des façons d'envisager les intentions est de les considérer comme une attente générale de ce qu'un utilisateur pourrait dire en réponse à une certaine question ou situation. Chaque intention englobe un cas d'utilisation ou une action particulière et se compose de plusieurs expressions d'utilisateur ou de choses qu'un utilisateur pourrait dire pour suggérer cette action ou ce cas d'utilisation.
Dans mon récit d'aventure, j'ai beaucoup utilisé les nœuds de classification et les intentions pour les différents points de décision qui surviennent au cours de la narration. Par exemple, l'aventurier doit décider d'explorer ou non un bâtiment abandonné. Dans le nœud de classification correspondant à cette décision, j'utilise deux intentions : l'une d'explorer l'habitation et l'autre de rester sur la route.
AI Studio screenshot: Classification Node
Ce nœud contient les différentes intentions qui couvrent les réponses potentielles de l'utilisateur à la situation, et chaque intention contient diverses expressions qui peuvent suggérer cette intention.
AI Studio screenshot: Intent setup
En savoir plus sur Les nœuds de classification et les Intents.
Conditions Nœud
Les nœuds de conditions sont similaires aux nœuds de classification en termes d'objectif - ils déterminent un plan d'action basé sur les données de l'utilisateur - mais ils utilisent un mécanisme sous-jacent différent pour ce faire : les entités.
Entités
Une entité est essentiellement une liste de valeurs et de leurs synonymes. Elles sont utiles dans les situations où un utilisateur doit choisir quelque chose parmi un groupe d'éléments spécifiques, mais où il existe des mots différents pour chacun d'entre eux. Par exemple, si quelqu'un indique la taille de son t-shirt, il peut dire "grand" ou "large" pour signifier la même chose, ou encore "extra-large" et "XL" qui sont synonymes.
Pour le déroulement de mon aventure, j'ai surtout utilisé des nœuds de classification et des intentions plutôt que des nœuds de conditions et des entités, car les situations dans lesquelles se trouve mon aventurier sont plus ouvertes et mieux servies par les intentions. J'ai cependant utilisé les nœuds de Conditions à quelques endroits où cela avait du sens. L'un d'entre eux consistait à déterminer les options disponibles pour attaquer le dragon.
AI Studio screenshot: Conditions Node
La logique de ce nœud est basée sur des conditions déterminées par la valeur de certains paramètres pour les objets que l'utilisateur a ramassés au cours de l'aventure.
AI Studio screenshot: Conditions Node setup
AI Studio screenshot: Entity
En savoir plus sur Nœuds de conditions et les Entités.
Autres types de nœuds
Les nœuds Speak, Collect Input, Conditions et Classification sont les " personnages principaux " des flux conversationnels d'AI Studio et la majorité des flux seront construits principalement à l'aide de ces quatre types de nœuds. Toutefois, dans certaines situations, vous pouvez avoir besoin de fonctionnalités supplémentaires qui ne peuvent pas être fournies par ces nœuds. Heureusement, AI Studio vous fournit une solide équipe de soutien composée de nœuds plus spécialisés. J'ai utilisé un certain nombre d'entre eux dans mon flux, alors découvrons-les !
Nœud de paramétrage
Nous avons déjà rencontré brièvement des paramètres dans le contexte des nœuds Collect Input. Dans ces nœuds, la valeur du paramètre a été fixée en fonction d'une entrée de l'utilisateur. Cependant, dans certaines situations, il est possible que vous souhaitiez définir une valeur spécifique dans un paramètre.
Dans mon flux d'aventure, il y a des situations où le protagoniste peut ramasser des objets pour l'aider dans sa quête. Pour ces situations, j'ai utilisé le nœud Set Parameter pour enregistrer le fait que l'objet a été ramassé.
AI Studio screenshot: Set Parameter Node
En savoir plus sur Nœuds de paramètres.
Nœud d'envoi de SMS
Le nœud SMS est utilisé pour envoyer un message SMS à un utilisateur. Vous devez lui fournir un numéro (y compris l'indicatif de pays) et un message à envoyer.
Dans le monde réel, cela peut être utile pour envoyer des liens vers des pages d'aide ou de la documentation en réponse à certaines requêtes.
Dans mon histoire, j'ai utilisé ce nœud à un moment où l'aventurier a besoin d'un mot de passe secret pour entrer dans le château. Il reçoit le mot de passe par SMS, qu'il doit ensuite prononcer en réponse à une invite de saisie pour ouvrir les portes du château.
AI Studio screenshot: Send SMS Node
Il existe également un nœud Envoyer un e-mail, qui a une fonction similaire.
En savoir plus sur le nœud Nœud d'envoi de SMS et le nœud nœud d'envoi d'e-mail.
Nœud de code personnalisé
AI Studio est essentiellement une solution sans code, qui permet à quiconque de mettre en place des flux de conversation puissants et complets sans aucune connaissance en programmation, en utilisant l'interface intuitive de type glisser-déposer. Toutefois, dans certaines situations, vous pouvez souhaiter définir ou manipuler la valeur d'un paramètre en fonction d'une logique spécifique et personnalisée. C'est là que le nœud de code personnalisé entre en jeu !
Le nœud Code personnalisé vous permet d'utiliser du code JavaScript pour produire une valeur particulière, qui est ensuite définie comme valeur d'un paramètre de sortie pouvant être utilisé ailleurs dans votre flux.
J'ai utilisé le nœud Custom Code à plusieurs endroits dans mon récit d'aventure. Je voulais notamment supprimer les zéros en tête (le cas échéant) du numéro de téléphone mobile et du code pays fournis par l'utilisateur, puis les combiner en une seule valeur et l'affecter à un paramètre de sortie, que je pouvais ensuite utiliser dans le nœud Send SMS pour envoyer le mot de passe secret.
AI Studio screenshot: Custom Code Node
Une autre utilisation du nœud Custom Code dans mon flux était d'imiter un jet de dé pendant une bataille avec le dragon.
AI Studio screenshot: Custom Code Node
Il existe de nombreux autres cas d'utilisation possibles pour le nœud Code personnalisé.
En savoir plus sur le nœud nœud de code personnalisé.
Nœud de commutation de contexte
Le nœud Context Switch fait exactement ce que son nom suggère : il fait passer le contexte actuel à un contexte complètement différent. Un cas d'utilisation réel pourrait être celui d'un client qui passe par un flux automatisé pour suivre une commande, ou peut-être mettre à jour certains détails de son Account, mais à n'importe quel moment de ces flux structurés, il peut dire "Je veux parler à quelqu'un" et le flux peut être interrompu et l'appel du client acheminé à la place vers un agent.
Comme le nœud de classification, le nœud de changement de contexte fonctionne sur la base des intentions.
Dans mon flux, j'ai imaginé une situation où voyager à travers des forêts effrayantes, explorer des bâtiments abandonnés ou combattre des dragons pourrait devenir un peu trop pesant, alors à tout moment, l'aventurier peut choisir de s'enfuir et de retourner à la sécurité du village !
AI Studio screenshot: Context Switch Node
En savoir plus sur le nœud nœud de commutation de contexte.
Nœud de fin d'appel
Toutes les histoires et tous les appels ont une fin à un moment donné. L'objectif du nœud de fin d'appel est de mettre fin à l'appel. Pour un flux d'appels Voice, vous devrez placer un nœud de fin d'appel à la fin de chaque " branche " de votre flux.
En savoir plus sur le nœud Nœud d'appel.
Vous voulez partir à l'aventure dans des forêts enchantées, rencontrer des fées et combattre des dragons ? Alors, testez mon Voice Studio en appelant l'un des numéros suivants :
ROYAUME-UNI : +44 (0)7418 371898
ÉTATS-UNIS : +1 (0)201 464 3585
AUS : +61 (0)485828854
Amusez-vous bien et bonne chance dans votre aventure !
Peut-être aimeriez-vous créer votre propre flux conversationnel avec Vonage AI Studio. C'est très facile de commencer ! Ouvrez une session dans le tableau de bord de Vonage et accédez à la section AI Studio.
Il existe également plusieurs nœuds et intégrations que je n'ai pas utilisés dans mon flux, et dont je n'ai donc pas parlé dans cet article. Pour plus d'informations sur ces éléments et sur l'utilisation d'AI Studio en général, consultez la documentation d'AI Studio.
La participation de la communauté est toujours la bienvenue. N'hésitez pas à nous rejoindre sur le Communauté Vonage Slack ou envoyez-nous un message sur sur Twitter.
Partager:
Karl est un défenseur des développeurs pour Vonage, qui se concentre sur la maintenance de nos SDK de serveur Ruby et sur l'amélioration de l'expérience des développeurs pour notre communauté. Il aime apprendre, fabriquer des objets, partager ses connaissances et tout ce qui a trait à la technologie du web.