Vapi Voice AI : Analyse complète et points clés

Mis à jour : 23/12/2025

Les conversations avec l’IA sont partout en ce moment. La technologie a beaucoup de potentiel, mais elle n’est pas parfaite. Les voicebots peuvent avoir du retard, avoir du mal à gérer les interruptions ou même complètement perdre le fil au milieu d’une conversation.

Vapi (aussi appelé Vapi AI) essaie de changer ça. Il donne plus de contrôle sur le fonctionnement des assistants vocaux pour aider à résoudre certains des plus gros points faibles. Tu n’as même pas besoin d’être développeur pour l’utiliser. Ses fonctionnalités intuitives permettent à tout le monde de créer et gérer des assistants vocaux sans grande expertise technique.

D’après mon expérience, Vapi améliore les conversations à bien des niveaux. Mais il a aussi ses propres défis. Dans cet avis sur Vapi, je vais te présenter mon test pratique. On va voir ensemble la configuration, les fonctionnalités clés et les performances globales. Comme ça, tu pourras décider si Vapi est adapté à tes besoins.

Table des matières

Qu'est-ce que Vapi ?

Vapi est une plateforme d’IA vocale centrée sur les développeurs, conçue pour t’aider à créer, tester et déployer des assistants vocaux sophistiqués. Elle propose une suite complète d’outils, dont une API vocale puissante (c’est de là que vient le nom Vapi), un tableau de bord intuitif et une multitude d’options de personnalisation. Avec Vapi, tu peux lancer rapidement des applications vocales qui simulent le déroulement naturel des conversations humaines.

Même si Vapi est avant tout présenté comme un outil pour les développeurs, il propose aussi une interface utilisateur (UI) sans code très complète. Cela permet aux marketeurs et aux personnes non techniques de créer des assistants vocaux IA pleinement fonctionnels sans solliciter les développeurs de l’équipe.

Voici quelques fonctionnalités qui font que Vapi se démarque dans le domaine des voicebots :

Des temps de réponse plus rapides : Grâce à des optimisations de latence, comme un traitement amélioré, un stockage intelligent des données (caching) et un streaming audio fluide, les assistants Vapi peuvent être plus réactifs que beaucoup d’autres voicebots du marché.
Un rythme de conversation naturel : Tes assistants peuvent maintenant faire une pause quand tu les interromps, tout en étant assez polis pour ne pas te couper la parole quand tu parles. C’est une vraie avancée par rapport à des concurrents comme Synthflow.
Scalabilité inégalée : Vapi est capable de gérer plus d’1 million d’appels simultanés, ce qui le rend idéal pour des entreprises de toutes tailles.
Support de plus de 100 langues : Vapi te permet de créer des agents vocaux qui parlent la langue de tes utilisateurs, comme l’anglais, l’espagnol, le français, l’allemand, l’hindi, le portugais, et bien d’autres.
Fonctions avancées pour les développeurs : Tu peux booster ton assistant vocal avec des outils personnalisés pour gérer des tâches comme la prise de rendez-vous, la recherche d’informations ou le remplissage de formulaires.
Intégration native avec Make : Tu peux connecter tes scénarios Créer et les déclencher pendant les conversations vocales sur Vapi.

Comment fonctionne Vapi ?

Avant de créer notre premier assistant vocal sur Vapi, voyons comment la plateforme fonctionne et ce qui se passe en coulisses.

L’atout principal de Vapi, c’est la façon dont il connecte et orchestre trois types de modèles IA différents pour permettre des conversations efficaces et naturelles :

Écouter – Module de transcription ou reconnaissance vocale (STT). Quand tu parles à ton appareil, l’audio est enregistré puis transcrit par le modèle.
Intelligence – Modèle IA ou Large Language Model (LLM). Le texte transcrit est ensuite inséré dans un prompt et traité par un LLM. Le LLM est le cœur de l’intelligence qui simule une vraie personne.
Parler – Synthèse vocale. Le LLM génère du texte (les réponses du prompt) qui est ensuite restitué à ton appareil sous forme audio.

Vapi's platform orchestrates three different AI models: speech to text, intelligence, and text to speech.

Source.

Cette configuration n’est pas propre à Vapi. C’est une infrastructure courante pour toutes les plateformes vocales IA. Cependant, deux éléments distinguent Vapi : son large support des modèles IA et ses modèles d’orchestration.

Support illimité des modèles IA

Contrairement à d’autres plateformes qui ne prennent en charge qu’une poignée de modèles, dans Vapi, tu peux changer et combiner des modèles et outils IA avec d’autres comme ChatGPT, Claude, ElevenLabs, et bien plus. Vapi prend tout en charge, y compris la possibilité d’utiliser tes propres modèles personnalisés. Ça te permet d’utiliser ce qui correspond le mieux à tes besoins ou à ton projet.

Le meilleur dans tout ça, c’est que tu n’as pas besoin de gérer ou connecter tes comptes externes. Vapi prend en charge la plupart des modèles nativement. Par exemple, si tu veux passer d’OpenAI (le modèle LLM par défaut) à Claude, tu peux connecter tes clés API Claude, mais ce n’est pas obligatoire. En changeant le modèle dans l’interface Vapi, la plateforme passera à Claude en interne.

Modèles d’orchestration

Les modèles d’orchestration sont des modules IA qui s’ajoutent aux fonctionnalités de base pour rendre les conversations plus naturelles et engageantes. La plateforme Vapi est unique dans sa capacité à améliorer et affiner les modèles IA standard grâce à ces modules.

Les modèles sont :

Endpointing : L’endpointing intervient quand tu arrêtes de parler à ton assistant vocal. Au lieu d’utiliser un délai d’inactivité (la méthode classique), Vapi utilise un modèle audio-texte fusionné pour détecter quand tu as fini de parler. Ça aide à réduire la latence et à rendre la conversation plus naturelle.
Interruptions : La capacité à reconnaître quand tu essaies d’interrompre, ce qui permet à l’assistant de s’arrêter et d’écouter. Beaucoup d’assistants vocaux IA n’ont pas cette fonction, ce qui peut rendre la conversation moins fluide.
Filtrage du bruit de fond et de la voix : Vapi améliore la clarté des appels en filtrant les bruits de fond et en se concentrant sur la voix de l’interlocuteur. Ça permet une transcription plus précise et une conversation plus fluide, même dans un environnement bruyant.
Backchanneling : Une façon plus avancée pour l’assistant de comprendre si des petits mots (ou réponses de type backchannel) comme « Ah », « Oui », « Oh », etc., servent à déclencher une action ou sont juste là pour meubler. Tu peux même écrire un prompt pour que ton bot utilise ce genre de mots afin de rendre sa voix plus naturelle.
Détection des émotions : Vapi peut analyser le ton de la voix pour détecter des émotions comme la joie, la frustration ou l’urgence. Ça permet à l’assistant de répondre de façon plus empathique et adaptée au contexte.

vapi orchestration models include endpointing, interruptions, background noise and voice filtering, backchanneling, emotion detection. Image shows how these models are connected, what they do, and the models/providers associated with them

L'objectif principal de ces modèles, en plus de rendre tes assistants plus crédibles, est d'améliorer la latence du voice-to-voice. "Voice-to-voice" désigne le temps entre la fin de la parole d'un utilisateur et la diffusion du premier morceau de réponse de l'assistant IA sur l'appareil de l'utilisateur. L'objectif de Vapi est d'obtenir un flux voice-to-voice de 500 à 700 ms, voire moins.

Je n'ai pas chronométré les temps de réponse de mes assistants, mais la différence saute aux yeux par rapport à d'autres applis comme Synthflow. Les assistants de Vapi répondaient nettement plus vite et paraissaient plus réactifs que des solutions similaires. Par contre, il y a un bémol, qu'on va explorer dans la partie test des assistants.

Maintenant que c'est dit, on va créer notre premier assistant Vapi et voir comment il s'en sort.

Bien démarrer avec Vapi

Le produit principal de Vapi, ce sont ses assistants, des assistants vocaux automatisés (ou bots) capables de passer ou de recevoir des appels. Pour cet avis, on va se concentrer sur l'interface utilisateur plutôt que sur l'utilisation de kits de développement logiciels (SDK).

1. Créer ton premier assistant IA Vapi

Sur Vapi, tu ne paies que les minutes que tu utilises. Donc, comme avec Synthflow, tu peux créer un nombre illimité d'assistants. Par contre, si tu veux utiliser l'assistant IA via un téléphone, tu dois acheter un numéro de téléphone séparé pour chaque assistant.

La première étape consiste à choisir si tu veux créer un assistant à partir de zéro ou utiliser l'un des modèles existants. Il n'y a que quatre modèles proposés :

Prise de rendez-vous : Un assistant entrant pour les cabinets dentaires qui gère la planification, répond aux questions et donne des infos sur les services.
Support client : Un modèle équilibré qui combine empathie et expertise technique pour un support efficace.
Q/R entrant : Pensé pour une agence de design d'intérieur afin d'offrir un support produit détaillé et de l'aide au dépannage.
PNJ de jeu (personnage non-joueur) : Un assistant dans le jeu, Elenya, qui donne des conseils, raconte l'univers et partage des infos sur le monde du jeu.

Si tu débutes avec la création de prompts pour chatbot, créer ton premier assistant vocal sur Vapi peut être assez compliqué. En plus, tous les modèles sont faits pour des assistants entrants, donc il n’y a rien sur quoi s’appuyer si tu veux créer un assistant sortant (prospection à froid).

2. Configurer ton assistant

J’ai commencé avec Mary, l’assistante qui prend les rendez-vous. L’écran de configuration est vaguement organisé en trois grandes zones, en partant du haut : un aperçu du coût et de la latence, des onglets pour passer d’une configuration principale de l’assistant à l’autre (Modèle, Transcripteur, Voix, etc.), et la vraie zone de configuration avec des formulaires pour saisir des prompts, changer de fournisseur, etc.

Détail des coûts et de la latence

Vapi met clairement l’accent sur la rapidité et la réactivité de ses assistants tout en garantissant une tarification claire et transparente. On le voit dès la première étape de la configuration de l’assistant : un détail des coûts et de la latence s’affiche et évolue en fonction des modèles testés. Garde en tête qu’il ne s’agit que d’estimations.

Les modèles que tu choisis pour ton assistant peuvent vraiment faire la différence, autant sur les coûts que sur la latence. Dans le premier exemple ci-dessous, j’ai sélectionné le modèle d’aperçu en temps réel GPT-4o d’OpenAI, ce qui a donné un coût de 0,22 $ par minute avec une latence de 700 ms. C’est le niveau recommandé par Vapi.

En revanche, passer au modèle d’aperçu o1 a fait grimper la latence à 8000 ms (8 secondes), ce qui est beaucoup trop lent pour une conversation naturelle. En plus des modèles, le « mode » – web ou téléphone (Twilio ou Vonage) – peut aussi influencer la latence et les coûts. Suivre ces différents éléments est essentiel pour garder le bon équilibre entre prix et performance quand tu conçois tes assistants.

Vapi cost breakdown for GPT 4o shows a cost of $0.22/min and a latency of 700 ms

Vapi cost breakdown for GPT o1 preview model shows a cost of $0.19/minute and 8000 ms latency

Modèle, transcripteur, voix et autres

Ensuite, tu peux choisir l’aspect de ton assistant que tu veux configurer. Les trois premières options - Modèle, transcripteur et voix - sont essentielles pour configurer ton assistant. Les trois autres - fonctions, avancé et analyse - offrent des fonctionnalités plus avancées dont tu n’auras peut-être pas besoin pour ton premier assistant.

Configuring Vapi voice assistant Model, Transcriber, and Voice

En laissant de côté notre assistante Mary, je vais repartir de zéro et créer Jade, ma propre assistante inbound pour gérer la prise de commandes de notre restaurant chinois, The Golden Wok.

Les étapes à suivre :

Créer l’assistante : On va créer une assistante et lui donner des instructions pour gérer les appels de notre restaurant.
Obtenir un numéro de téléphone : On peut soit utiliser un numéro existant, soit en acheter un directement via Vapi.
Lier l’assistante : On va associer l’assistante au numéro de téléphone pour qu’elle puisse commencer à répondre aux appels.
Passer un appel et tester l’assistante : Enfin, on va appeler le numéro et interagir avec notre assistante.

3. Choisir le modèle de ton assistante (LLM)

Dans le premier chapitre de notre test, on a parlé des trois modules principaux de l’infrastructure : Écouter, Intelligence et Parler. Ce sont les éléments clés que tu vas configurer dans les trois premiers onglets de ton assistante :

Modèle (Intelligence) : Le modèle IA (LLM) qui analyse et génère les réponses.
Transcripteur (Écouter) : Transforme le langage parlé en texte.
Voix (Parler) : Convertit les réponses textuelles en une voix naturelle.

On va commencer par le premier, le Modèle, où tu peux choisir le LLM et rédiger ton prompt.

Le modèle par défaut est GPT 3.5 turbo d’OpenAI, qui est un excellent point de départ car il offre une bonne rapidité et une expérience d’interaction plutôt fluide. Mais tu peux choisir nativement parmi plus de 35 modèles de 16 fournisseurs différents.

Même si cette multitude d’options est géniale pour ceux qui cherchent une personnalisation avancée et de la flexibilité, ça peut aussi être intimidant et provoquer une hésitation chez ceux qui ne connaissent pas bien les modèles IA.

À ce niveau-là, la plateforme est plus adaptée aux développeurs qu’aux débutants. J’aurais aimé que Vapi mette en avant des modèles recommandés, ou même propose un assistant intégré qui suggère le meilleur modèle selon tes besoins. Cela dit, Vapi indique le modèle le plus rapide et le moins cher pour chaque fournisseur, qui, au moment de ce test, est le GPT 4o Mini Cluster chez OpenAI.

List of LLM models and providers available on Vapi. Breakdown includes latency and pricing for each model.

*Les modèles OpenAI o1 sont encore en version bêta et ne sont pas recommandés pour une utilisation en production. Les invites système et les appels d’outils ne sont actuellement pas pris en charge par les modèles o1, et la latence est nettement plus élevée que sur les modèles traditionnels.

Options avancées pour configurer ton assistant IA

Vapi propose tellement de niveaux de personnalisation, alors allons un peu plus loin et voyons quelques-unes des options de configuration avancées et comment elles fonctionnent.

Vapi Advanced Configuration includes configuring Knowledge Base, Temperature, Max Tokens, and Detect Emotion

Base de connaissances

La configuration du modèle te permet d’ajouter des documents personnalisés avec des informations sur des sujets spécifiques afin de fournir des réponses plus précises et informatives aux questions des utilisateurs. Par exemple, on peut importer notre menu de restaurant chinois, les horaires d’ouverture et d’autres informations pertinentes.

Température

La température sert à contrôler le caractère aléatoire des réponses de l’assistant. Si tu augmentes la valeur, tu auras des réponses plus variées. Si tu la baisses, vers 0, les réponses sont plus prévisibles.

En testant ce réglage, je pensais au départ qu’en mettant la valeur à zéro, l’assistant resterait strictement sur le sujet et éviterait de s’éloigner. Pourtant, ce n’était pas le cas. Quand j’ai demandé à Jade de raconter une blague, elle répondait toujours poliment et avec humour, mais le contenu des blagues variait en fonction de la température.

À une valeur de zéro, les blagues étaient très en lien avec le thème du restaurant. Par exemple : "Pourquoi le ravioli est-il allé à l’école ? Parce qu’il voulait devenir un wonton !"
À une valeur de 1,5, les blagues étaient plus générales, portant sur les cuisiniers et la nourriture en général, pas seulement sur la cuisine chinoise.

Par contre, quand j’ai mis la température à 2 (la valeur la plus haute), l’assistant s’est complètement déréglé et a répondu avec des phrases incompréhensibles.

Heureusement, avec quelques instructions, j’ai pu remettre Jade sur la bonne voie. Ça montre bien l’intérêt de bien tester ton assistant !

Max Tokens

Le nombre maximal de tokens API que l’assistant peut générer par tour dans une conversation. Ça a un impact direct sur le coût de l’API, donc fixer une limite permet de garder les réponses concises et économiques. Pour gérer les dépenses, il vaut mieux garder cette valeur à 250 ou moins.

Détecter l’émotion

Active cette fonctionnalité pour détecter les émotions des utilisateurs – comme la colère, la joie ou la frustration – et les utiliser comme contexte supplémentaire pour le modèle. D’après mon expérience, je n’ai pas remarqué de vraie différence avec ce réglage activé ou non. Le choix du modèle d’IA a eu un impact bien plus grand sur la façon dont Jade gérait les conversations. Par exemple, les modèles plus avancés comme GPT-4o répondaient à mes plaintes sur la faim avec plus d’empathie, alors que GPT-3.5 semblait nettement moins attentif.

4. Rédiger ton prompt IA

Le prompt de ton assistant sert de guide, en définissant les règles et instructions qu’il suivra lors des conversations. Si tu as déjà utilisé ChatGPT, le processus te paraîtra familier. Tu définis le prompt pour ton assistant Vapi dans l’onglet « Modèle ».

Creating a custom assistant in Vapi. Image shows AI prompt for the Golden Wok, a Chinese restaurant

Un petit détail, mais qui compte beaucoup, que j’apprécie chez Vapi, c’est le champ où tu peux saisir le « Premier message ». C’est particulièrement crucial pour les appels sortants, et c’est justement un point avec lequel j’ai eu du mal avec les bots Synthflow.

« Bonjour, ici Jade du Golden Wok. Je peux prendre ta commande ? »

Voici les éléments à inclure dans ton prompt :

Les bases et l’introduction de l’assistant
Les infos sur l’entreprise
Les infos sur le client (si besoin)
Le rôle et les objectifs principaux de l’assistant
Les instructions pour la conversation et le script
La voix et le ton
Les instructions et limitations supplémentaires

Décortiquons ensemble chaque point de mes prompts :

Introduction et informations sur l’entreprise

« Tu es un assistant vocal pour The Golden Wok, un restaurant chinois situé au 456 Dragon Street, San Francisco, Californie. Le restaurant est ouvert du lundi au samedi de 11h à 22h et fermé le dimanche. The Golden Wok propose une variété de délicieux plats chinois à la communauté locale, dont des incontournables comme les raviolis, le riz sauté, le poulet kung pao et les nouilles chow mein. »

Objectif et instructions principales

Le but principal de l’assistant :

« Ton rôle principal est de prendre les commandes des clients, répondre aux questions de base sur le menu et donner les infos sur les horaires et services du restaurant. Si un appelant veut passer commande, ton objectif est de recueillir toutes les infos nécessaires de façon sympa, efficace et engageante. »

Puis, le script d’appel :

« Voici comment tu dois t’y prendre :

Prends leur commande : Demande ce qu’ils souhaitent commander et confirme les préférences (p. ex. niveau d’épices, suppléments, etc.).
Demande les infos pour la livraison ou à emporter : Demande s’ils veulent une livraison ou un retrait sur place, et si c’est une livraison, prends leur adresse.
Confirme les coordonnées : Demande gentiment leur prénom et numéro de téléphone pour bien valider la commande.
Relis et confirme : Récapitule la commande, les infos de livraison/retrait et donne le délai estimé d’attente. »

Ton et style

Pour que ton assistant soit bien dans l’esprit de la marque, précise le style de conversation :

« Sois décontracté, sympa et un peu espiègle – imagine l’ambiance d’un petit resto convivial, pas d’un centre d’appels formel.
Garde des réponses courtes et naturelles, avec des expressions comme ‘Euh…’, ‘Compris !’, ‘Ça donne faim !’ ou ‘Ok, c’est parti !’
Ne parle pas trop – il faut que ça ressemble à une vraie conversation, pas à un monologue.
Si on te demande des infos sur le menu, mets en avant les plats phares ou les spécialités avec enthousiasme, par exemple : ‘Ooh, le poulet kung pao est un vrai succès !’
Si la personne hésite, propose des combos populaires ou demande ses envies du moment.
Si tu ne sais pas répondre, reste léger : ‘Hmm, bonne question ! Je vais vérifier ça pour toi.’ »

Points à ne pas oublier

« Si on demande des infos sur les allergènes, précise que les plats peuvent contenir du soja, du gluten et des fruits à coque, et qu’il vaut mieux vérifier avec le resto pour les détails.
Si quelqu’un demande un plat qui n’est pas au menu, oriente-le gentiment vers une option similaire dispo.
Termine chaque appel sur une note positive : ‘Merci d’avoir appelé The Golden Wok ! Ta commande sera prête bientôt. Bon appétit !’
Avec ta personnalité sympa et engageante, tu rendras la prise de commande chez The Golden Wok simple et agréable ! »

J’ai aussi ajouté cette restriction :

« Reste concentré sur la commande et évite absolument toute conversation hors sujet. »

Cette petite astuce a vraiment tout changé pour garder mon assistant concentré et éviter les discussions hors sujet.

Par exemple, quand j’ai demandé à Jade de me raconter une blague, elle a gentiment recentré la conversation sur l’objectif principal : commander de la bonne cuisine chinoise. J’ai adoré ce résultat, surtout que je n’avais jamais réussi à obtenir ce niveau de focus avec les assistants créés grâce à Synthflow AI. Je te recommande vivement d’ajouter une restriction similaire dans ton prompt pour limiter les appels inefficaces et éviter des coûts inutiles.

Astuce de pro : Pour créer ton propre prompt, tu peux prendre mon exemple (ou n'importe quel modèle de Vapi), le saisir dans ChatGPT et lui demander de générer un prompt système adapté à ton secteur et à ton cas d'utilisation spécifique.

Je sais, c’est un prompt pour créer un prompt, inspiré par un autre prompt. C’est tellement méta !

5. Configuration du module de transcription

Dans Vapi, le module de transcription est chargé de convertir la parole en texte. Cela permet à l’assistant vocal de traiter et de comprendre efficacement les demandes des utilisateurs, ainsi que de transcrire tes appels.

Setting up the transcriber in Vapi AI, which can support 100+ languages

Les modèles proposés prennent en charge la transcription dans plus de 100 langues différentes.

6. Donner une voix à ton assistant

Le module Voix est le troisième élément clé de l’infrastructure Vapi. Il sert à convertir les réponses textuelles de l’assistant IA (générées par le LLM) en audio parlé. C’est le moteur de synthèse vocale (TTS) qui permet à l’assistant de communiquer naturellement avec les utilisateurs par la voix.

Vapi propose un large choix de voix avec différents accents et tonalités pour rendre les conversations plus naturelles. Il fonctionne avec les meilleurs fournisseurs TTS comme ElevenLabs et Deepgram, ce qui te donne plein d’options pour trouver la voix qui correspond à ta marque.

La latence et les tarifs varient selon le modèle. Tester plusieurs options t’aidera à trouver le bon équilibre entre coût et qualité. Tu veux écouter les voix ? Tu peux en essayer une sur la page d’accueil de Vapi.

Vapi AI assistant voice configuration screen shows options for selecting the provider and voice

J'ai vraiment été impressionné par la variété des voix disponibles. Que tu aies besoin d'un New-Yorkais décontracté ou d'une princesse noble et aristocratique, il y a une voix pour chaque besoin. Vapi propose aussi une section incroyable appelée Bibliothèque de voix que tu peux ouvrir dans un nouvel onglet pour écouter un aperçu des voix et même rechercher un genre ou un accent spécifique.

Vapi Voice Library shows a range of voices, languages, and accents

Un point qui n'est pas tout de suite évident, c'est de savoir si une voix prend en charge la même langue que l'invite et le transcripteur. J'ai testé en changeant mon invite dans plusieurs langues différentes, et les voix que j'ai essayées s'en sont bien sorties. Cela dit, la seule façon vraiment fiable de vérifier la compatibilité, c'est d'essayer par toi-même.

7. Fonctions

Les « Fonctions » ou « Outils » (Vapi semble utiliser les deux termes de façon interchangeable) permettent à tes assistants d'effectuer des actions et tâches personnalisées pendant l'appel. Tu peux ajouter ces Outils depuis la Bibliothèque d'Outils (une page séparée sur la plateforme).

Setting up custom predefined functions for a Vapi AI assistant

Il existe plusieurs types d’outils :

Outils prédéfinis

Actuellement, il y en a trois :

Activer la fonction de fin d’appel : permet à l’assistant de mettre fin à l’appel de lui-même. (Idéal pour GPT-4 et les modèles plus avancés.)
Composer sur le clavier : l’assistant peut saisir des chiffres sur le clavier.
Numéro de transfert : ce numéro sert à transférer les appels depuis l’assistant. (Cela concerne uniquement les appels téléphoniques, pas les appels web.) Le numéro de transfert peut être n’importe quel numéro. Il n’a pas besoin d’être enregistré chez Vapi. Il est aussi conseillé d’ajouter une ligne dans ton prompt, par exemple : Si besoin, transfère les appels vers [ton numéro de téléphone].

Outils personnalisés

C’est une fonctionnalité pour les développeurs qui permet de créer tes propres actions via une API. Par exemple, tu peux collecter des informations utilisateur pendant l’appel et les envoyer à un serveur.

Intégrations

Tu peux connecter tes comptes Make ou GoHighLevel via une URL de webhook.

À noter : les intégrations reposent actuellement sur des webhooks plutôt que d’être entièrement natives. Ce n’est pas forcément un inconvénient, mais il faut savoir que la configuration peut demander un peu plus de compétences techniques.

8. Paramètres avancés

Comme son nom l’indique, cet onglet te permet de configurer différents paramètres avancés comme la confidentialité, l’ajustement fin de la conversation et les messages que l’assistant peut envoyer.

Vapi AI advanced settings show options to set privacy, fine tune conversation and messages assistant can send

Globalement, j’ai été agréablement surpris par la variété des fonctionnalités disponibles. Il est évident que Vapi se distingue vraiment en proposant des options de personnalisation solides pour ton assistant par rapport à d’autres alternatives.

Confidentialité

Ce panneau te permet de désactiver l’enregistrement des appels et des vidéos. C’est particulièrement important pour les clients basés dans l’UE.

Astuce : Les utilisateurs de l’UE, pensez à inclure un message d’avertissement dans votre message d’accueil si vous prévoyez d’enregistrer vos appels pour informer le client.

Vapi privacy settings panel shows option to enable HIPAA compliance, enable or disable audio and video recording

Instructions pour démarrer et arrêter la parole

Ces panneaux te permettent d’ajuster les temps d’attente et les interruptions de ton assistant pendant les interactions.

D’après mes tests, la fonctionnalité Smart Endpointing a vraiment amélioré la fluidité des conversations. Elle a réduit les interruptions gênantes de l’assistant, donc je te conseille de la laisser activée. Bien sûr, il faut toujours tester ton voicebot avant de le mettre en ligne. On en parle plus en détail dans la dernière section.

Vapi voice speaking instructions screen shows settings for how and when the assistant should start and stop speaking

Paramètres de délai d’attente d’appel

Ici, tu peux définir les paramètres pour indiquer à l’assistant quand terminer un appel, que ce soit à cause du silence du client ou si la durée maximale de l’appel est atteinte. C’est essentiel pour garder le contrôle sur les coûts.

Vapi call timeout settings options show settings for silence timeout and maximum call duration

Messages

Enfin, tu as des paramètres pour les messages que ton assistant peut envoyer, comme les messages de messagerie vocale, de fin d’appel et d’inactivité (par exemple « Tu es toujours là ? »). Tu as aussi des options pour envoyer des messages de façon programmatique à ton serveur (réservé aux développeurs).

9. Analyse

La dernière section du configurateur d’assistant te permet de définir des invites et des paramètres pour l’analyse de l’appel, notamment l’invite de résumé d’appel, les critères de réussite et l’extraction de données structurées.

Vapi AI call analysis configuration allows you to set up a prompt for the AI to evaluate the client's behavior during the call

L’évaluation du succès et l’extraction structurée des données seront particulièrement importantes pour les appels de vente et la qualification des prospects. Ensemble, elles peuvent servir à attribuer un score aux leads.

Voici à quoi pourrait ressembler un exemple de prompt pour le système d’évaluation du succès :

"Évalue le comportement du client pendant l’appel en te basant sur :

Engagement : A-t-il participé activement et montré de l’intérêt ?
Clarté : A-t-il clairement exprimé ses besoins ou objectifs ?
Réceptivité : S’est-il montré ouvert aux suggestions et solutions ?
Gestion des objections : A-t-il été coopératif lors du traitement des préoccupations ?
Prise de décision : A-t-il montré une volonté de passer à l’action souhaitée ?
Fournis un bref bilan des points forts, des axes d’amélioration et des suggestions pour renforcer l’engagement du client si besoin."

Tu peux même préciser la grille d’évaluation pour le prompt. C’est le cadre qui définit les critères d’évaluation :

Vapi success evaluation rubric allows you to set out the criterial for evaluating a call and scoring leads

10. Choisir un numéro de téléphone

Les numéros de téléphone sont nécessaires dans Vapi pour passer ou recevoir des appels téléphoniques.

Tu peux acheter des numéros américains et canadiens directement depuis Vapi pour 2 $ par mois et par numéro, ou importer tes numéros depuis Twilio ou Vonage en saisissant ton identifiant SID Twilio/Vonage.

La fonctionnalité d’achat de numéros en natif est assez limitée pour le moment. Tu ne peux acheter que des numéros américains et canadiens, et tu dois saisir manuellement l’indicatif régional pour trouver un numéro. Aussi, tu ne peux pas passer d’appels sortants vers d’autres pays avec un numéro natif. En d’autres termes, il faut utiliser la fonction d’importation si tu travailles en dehors de ces deux pays ou si tu veux appeler des numéros internationaux. C’est assez restrictif et c’est un vrai recul par rapport à l’interface de Synthflow pour l’achat de numéros.

Quand tu achètes le numéro, tu as deux options :

Paramètres entrants : tu peux associer ton numéro à un assistant pour les appels entrants. Quand quelqu’un appelle ce numéro, ton assistant IA répond aux appels.
Paramètres sortants : tu peux demander à ton assistant d’appeler un numéro sortant précis. Malheureusement, la plateforme ne propose pas de fonctionnalité de campagne par lots (comme le fait Synthflow), ce qui rend les appels sortants via l’interface assez peu pratiques. Cela dit, tu peux quand même automatiser ce processus avec l’API.

Vapi phone numbers screen shows inbound and outbound settings and numbers

11. Tester et publier ton assistant

Une fois que tu as configuré ton assistant, tu es enfin prêt à faire quelques tests finaux et à le publier en ligne. Vapi t’offre 10 $ de crédits gratuits pour tester. Tu peux suivre leur utilisation sur ta page de facturation.

Tu peux appeler l’assistant directement depuis le navigateur web ou utiliser l’option de numéro de téléphone pour passer ou recevoir des appels sur le téléphone.

Avec mon prompt personnalisé et GPT 4o Mini comme modèle, Jade a super bien fonctionné, en gardant une conversation fluide et cohérente. Le message d’accueil a parfaitement marché (ce que je n’avais pas réussi à faire avec Synthflow), et les restrictions sur les conversations hors sujet étaient encore plus efficaces que ce que j’espérais.

Cela dit, j’ai remarqué qu’en réduisant la latence en dessous de 750 ms, l’assistant semblait moins naturel. Comme on dit, « trop de bien peut nuire », et c’est aussi valable pour la vitesse de ton assistant. L’assistant répondait trop vite, coupant et chevauchant souvent ma parole. Ça peut surtout poser problème avec des publics plus lents, comme les personnes âgées ou les non-natifs. Le bon équilibre pour moi se situait entre 750 ms et 900 ms, ce qui était heureusement très facile à ajuster grâce au nombre d’options et de modèles disponibles.

Les tests via numéro de téléphone ont parfaitement fonctionné, mais j’ai été déçu de découvrir qu’il n’y a pas d’option d’intégration web comme avec Synthflow. Si tu veux déployer ton assistant sur le web, tu peux pour l’instant le faire uniquement de manière programmatique.

Un autre point négatif lors des tests, c’est l’absence de fonctionnalité de chat texte. Dans Synthflow, tu peux interagir avec tes assistants par texte, ce qui simule un vrai appel sans utiliser les appels téléphoniques ou web, et ça aide à économiser des crédits pendant les tests.

Fonctionnalités avancées de Vapi

Vapi propose aussi des fonctionnalités avancées qu’on n’a pas encore vues. On va jeter un œil.

Créer des processus multi-étapes avec les blocs

La fonctionnalité Blocs dans Vapi est un constructeur de workflows visuels avancé qui offre des possibilités puissantes de personnalisation et d’automatisation pour tes assistants vocaux. Avec les Blocs, tu peux concevoir et connecter une série d’étapes, en combinant des étapes de conversation et des outils externes pour créer une expérience client fluide. Ça peut servir pour des conversations multi-étapes, du transfert, de la gestion d’erreurs, de la logique visuelle et des interactions programmatiques avec ton serveur et ta base de données.

Pour notre restaurant chinois, un workflow possible pourrait ressembler à ça :

Accueillir le client et demander son identifiant de commande.
Utiliser un bloc API pour interroger ta base de données et récupérer les détails de la commande.
Fournir au client le statut de sa commande.
Lui proposer de parler à un conseiller si besoin d’aide supplémentaire.

Faites tourner une équipe d’assistants comme une machine bien huilée avec les squads

La fonctionnalité Squads de Vapi permet une collaboration fluide entre plusieurs assistants pour créer un système de gestion d’appels plus dynamique et efficace. Cette fonctionnalité permet de transférer les appels entre assistants quand l’un d’eux n’est pas disponible et aide aussi à simuler un processus complet en plusieurs étapes, comme la recherche de prospects, la qualification et la conclusion d’affaires. Le meilleur, c’est que tu peux appeler la Squad et tester toute l’équipe d’assistants.

Squads de Vapi brillent dans les situations où plusieurs assistants sont nécessaires pour gérer différentes étapes d’un processus. Par exemple :

Recherche de prospects : Le premier assistant collecte les informations clés sur un prospect, comme son entreprise, ses besoins et ses coordonnées.
Qualification du prospect : Un deuxième assistant évalue si le prospect correspond à tes critères en posant des questions ciblées et en déterminant s’il est adapté à ton produit ou service.
Enregistrement des données du prospect : Un outil enregistre les données du prospect sur ton serveur et dans ton CRM.
Conclusion de l’affaire : Le troisième assistant gère la dernière étape, répond aux objections, explique les tarifs ou traite même une commande via un outil.

Enrichir les connaissances de l’assistant avec des fichiers

L’une des fonctionnalités phares de Vapi, c’est sa capacité à importer des fichiers comme « Base de connaissances ». Ça améliore vraiment la capacité de l’assistant à fournir des réponses précises et détaillées. Il suffit de télécharger directement les documents pertinents et ils deviennent immédiatement consultables.

Pour notre restaurant chinois, The Golden Wok, j’ai récupéré un menu sur le site web de mon restaurant asiatique préféré et je l’ai mis dans un fichier texte. Ensuite, je l’ai importé dans Vapi comme Base de connaissances de l’assistant. Le processus a été rapide et simple :

D’abord, j’ai téléchargé le fichier du menu dans la section Fichiers :

Vapi Files screen lets you upload data to the knowledge base, such as a menu for our Chinese restaurant

Ensuite, je l’ai sélectionné comme base de connaissances dans les paramètres de l’assistant :

Files uploaded to Vapi can be selected under an assistant's knowledge base. Here, a menu for the Golden Wok is being added to our assistant, Jade's, Knowledge Base

En quelques instants, l’assistant a traité les informations et les a rendues accessibles.

Lorsque j’ai testé, j’ai demandé : « Qu’est-ce qu’il y a au menu ? » Jade a répondu avec précision et simplicité, en listant tous les plats comme ils apparaissaient dans le fichier. Elle a même recommandé certains plats selon mes goûts et listé les ingrédients de certains items.

Tarifs Vapi

Vapi fait tout pour t’aider à comprendre les coûts par minute des appels vocaux. Il fournit une ventilation complète de la structure de coûts de tes assistants, y compris la marge Vapi. Le plus important, c’est que Vapi propose un prix plus bas que les alternatives.

Le coût par minute dépend de quatre éléments variables :

Modèles d’IA : Les modèles plus avancés comme GPT-4 coûtent plus cher que les options plus légères. Les tarifs vont de 0,32 $ à moins de 0,01 $.
Fournisseurs de voix : Les coûts varient selon les fournisseurs de synthèse vocale, comme ElevenLabs, allant de 0,65 $ à 0,001 $.
Module d’écoute : Les tarifs pour un fournisseur de reconnaissance vocale comme Deepgram vont de 0,017 $ à 0,008 $.
Tarif fixe de Vapi de 0,05 $ par minute.

Comme tu peux le voir, les coûts globaux varient beaucoup. Tu peux t’attendre à un coût total par minute d’appel compris entre 0,07 $ et 1,03 $ au maximum. Garde aussi en tête qu’il s’agit d’estimations, pas du prix exact que tu paieras. La bonne nouvelle, c’est que tu profites quand même d’appels de haute qualité même avec les modèles les moins chers.

Sur ton tableau de bord, tu peux suivre tes dépenses réelles et le coût moyen par appel. Attention, il s’agit du coût par appel, pas par minute, mais tu peux le calculer en divisant le nombre total de minutes d’appel par le montant total dépensé. Tu peux aussi tester ton assistant pour avoir une idée de ce que coûtera un appel.

Vapi AI Dashboard shows call minutes, number of calls, pricing, and other statistics

Verdict final

Vapi est un super outil pour ceux qui veulent une personnalisation poussée. Il offre des conversations fluides, avec une faible latence, et une flexibilité impressionnante. Même si ça peut sembler intimidant au début pour ceux qui ne connaissent pas les modèles d’IA, ses fonctionnalités puissantes le rendent vraiment unique.

Cependant, il manque quelques options d’interface, comme la messagerie texte dans le chat, et l’achat de numéros de téléphone pourrait être plus intuitif. Il n’y a pas non plus d’options intégrables. Cela dit, ses tarifs abordables et sa capacité à évoluer en font un excellent choix pour les entreprises qui veulent développer facilement leurs opérations d’appels, surtout si tu es prêt à expérimenter avec les modèles d’IA.

Avantages

Modèles personnalisables
-
Flexibilité maximale pour personnaliser et ajuster les conversations
-
Détail transparent des tarifs
-
Prix global inférieur à celui des alternatives
-
Voice bots à faible latence
-
Conversations fluides et naturelles
-
Les instructions du prompt fonctionnent parfaitement
-
Bibliothèque vocale robuste
-
API robuste et plateforme la plus complète pour les développeurs
-

Désavantages

Pas de campagnes groupées pour l’envoi massif
-
Pas de messagerie instantanée
-
Modèles prédéfinis peu convaincants
-
Aucun widget intégrable pour déployer l’assistant sur le web
-
Les chatbots avec une latence ultra faible (<700 ms) peuvent être difficiles à utiliser
-
On peut acheter uniquement des numéros américains et canadiens, mais il est possible d’importer des numéros Twilio et Vonage.
-
Les options de modèles et de fine-tuning peuvent sembler complexes au début
-

Crée ton assistant vocal IA avec Vapi

Intégration fluide pour appels et applications

Alternatives à Vapi

Synthflow AI

Synthflow AI est une excellente alternative à Vapi, surtout si tu cherches une plateforme intuitive pour créer des workflows pilotés par l’IA sans avoir besoin de compétences techniques poussées. Elle propose une interface sans code, ce qui la rend accessible même aux utilisateurs avec peu d’expérience en programmation, tout en offrant de puissantes options de personnalisation. La plus grande différence se situe au niveau des fonctionnalités disponibles dans l’interface (et donc accessibles aux non-développeurs). Parmi celles-ci, on retrouve les campagnes en lot (pour des campagnes de prospection massive), les widgets intégrables et l’extraction de données. Tu peux consulter notre comparaison détaillée Synthflow AI vs Vapi pour en savoir plus sur leurs différences.

Bland AI

Bland.ai est une alternative avancée à Vapi, pensée pour les entreprises. Contrairement à Vapi, qui reste plus accessible grâce à son option sans code, Bland.ai mise sur une flexibilité encore supérieure pour les développeurs. La plateforme regorge de fonctionnalités pour les entreprises comme la sécurité SOC2 Type II, les paiements téléphoniques avec PCI DSS, et bien plus.

Retell AI

Retell AI est conçue pour t’aider à déployer facilement des agents vocaux IA. Comme Synthflow, elle se concentre principalement sur l’interface utilisateur de la plateforme. Elle propose des fonctionnalités natives pour la prise de rendez-vous (via Cal.com), la synchronisation automatique de ta base de connaissances, le transfert d’appels, et d’autres encore.

FAQ

Peut-on utiliser Vapi sans être développeur ?

Oui, Vapi propose une interface entièrement fonctionnelle, mais il manque certaines fonctionnalités par rapport à l’API pensée pour les développeurs, comme une interface pour l’extraction de données et un widget assistant à intégrer.

Qui est le fondateur de Vapi ?

Vapi a été fondée par Jordan Dearsley et Nikhil Gupta en 2023. L'entreprise est basée à San Francisco, aux États-Unis.

Vapi est-il open source ?

Non, Vapi n'est pas open source. C'est une plateforme commerciale. Cependant, elle propose de nombreuses options de personnalisation et d'intégration via son API, y compris des options open source.

Quelle est l’alternative open source à Vapi ?

Actuellement, il n’existe aucune solution entièrement open source sur le marché. Cependant, si tu as les ressources de développement et la capacité, tu peux créer ta propre stack en utilisant des modèles open source.

Kaloyan Yankulov

Kalo Y.

Cofondateur d'une plateforme d'automatisation du marketing, je suis passionné par tout ce qui touche au marketing et à la croissance des SaaS. Pendant mon temps libre, j'aime aller à la salle de sport et jouer à des jeux vidéo.

Pourquoi faire confiance à Softailed

Nos rédacteurs sont des professionnels du secteur, dotés d’une expertise terrain dans leurs domaines. Chaque article suit un processus de vérification rigoureux : validation des faits, relecture collaborative et approbation finale. Nous garantissons une précision irréprochable pour vous épargner tout doute. Découvrez notre charte éditoriale.