
Je préfère que l'IA ne dise rien plutôt qu'elle dise quelque chose de faux
Je travaille dans l'équipe support d'eesel, donc je lis des réponses d'IA à longueur de journée, les nôtres comme celles que les clients nous transfèrent depuis des outils qu'ils abandonnent. Le schéma qui m'inquiète n'est pas celui de l'agent qui hésite et pose une question de clarification. C'est celui de l'agent qui invente une réponse claire, assurée, mais totalement fausse, et l'envoie avant que quiconque ne puisse intervenir.
Un exemple m'est resté en tête. Une équipe de télématique de véhicules B2B au Danemark, utilisant Zendesk et passant de quelques centaines de tickets par mois à plusieurs milliers, nous a raconté que leur bot n'arrêtait pas de dire aux clients « oui, nous supportons votre modèle de voiture » pour des marques qui ne figuraient pas du tout dans leur base de données. Pourquoi ? Leur base de connaissances (knowledge base) contenait une phrase enthousiaste affirmant qu'ils « supportent tous les modèles ». L'IA l'a crue. Elle ne mentait pas, elle répétait un document écrit pour le marketing, et non pour un agent autonome répondant à des questions réelles. Leur propre résumé des débuts : « tâtonnements ».
C'est là le problème des hallucinations dans le support : il s'agit rarement d'un modèle qui devient incontrôlable. Il s'agit d'un modèle qui répète fidèlement une lacune de votre configuration. Nous déployons des agents IA sur des files de support en direct depuis des années maintenant, sur des milliers de tickets réels, et presque chaque réponse erronée que j'ai analysée a une cause profonde ennuyeuse et corrigeable. Commençons donc par là.

Pourquoi une hallucination de support coûte plus cher qu'une hallucination de chatbot
Quand un chatbot généraliste invente quelque chose, on hausse les épaules et on reformule la demande. Quand un agent de support le fait, le client agit en conséquence. Il attend une date de livraison que vous n'avez pas promise. Il suit des étapes d'installation pour une fonctionnalité que vous n'avez pas. Dans les secteurs réglementés, les enjeux s'aggravent rapidement : un cofondateur d'une entreprise de technologie juridique nous a confié qu'ils ne pouvaient se permettre aucune erreur, car il existe une frontière ténue entre être utile et glisser discrètement vers le conseil juridique.
On retrouve cette même crainte dans les avis publics. Un analyste commercial Salesforce évaluant un agent de support IA sur G2 a exprimé franchement le problème de la qualité des données :
« Si vos fichiers de version de contenu (articles de connaissance) n'ont pas été mis à jour depuis 2021, l'agent IA donnera avec assurance des informations obsolètes aux clients. »
Muhammad O., Analyste commercial Salesforce, donnant son avis sur Agentforce Service sur G2
Et la version non ancrée, provenant d'un autre utilisateur de la même famille d'outils :
« En plus de cela, les hallucinations sont vraiment problématiques : comme nous n'entraînons pas le modèle et qu'il fonctionne sur un modèle général, il donne parfois des informations qui ne sont pas les nôtres. »
Arjun G., Consultant associé Salesforce, donnant son avis sur Salesforce Agentforce sur G2
Ces deux avis aboutissent au même point par des chemins différents : un agent n'est véridique que dans la mesure où il est autorisé à lire des données et s'il est contraint de le faire. C'est là que tout se joue. Voici comment je sécuriserais le processus.
Les cinq étapes qui empêchent une IA de support d'halluciner
Considérez cela moins comme un réglage unique que comme une série d'étapes par lesquelles passe une question avant d'atteindre un client. Chaque étape intercepte un mode de défaillance différent, et les réponses qui survivent aux cinq sont celles auxquelles vous pouvez réellement faire confiance pour un envoi automatique.

Délimiter les connaissances, puis les délimiter à nouveau
Le premier et le plus important levier est ce que l'agent est autorisé à lire. Une IA de support doit répondre à partir de votre propre source de vérité : votre centre d'aide, vos anciens tickets résolus, votre base de connaissances interne, et rien d'autre. Dès qu'elle est autorisée à s'appuyer sur des « connaissances générales » pour combler une lacune, vous lui donnez la permission de deviner.
C'est aussi là que l'hygiène documentaire entre en jeu. Cette phrase « nous supportons tous les modèles » est une hallucination en attente : non pas parce que l'IA est inefficace, mais parce qu'il s'agit d'une affirmation assurée et sans nuance située dans une source que l'agent traite comme une vérité absolue. Lorsque vous entraînez une IA sur votre base de connaissances, vous ne vous contentez pas de l'orienter vers des documents, vous auditez si ces documents peuvent être répétés textuellement à un inconnu.
eesel AI apprend de vos tickets passés, de vos documents d'aide et des flux de travail de votre équipe dès le premier jour, ainsi des années de conversations résolues deviennent des connaissances sur lesquelles l'agent peut s'appuyer au lieu d'inventer. Il se connecte directement à vos sources de connaissances et à vos helpdesks existants, de sorte que l'agent lit les mêmes articles auxquels votre équipe fait déjà confiance.

Si un sujet n'est véritablement pas couvert, le comportement correct est de le dire ou de passer la main, pas d'improviser. Un bon agent doit également signaler les lacunes qu'il rencontre régulièrement afin que vous puissiez rédiger l'article manquant, plutôt que de les masquer par une supposition. C'est là la moitié de la valeur d'un chatbot de base de connaissances IA : il vous indique ce que vos documents ne couvrent pas encore.
Exiger une citation pour chaque réponse
Les citations sont un signal d'alerte pour les hallucinations. Si l'agent doit pointer vers le document spécifique d'où provient sa réponse, deux choses positives se produisent : un réviseur humain peut la vérifier en un clic, et l'agent ne peut pas répondre du tout s'il n'y a pas de source à citer. Pas de source, pas de réponse assurée.
Le cofondateur de la legal-tech que j'ai mentionné plus tôt a été rassuré précisément parce qu'ils pouvaient définir des garde-fous exacts sur le sourçage et que l'agent affichait toujours des citations transparentes. Ce n'est pas un luxe pour eux, c'est ce qui leur a permis d'activer l'IA. Techniquement, c'est l'objectif d'une configuration de génération augmentée par récupération (RAG) : la réponse est assemblée à partir de passages récupérés, et ces passages l'accompagnent.
Un test rapide pour tout outil que vous évaluez : demandez à voir une réponse avec ses sources jointes. Si le fournisseur ne peut pas vous montrer d'où provient une réponse donnée, votre équipe ne le pourra pas non plus, et votre client non plus.
Router par niveau de confiance
Si vous ne deviez retenir qu'une seule chose de cet article, retenez celle-ci. Un seuil de confiance permet à l'agent de répondre aux questions dont il est sûr et de ne pas toucher au reste. Confiance élevée : il répond et envoie. Moyenne : il prépare un brouillon de réponse qu'un humain doit approuver. Faible : il ne touche pas au ticket et l'oriente vers une personne.

Ce point a été abordé lors de l'appel de vente le plus mémorable que j'ai pu relire. Un responsable de l'expérience client (CX) pour une marque de compléments alimentaires en vente directe (DTC) sur Gorgias et Shopify, traitant environ 7 000 tickets par mois, nous a dit que la décision dépendait exactement de cela. Ses mots, en substance : l'IA ne répondra jamais à 100 % des questions, mais si elle essaie et répond simplement « désolé, je ne sais pas », il ne peut pas aller vérifier les 7 000 tickets pour voir si la réponse était bonne, donc l'intérêt est nul. Il avait besoin d'une IA qui ne gère que les tickets pour lesquels elle est confiante et laisse le reste. C'est toute la thèse de la prévention des hallucinations résumée en une phrase.
Le routage par confiance est aussi ce qui fait la différence entre un agent IA et un chatbot basé sur des règles : l'agent sait quand il ne sait pas. eesel AI propose cette fonctionnalité par défaut : vous commencez en mode entièrement supervisé, puis vous accordez de l'autonomie sur les types de tickets simples à mesure que vous gagnez en confiance, catégorie de ticket par catégorie de ticket. La plupart des helpdesks proposent une version de cette fonctionnalité : si vous utilisez Zendesk, il est utile de comprendre le seuil de confiance des intentions et le message de repli que l'agent utilise par défaut.
Garder un humain sur les tickets complexes, avec un transfert fluide
Le routage par confiance n'est utile que si le transfert qui suit est fluide. Lorsque l'agent se retire, le ticket doit arriver chez un humain avec tout le contexte : la conversation, le client, ce sur quoi l'agent n'était pas sûr, et non un redémarrage à zéro qui oblige le client à se répéter.
C'est aussi là que vous donnez à votre équipe un contrôle explicite sur ce que l'IA touche. De nombreuses équipes souhaitent que certains types de tickets soient totalement exclus de l'automatisation : litiges de facturation, annulations, tout ce qui est juridique. C'est une fonctionnalité, pas une limitation. Une bonne configuration vous permet d'exclure des types de tickets, de paramétrer l'agent pour qu'il n'agisse que lorsqu'il est explicitement sollicité, et de définir quand il doit passer la main. Si vous planifiez cela, notre guide sur les escalades d'agents IA couvre les modèles qui fonctionnent. Les mécanismes d'un transfert propre vers un humain comptent tout autant que le déclencheur qui l'active.
Il existe un piège connexe à nommer : l'excès de promesses. Un responsable du support e-commerce avec lequel nous avons travaillé a dû demander à son chatbot IA e-commerce d'arrêter de rassurer les clients en leur disant qu'il allait « régler leur problème » et d'arrêter de promettre une livraison pour vendredi, car personne ne pouvait le garantir. L'hallucination ne consiste pas seulement à inventer des faits, c'est aussi inventer des engagements. Les garde-fous sur le ton et les promesses appartiennent à la même catégorie que les garde-fous sur les faits.
Apprendre de chaque correction
La dernière étape est celle qui apporte des résultats cumulatifs. Chaque fois qu'un humain modifie ou rejette un brouillon, ce signal doit améliorer la réponse suivante, et non disparaître dans le vide. Un agent qui apprend de ses corrections devient plus précis et plus confiant avec le temps, ce qui signifie que davantage de tickets passent l'étape du seuil de confiance honnêtement plutôt qu'en abaissant le niveau d'exigence.

Avec eesel AI, vous réglez cela en langage courant : vous indiquez à l'agent quand intervenir, quel ton utiliser et ce qu'il ne doit jamais promettre, et les corrections alimentent son comportement. Pas de projet de réentraînement, pas d'équipe de science des données. Vous pouvez examiner ses actions dans les journaux de conversation et ajuster à partir de là, la même boucle sur laquelle est construit un centre de formation Zendesk.
Ne faites pas une confiance aveugle aux garde-fous : simulez d'abord
Voici l'étape que la plupart des équipes ignorent, et celle sans laquelle je ne lancerais jamais rien. Avant qu'une seule réponse ne soit envoyée en direct, testez l'agent par rapport à vos tickets historiques réels et voyez comment il y aurait répondu.
La simulation transforme le sentiment « je pense que c'est sûr » en un chiffre concret. Vous orientez l'agent vers des milliers de conversations passées et il vous montre comment il aurait réagi, où il est confiant, où il aurait deviné, et quelle part du volume il aurait pu gérer seul. Vous identifiez les lacunes, vous les comblez et vous recommencez, le tout avant qu'aucun client ne soit impliqué. C'est la différence entre espérer que vos garde-fous tiennent et les voir tenir face à votre historique réel de tickets.

C'est aussi la manière honnête de prévoir votre taux de résolution au lieu de croire au chiffre de tête d'un fournisseur. Un responsable CX que j'ai cité plus haut a exprimé le même point différemment : il ne voulait pas attendre un rapport mensuel pour découvrir que l'IA s'était trompée, il voulait le savoir à l'avance. La simulation permet de le savoir à l'avance. Le mode simulation d'eesel AI s'exécute sur vos tickets passés et rapporte la couverture par thème : vous passez donc en direct sur les types de tickets pour lesquels l'IA a fait ses preuves, et uniquement sur ceux-là.
Je serai franc sur le compromis à faire, car un optimisme uniforme est souvent suspect. Faire cela correctement signifie que vous n'activez pas un interrupteur pour tout automatiser dès le premier jour. Vous commencez par un périmètre restreint, sur les types de tickets validés par la simulation, et vous l'élargissez à mesure que l'agent fait ses preuves. Si vous voulez un agent qui résout 100 % des tickets dès la première heure sans aucune surveillance, aucun outil honnête ne peut vous l'offrir, et ceux qui le prétendent sont ceux qui hallucinent. L'avantage est que la voie plus lente et ancrée dans la réalité est aussi celle en laquelle les clients finissent par avoir confiance.
Là où le modèle lui-même peut aider
J'ai insisté sur le fait que « c'est votre configuration, pas le modèle » qui compte, car c'est là que se trouvent les solutions. Mais le modèle sous-jacent n'est pas sans importance. Les modèles récents sont plus aptes à dire « je ne suis pas sûr » au lieu de bluffer, plus performants pour s'en tenir aux sources récupérées et plus efficaces pour suivre des instructions telles que « ne promettez jamais de date de livraison ». Une configuration d'ancrage solide sur un modèle puissant bat une configuration solide sur un modèle faible. C'est aussi ce qui sépare un véritable outil d'assistance par agent IA d'un simple sélecteur de macros amélioré.
La leçon pratique : vous n'avez pas à choisir le modèle vous-même ou à surveiller les mises à jour. Le rôle d'une bonne plateforme de support est de faire fonctionner un modèle performant et de l'entourer des cinq étapes susmentionnées, afin que vous bénéficiiez des améliorations du modèle sans avoir à tout réarchitecturer. C'est à ce niveau qu'eesel AI intervient, et c'est pourquoi le même agent se comporte de manière cohérente à travers plus de 100 intégrations. Que votre pile technologique repose sur un agent IA Gorgias ou un agent HubSpot, les couches d'ancrage et de confiance l'accompagnent.
Essayez eesel AI
Je ne suis pas neutre, je travaille ici, et nous nous intégrons aux helpdesks que j'ai mentionnés, gardez donc cela à l'esprit. Mais la prévention des hallucinations est le problème exact pour lequel l'agent de helpdesk IA d'eesel a été conçu. Il apprend de vos tickets et documents passés dès le premier jour, cite ses sources, route par confiance pour que les réponses incertaines aillent vers un humain plutôt que vers votre client, et vous permet de simuler par rapport à votre historique réel de tickets avant la mise en ligne : les cinq étapes, intégrées nativement plutôt qu'ajoutées après coup. Des équipes l'utilisent à grande échelle : un client résout 73 % des demandes de niveau 1 dès le premier mois, et un autre utilise un agent entièrement automatisé pour plus de 100 000 tickets par mois en langue allemande.
Les tarifs sont basés sur l'utilisation (0,40 $ par ticket/session de chat, 4,00 $ par article de blog) avec un essai gratuit de 50 $ et sans frais de plateforme ni minimum mensuel, vous ne payez donc pas pour qu'un agent reste là à deviner. Vous pouvez consulter les forfaits ou commencer un essai gratuit et lancer une simulation sur vos propres tickets d'abord. Cette simulation est le moyen le plus rapide de voir, dans vos propres données, exactement où un agent IA aiderait et où il aurait halluciné, avant même qu'il ne s'adresse à un client.
Questions fréquemment posées
Qu'est-ce qui cause les hallucinations de l'IA dans le support client ?
Le routage basé sur la confiance est-il suffisant pour prévenir les hallucinations ?
Comment tester un agent de support IA avant son déploiement ?
Un agent de support IA qui évite les hallucinations résoudra-t-il quand même assez de tickets ?

Article by
Riellvriany Indriawan
Riell is a designer and writer at eesel AI with about two years of experience researching CX platforms, AI chatbots, and helpdesk software. She combines her design background with a sharp eye for how these tools actually look and feel in practice — making her comparisons unusually visual and user-focused.







Comment empêcher mon agent de support IA d'inventer des réponses ?