Wie verhindere ich, dass mein KI-Support-Agent halluziniert?

Geschrieben von

Alicia Kirana Utomo

Geprüft von

Katelin Teen

Zuletzt bearbeitet June 19, 2026

Expertengeprüft

Illustration eines KI-Support-Agenten, der in einer Wissensbasis verankert ist, mit Quellenangaben und einer Konfidenzprüfung, die seine Antworten absichern

TL;DR

Kurz gesagt: Man kann kein Sprachmodell bauen, das nie halluziniert – aber man kann das System darum herum so gestalten, dass eine falsche Antwort nie einen Kunden erreicht. Eine Support-Halluzination ist kein Modellproblem, das man mit einem besseren Modell löst, sondern ein Designproblem, das man mit Schutzmaßnahmen löst.

Vier Dinge erledigen fast die gesamte Arbeit. Verankere den Agenten in deinen eigenen Hilfedokumenten und gelösten Tickets statt im offenen Internet. Zwinge ihn, bei jeder Antwort eine Quelle anzugeben. Setze einen Konfidenz-Schwellenwert, damit er nur automatisch antwortet, wenn er sicher ist, und alles andere an einen Menschen weiterleitet. Und simuliere ihn auf deinen vergangenen Tickets, bevor er je mit einem echten Kunden spricht.

Ich entwickle KI-Agenten bei eesel, und das ist genau die Konfiguration, die ich einrichten würde. Wer das sofort einsatzbereit will: Der eesel KI-Helpdesk-Agent wird mit konfidenzbasiertem Routing und einem Simulationsmodus ausgeliefert, damit du nachweisen kannst, dass er sicher ist, bevor du ihn einschaltest.

Was „Halluzination" für einen Support-Agenten wirklich bedeutet

Eine Halluzination liegt vor, wenn das Modell mit derselben Überzeugung etwas Falsches behauptet wie etwas Wahres. Große Sprachmodelle sagen die wahrscheinlichsten nächsten Wörter voraus. Wenn ihnen keine echte Antwort vorliegt, hören sie nicht auf. Sie produzieren eine flüssige, plausible, völlig erfundene Antwort. Das ist kein Fehler, den man beheben kann – so funktioniert die zugrunde liegende Technologie.

In einem allgemeinen Chatbot ist eine Halluzination ärgerlich. Im Support ist sie teuer. Deine KI-Kundensupport-Software spricht für dein Unternehmen, gegenüber einem Kunden, oft über Geld, Konten oder Zusagen, die du jetzt einhalten musst. Ich habe erlebt, wie ein selbstsicher klingender Bot einem Kunden stillschweigend etwas mitgeteilt hat, das schlicht nicht unsere Richtlinie war – und die Kosten lagen nicht im falschen Satz, sondern im Folgeticket, dem Vertrauensverlust und dem Menschen, der das wieder geradebiegen musste.

Eines unserer Kunden, ein dänisches Fahrzeug-Telematik-Team, das den Support über Zendesk abwickelt, erlebte die klarste Variante davon. Ihre Wissensbasis besagte „wir unterstützen alle Modelle", also bestätigte der Agent fröhlich, als ein Kunde nach einer Automarke fragte, die gar nicht in ihrer Datenbank war. Das Modell war nicht kaputt. Es las, was ihm gegeben wurde, und antwortete selbstsicher. Das Problem lag darin, was es lesen durfte und ob es gezwungen war, ehrlich über seine Quellen zu sein.

Das ist das ganze Spiel, und deshalb geht es im Rest dieses Beitrags um die Konfiguration, nicht um das Modell.

Die ehrliche Antwort: Verhindere, dass die falsche Antwort versendet wird – nicht, dass das Modell denkt

Hier ist die Umdeutung, die die meisten „Wie stoppt man KI-Halluzinationen"-Ratschläge verpassen. Man wird kein Modell bekommen, das nie ein falsches Token erzeugt. Das zu verfolgen ist ein aussichtsloser Kampf. Was man absolut tun kann, ist eine Reihe von Schleusen zu bauen, damit eine falsche Antwort abgefangen wird, bevor sie gesendet wird.

Denk daran als Tiefenverteidigung. Das Modell entwirft etwas. Bevor dieser Entwurf zu einer Antwort wird, die ein Kunde liest, durchläuft er Verankerung, eine Quellenprüfung, eine Konfidenzprüfung und bei Bedarf einen Menschen. Jede Schleuse, die das Problem erkennt, reicht aus.

Eine Pipeline, die zeigt, wie eine falsche KI-Antwort aufgehalten wird, bevor sie einen Kunden erreicht: das Modell entwirft, dann durchläuft es Verankerung, eine Quellenanforderung, eine Konfidenzprüfung und eine menschliche Überprüfung, bevor es gesendet oder an eine Person weitergeleitet wird

Warum das wichtig ist: Eine einzige nachweislich falsche Antwort zerstört das Vertrauen eines Kunden in alle anderen Antworten des Agenten, egal wie gut die übrigen sind. Das Ziel ist also kein perfektes Modell, sondern ein System, in dem der schlechteste Fall „die KI sagt nichts" ist und nicht „die KI sagt etwas Falsches". Lass uns das aufbauen.

Die Konfiguration, die einen Support-KI wirklich vor Halluzinationen schützt

Füttere ihn mit deinen eigenen Antworten, nicht mit dem offenen Internet

Der erste und größte Hebel ist die Verankerung: Der Agent sollte nur aus deinem eigenen Wissen antworten, nicht aus dem, was er beim Pre-Training absorbiert hat. Das bedeutet, ihn mit deinem Hilfecenter, deinen internen Dokumenten, deinen Makros und idealerweise deiner Sammlung gelöster Tickets zu verbinden und ihn dann auf dieses Material zu beschränken.

Gelöste Tickets sind die unterschätzte Quelle hier. Ein Hilfecenter sagt dem Agenten, was dein Produkt sollte tun; deine gelösten Tickets zeigen, wie dein Team tatsächlich auf echte Kunden in deinem Kundenservice-Workflow antwortet, einschließlich aller Sonderfälle. Ein KI-Wissensbasis-Chatbot, der aus beidem lernt, ist weit schwerer aus der Bahn zu werfen als einer, der nur auf Marketingseiten trainiert wurde.

Man kann sehen, wie ein unverankerter Agent in der Praxis aussieht. Ein Salesforce-Berater, der Agentforce bewertet hat, brachte es auf den Punkt:

„Außerdem sind die Halluzinationen wirklich schlimm, da wir nicht trainieren und es mit einem allgemeinen Modell arbeitet – manchmal gibt es einfach Informationen, die nicht unsere sind."

– Arjun G., Rezension von Salesforce Agentforce auf G2

„Informationen, die nicht unsere sind" – das ist das Indiz. Die Lösung besteht darin sicherzustellen, dass die einzigen verfügbaren Informationen deine sind. Die Kehrseite der Verankerung ist allerdings Veralterung, also halte die Quelle aktuell. Wie ein anderer Rezensent derselben Tool-Familie warnte:

„Wenn deine Content-Version-Dateien (Wissensartikel) seit 2021 nicht mehr aktualisiert wurden, gibt der KI-Agent Kunden selbstsicher veraltete Informationen."

– Muhammad O., Rezension von Agentforce Service auf G2

Verankert aber veraltet ist eine eigene Art falscher Antwort. Genau deshalb ist das Training von KI auf deiner Wissensbasis ein fortlaufender Job, kein einmaliger Import, und warum eine gut gepflegte Wissensbasis sich auszahlt – weit über die KI hinaus.

Jede Antwort muss ihre Quelle zitieren

Verankerung begrenzt, was der Agent lesen kann. Quellenangaben zwingen ihn zu beweisen, dass er tatsächlich etwas gelesen hat. Wenn der Agent das konkrete Dokument oder Ticket angeben muss, auf das sich seine Antwort stützt, passieren zwei gute Dinge: Ein Prüfer kann die Antwort mit einem Klick verifizieren, und der Agent hat keinen Platz zum Verstecken, wenn er improvisiert.

Das Muster, auf das ich bestehen würde: Keine Quelle, keine Antwort. Wenn der Agent keine Textstelle nennen kann, die seine Antwort unterstützt, soll er sie nicht senden, sondern eskalieren. Ein Mitgründer eines Legal-Tech-Unternehmens, mit dem wir zusammenarbeiten, erläuterte, warum das in seiner Welt nicht verhandelbar ist: Es gibt eine feine Linie zwischen hilfreich sein und in die Rechtsberatung abgleiten, und der einzige Weg, KI an Kunden heranzulassen, war mit genauen Vorgaben zur Quellenangabe und einer transparenten Quellenangabe bei jeder Antwort. Das ist eine hohe Messlatte, aber der richtige Standard für alle – nicht nur für regulierte Branchen.

Die eesel KI-Chat-Oberfläche zeigt ein Support-Gespräch, bei dem die Antwort des Agenten in verbundenen Quellen verankert ist

Konfidenz-Schwellenwert setzen und danach routen

Das ist die wichtigste Maßnahme, und sie ist das Tor, das „vertrau mir" in einen echten Sicherheitsmechanismus verwandelt. Es ist der Unterschied zwischen einem Deflection-Tool, das man laufen lassen kann, und einem, das man ständig beaufsichtigen muss, und es lohnt sich, das richtig hinzubekommen, bevor man die Tier-1-Deflection skaliert. Der Agent soll nur automatisch antworten, wenn er sicher ist und eine Quelle hat. Alles andere wird für einen Menschen vorbereitet oder weitergeleitet.

Ein CX-Leiter bei einer DTC-Nahrungsergänzungsmittelmarke mit etwa 7.000 Gorgias-Tickets pro Monat formulierte die Logik besser als ich es könnte:

Die KI werde nie 100 % der Fragen beantworten, sagte er uns, aber wenn sie alles versuche und einem Kunden einfach „tut mir leid, ich weiß es nicht" schreibe, könne er nicht Tausende von Tickets durchgehen, um zu prüfen, ob sie gute Arbeit geleistet hat. Er brauchte eine KI, die nur die Tickets bearbeitet, bei denen sie zuversichtlich ist, und den Rest in Ruhe lässt. Das ist konfidenzbasiertes Routing in einem Satz, und es war das entscheidende Kriterium bei seiner Bewertung.

Ein Entscheidungsbaum für konfidenzbasiertes Routing: Ein eingehendes Ticket durchläuft eine Konfidenzprüfung, dann verzweigt es sich zu automatischer Antwort bei hoher Konfidenz und klarer Quelle, Entwurf für Menschen bei Unsicherheit und Weiterleitung, wenn keine Quelle gefunden wird

Die praktische Umsetzung: Lege eine Konfidenzgrenze fest, sende alles darunter als Entwurf an eine Person statt als automatische Antwort, und setze die Grenze zunächst hoch. Man kann sie immer senken, sobald man dem Agenten bei einem bestimmten Ticket-Typ vertraut. Hier zahlt sich auch gute KI-Chat-Eskalation aus, denn ein selbstsicheres „Ich hole einen Menschen" schlägt jede Mal eine selbstsichere falsche Antwort. Wenn man das mit älterer Technik vergleicht, ist das die klarste Grenzlinie zwischen einem KI-Agenten und einem regelbasierten Chatbot.

Themen absperren, die er nie anfassen darf

Einige Tickets sollten nie in die Nähe von Support-Automatisierung kommen, und das ist ein Feature, keine Einschränkung. Rückerstattungen über einem Schwellenwert, Kontolöschungen, alles Rechtliche, alles mit einem aufgebrachten Kunden mitten in einer Eskalation. Man will explizite Kontrolle, um diese Kategorien menschlich zu halten.

Das taucht ständig auf, wenn man sich anschaut, wie Leute tatsächlich deployen wollen. Ein Support-Leiter sagte uns geradeheraus, dass es bestimmte Tickets gibt, die er überhaupt nicht durch KI laufen lassen möchte. Das Hauptproblem eines eCommerce-Managers war nicht, dass die KI bei Fakten falsch lag, sondern dass sie zu viel versprach: „Hör auf, Kunden zu sagen, dass wir sie sortieren werden – du weißt das nicht." Beides ist im Grunde dieselbe Anfrage: Kontrolle darüber, was der Agent tun darf, nicht nur wie gut er es tut. Ein guter KI-Helpdesk-Agent lässt zu, diese Ausnahmen von Anfang an festzulegen und feste Leitplanken zu setzen, was er versprechen darf, ähnlich dem Ansatz von Breeze's Eskalation und Leitplanken.

Simulation auf vergangenen Tickets, bevor er mit einem einzigen Kunden spricht

Alle obigen Maßnahmen sind Hypothesen, bis man sie testet. Der Fehler, den Teams machen, ist, den Agenten live auf echten Kunden zu schalten und auf Feuer zu warten. Der weitaus sicherere Schritt ist, ihn zuerst im Simulationsmodus gegen Tausende historischer Tickets laufen zu lassen.

Eine Simulation spielt nach, wie der Agent auf Tickets geantwortet hätte, bei denen man das richtige Ergebnis bereits kennt. Man bekommt Abdeckung nach Thema, sieht genau, wo er halluziniert oder eskaliert hätte, und behebt die Wissenslücken, bevor irgendetwas davon ein echtes Gespräch berührt. Dann geht man schrittweise live, ein Ticket-Typ nach dem anderen.

Ein vierstufiger Kreislauf zum sicheren Testen einer Support-KI: Auf Tausenden vergangener Tickets laufen lassen, Abdeckung und Lücken nach Thema sehen, Wissen und Regeln anpassen, dann erneut laufen lassen und schrittweise live gehen

Das ist der Schritt, den wir nicht ohne einen Kunden ausliefern würden, denn er macht den Unterschied zwischen der Hoffnung, dass der Agent korrekt ist, und dem Wissen seiner Abdeckungszahl vor dem Launch. So hat auch das Fahrzeug-Telematik-Team, das ich erwähnt habe, sein „wir unterstützen alle Modelle"-Problem entdeckt – bevor die Kunden es taten, nicht danach.

Den Kreislauf schließen: Jede Korrektur ist Trainingsdaten

Das letzte Tor läuft nach dem Launch. Wenn ein Mensch einen Entwurf bearbeitet oder ablehnt, sollte dieses Signal direkt an den Agenten zurückfließen, damit derselbe Fehler nicht wieder auftritt. Bewerter fragen uns ständig danach, meist in einer Form wie „trackt ihr eigentlich, wenn ich eine Antwort genehmige oder ablehne?" Die Antwort sollte immer Ja sein, denn ein Agent, der aus Korrekturen lernt, wird jede Woche genauer, und einer, der es nicht tut, macht am Freitag dieselbe Halluzination, die man am Montag erkannt hat. Kombiniere das mit regelmäßiger Bewertung der Agentenleistung, und man hat ein System, das sich mit der Zeit verbessert statt zu driften.

Wie man erkennt, dass es wirklich funktioniert

Leitplanken, die man nicht misst, sind nur gute Absichten. Einige Kennzahlen zeigen, ob der Agent ehrlich ist:

Containment- oder Lösungsrate bei den Tickets, auf die er tatsächlich geantwortet hat. Hohe Lösungsrate bei niedriger Eskalation ist gut. Hohe Lösungsrate bei steigender Wiedereröffnungsrate bedeutet, dass er selbstsicher Dinge abschließt, die er nicht sollte. Hier ist, wie man Containment-Rate und Eskalationsqualität zusammen betrachtet statt isoliert.
Eskalationsrate nach Thema. Ein gesunder Agent eskaliert mehr bei mehrdeutigen Kategorien und weniger bei einfachen. Wenn die Eskalation bei allem flach ist, tut der Konfidenz-Schwellenwert wahrscheinlich nichts.
Wiedereröffnungen und CSAT bei KI-bearbeiteten Tickets gegenüber menschlich bearbeiteten, als Teil der breiteren KI-Kundenservice-Metriken.

Das eesel KI-Dashboard zeigt Zendesk-Ticket-Aktivität und Lösungsmetriken

Der Sinn dieser Beobachtung ist, den Moment zu finden, in dem Konfidenz die Genauigkeit überholt hat, und den Schwellenwert zurückzudrehen. Richtig gemacht ist die „Ich weiß es nicht"-Rate des Agenten ein Feature, auf das man stolz ist, nicht eines, das man verbergen möchte.

eesel ausprobieren

Ich bin befangen, weil ich dabei helfe, es zu entwickeln, aber das ist genau die Konfiguration, auf die der eesel KI-Helpdesk-Agent ausgelegt ist. Er lernt am ersten Tag aus deinen vergangenen Tickets und Hilfedokumenten, zitiert seine Quellen und verwendet konfidenzbasiertes Routing, sodass er nur automatisch antwortet, wenn er sicher ist, und den Rest still deinem Team übergibt. Das Feature, auf das ich als erstes hinweisen würde, ist die Simulation: Man kann ihn über Tausende historischer Tickets laufen lassen und seine echte Abdeckung und Genauigkeit sehen, bevor ein einziger Kunde involviert ist, statt es live herauszufinden.

Diese Vorsicht zahlt sich aus. Für einen Logistik-Kunden haben wir im ersten Monat 73 % ihrer Tier-1-Anfragen gelöst (eesel KI-Helpdesk-Agent), und das funktioniert, weil der Agent die Tickets, die er nicht anfassen sollte, in Ruhe lässt. Er lässt sich in Zendesk, Freshdesk, Gorgias und weitere integrieren, und mit nutzungsbasierter Preisgestaltung zahlt man keine Kosten pro Nutzer, um einen Menschen in der Schleife zu halten. Man kann es kostenlos ausprobieren und in der Simulation beginnen.

Die eesel KI-Helpdesk-Dashboard-Übersicht

Häufig gestellte Fragen

Warum halluziniert mein KI-Support-Agent überhaupt?

Ein Sprachmodell sagt die wahrscheinlichsten nächsten Wörter voraus. Wenn ihm keine echte Quelle für eine Antwort vorliegt, produziert es dennoch eine überzeugend klingende. Die Lösung ist kein besseres Modell, sondern die Verankerung des Agenten in eigenen Dokumenten und vergangenen Tickets sowie die Pflicht, diese zu zitieren. Erfahre, wie man KI auf einer Wissensbasis trainiert und warum ein KI-Wissensbasis-Chatbot einem allgemeinen Modell überlegen ist.

Kann man einen KI-Support-Agenten vollständig vor Halluzinationen schützen?

Nein, und wer null Halluzinationen verspricht, übertreibt. Was man tun kann, ist zu verhindern, dass eine falsche Antwort einen Kunden erreicht, indem man Fälle mit geringer Konfidenz an einen Menschen weiterleitet. Das ist der Kerngedanke hinter KI-Chat-Eskalation und einer sauberen Eskalationsübergabe.

Was ist konfidenzbasiertes Routing bei einem KI-Support-Agenten?

Das bedeutet, der Agent antwortet nur automatisch, wenn er sicher ist und eine Quelle hat, und übergibt alles andere an eine Person, statt zu raten. Das ist die wichtigste Schutzmaßnahme gegen Halluzinationen. Mehr dazu in unserem Leitfaden zur Tier-1-Support-Deflection und dem eesel KI-Helpdesk-Agenten.

Wie teste ich einen KI-Support-Agenten, bevor er Kunden antwortet?

Führe ihn im Simulationsmodus gegen Tausende deiner vergangenen Tickets aus, damit du genau siehst, wie er geantwortet hätte, Lücken findest und sie vor dem Go-live behebst. Ergänze das mit laufenden KI-Kundenservice-Metriken wie Containment-Rate und Eskalationsqualität.

Was kostet es, einen KI-Support-Agenten sicher zu betreiben?

Mit eesels Preismodell zahlst du pro gelöstem Vorgang ohne Kosten pro Nutzer, sodass ein vorsichtiger, konfidenzgesteuerter Rollout nicht mehr kostet als ein aggressiver. Wenn überhaupt, kostet er weniger, weil du nicht für die Behebung falscher Antworten zahlst. Hier erfährst du mehr über Kosteneinsparungen im KI-Kundensupport.

Reicht es aus, einen KI-Agenten in meiner Wissensbasis zu verankern, um Halluzinationen zu stoppen?

Das ist der größte Einzelhebel, aber nicht die vollständige Lösung. Verankerung begrenzt, was der Agent lesen kann; du brauchst dennoch Quellenangaben als Nachweis und konfidenzbasiertes Routing, damit er eskaliert, wenn er es nicht weiß. Eine veraltete Wissensbasis führt außerdem zu selbstsicheren, aber veralteten Antworten, also halte sie aktuell. Lies mehr über die Vorteile einer KI-gestützten Wissensbasis und wie man KI auf der Wissensbasis trainiert.

Welche Ticket-Typen sollte ich von einem KI-Support-Agenten fernhalten?

Alles Heikle oder Risikobehaftete: große Rückerstattungen, Kontolöschungen, rechtliche Fragen und aufgebrachte Kunden mitten in einer Eskalation. Gute KI-Helpdesk-Agenten-Setups erlauben es, diese Kategorien auszuschließen, damit sie menschlich bleiben, mit sauberer Eskalation für alles, was die KI nicht anfassen sollte.

Stellen Sie Ihren KI-Teamkollegen ein

In Minuten eingerichtet. Keine Kreditkarte erforderlich.

Kostenlos testen Demo buchen

Share this article

Article by

Alicia Kirana Utomo

Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.