Zendesk KI-Agent: Schwellenwert für die Intent-Konfidenz: Ein umfassender Leitfaden

Stevia Putri
Written by

Stevia Putri

Reviewed by

Stanley Nicholas

Last edited February 26, 2026

Expert Verified

Bannerbild für Zendesk KI-Agent: Schwellenwert für die Intent-Konfidenz: Ein umfassender Leitfaden

Damit Ihr Zendesk KI-Agent präzise antwortet, reicht es nicht aus, ihn nur mit den richtigen Daten zu trainieren. Es gibt eine einzige Einstellung, die bestimmt, wie vorsichtig oder aggressiv Ihre KI vorgeht, wenn sie entscheidet, ob sie auf eine Kundenanfrage antworten soll. Diese Einstellung ist der Schwellenwert für die Intent-Konfidenz (Intent Confidence Threshold).

Stellen Sie sich das wie einen Türsteher in einem Club vor. Wenn Sie den Schwellenwert zu hoch ansetzen, kommen nur die offensichtlichsten Übereinstimmungen durch (hohe Genauigkeit, aber viele abgewiesene Kunden). Wenn Sie ihn zu niedrig ansetzen, kommt fast jeder rein (hohe Abdeckung, aber einige falsche Antworten schlüpfen durch). Das richtige Gleichgewicht wirkt sich direkt auf Ihre Automatisierungsraten, die Kundenzufriedenheit und die Supportkosten aus.

Dieser Leitfaden erklärt, wie der Schwellenwert für die Intent-Konfidenz des Zendesk KI-Agenten funktioniert, was die Standardeinstellung von 60 % wirklich bedeutet und wie Sie ihn an Ihre spezifischen Bedürfnisse anpassen können.

Was ist der Schwellenwert für die Intent-Konfidenz des Zendesk KI-Agenten?

Der Konfidenzschwellenwert ist ein Prozentsatz zwischen 0 und 100, der Ihrem KI-Agenten mitteilt, wie sicher er sein muss, bevor er eine Intent-basierte Antwort auslöst. Wenn ein Kunde eine Nachricht sendet, vergleicht die KI von Zendesk diese mit allen Intents, die Sie trainiert haben, und berechnet für jede potenzielle Übereinstimmung einen Konfidenzwert (Confidence Score).

Folgendes passiert dann:

  • Über dem Schwellenwert: Die KI löst den übereinstimmenden Intent aus, sendet die zugehörige Antwort und führt alle konfigurierten Aktionen aus.
  • Unter dem Schwellenwert: Die KI sendet stattdessen Ihre Standardantwort (in der Regel eine Eskalation an einen menschlichen Agenten oder eine Bitte um Klärung).

Zendesk setzt den Standard-Konfidenzschwellenwert auf 60 %. In der Dokumentation wird darauf hingewiesen, dass die meisten Benutzer den Sweetspot irgendwo zwischen 50 % und 70 % finden, obwohl Ihre ideale Einstellung von Ihrer Trainingsqualität, Ihrem Konversationsdesign und Ihren Geschäftsprioritäten abhängt.

Die Navigationsleiste des KI-Agenten-Einstellungsfensters mit Optionen wie Allgemeine, Sprachen und Erweiterte Einstellungen.
Die Navigationsleiste des KI-Agenten-Einstellungsfensters mit Optionen wie Allgemeine, Sprachen und Erweiterte Einstellungen.

Sie finden diese Einstellung unter Einstellungen > Allgemein > Konfidenzschwellenwert. Beachten Sie, dass es tatsächlich zwei Schwellenwerte gibt: einen für die Intent-Erkennung ("Konfidenzschwellenwert für Standardnachrichten") und einen für die Spracherkennung. Der Intent-Schwellenwert ist das, worauf sich die meisten Administratoren bei der Optimierung der Automatisierungsgenauigkeit konzentrieren.

Der Zielkonflikt zwischen Genauigkeit und Abdeckung

Bei der Anpassung Ihres Konfidenzschwellenwerts geht es im Wesentlichen darum, zwischen zwei konkurrierenden Zielen zu wählen: Genauigkeit und Abdeckung.

Höhere Schwellenwerte (70-85%) bedeuten, dass die KI nur dann antwortet, wenn sie sich der Absicht des Kunden sehr sicher ist. Dies führt zu weniger falschen Antworten, bedeutet aber auch, dass mehr Anfragen an Ihre Standardantwort oder an menschliche Agenten weitergeleitet werden. Sie sind vorsichtig, was sinnvoll ist, wenn falsche Antworten kostspielig sind (denken Sie an regulierte Branchen, komplexe Abrechnungsprobleme oder hochkarätigen technischen Support).

Niedrigere Schwellenwerte (40-55%) ermöglichen es der KI, mehr Anfragen zu beantworten, wodurch Ihre Automatisierungsrate steigt. Der Kompromiss ist ein höheres Risiko einer Fehlklassifizierung. Ein Kunde, der nach "Rücksendungen" fragt, könnte versehentlich Ihren "Rückerstattungs"-Intent auslösen und auf den falschen Weg geschickt werden. Dies funktioniert besser, wenn Ihre Konversationsabläufe nachsichtig sind oder wenn die Kosten einer falschen Antwort gering sind (wie bei einfachem FAQ-ähnlichem Support).

Zendesk bietet einen einfachen Rahmen, um über diese Wahl nachzudenken. Stellen Sie sich 100 eingehende Nachrichten vor:

Szenario mit gemischten ErgebnissenStandardszenario
50 falsche + 50 richtige Antworten100 Standardantworten
40 falsche + 60 richtige Antworten100 Standardantworten
30 falsche + 70 richtige Antworten100 Standardantworten
20 falsche + 80 richtige Antworten100 Standardantworten

Welche Spalte gefällt Ihnen besser? Die Antwort hängt davon ab, wie diese "falschen Antworten" in der Praxis tatsächlich aussehen. Wenn Ihr Konversationsdesign schnelle Wiederherstellungspfade beinhaltet ("Es klingt, als ob Sie nach Rücksendungen fragen. Stimmt das?"), dann ist eine gewisse Fehlklassifizierung tolerierbar. Wenn eine falsche Antwort Kunden in eine frustrierende Schleife schickt, sollten Sie konservativer sein.

Ausgleich von Genauigkeit und Abdeckung mit Konfidenzschwellenwerteinstellungen
Ausgleich von Genauigkeit und Abdeckung mit Konfidenzschwellenwerteinstellungen

So wählen Sie den richtigen Schwellenwert für die Intent-Konfidenz des Zendesk KI-Agenten aus

Es gibt keinen universellen "besten" Schwellenwert, aber es gibt einen besten Schwellenwert für Ihre spezifische Situation. So finden Sie ihn.

Beginnen Sie bei 60 % und passen Sie ihn basierend auf Daten an. Der Standardwert von Zendesk ist nicht willkürlich. Er basiert auf der aggregierten Leistung von Tausenden von Bereitstellungen. Beginnen Sie dort und verwenden Sie dann Ihre Konversationsprotokolle und die Konfusionsmatrix, um festzustellen, ob Sie ein Präzisionsproblem (zu viele falsche Antworten) oder ein Erinnerungsproblem (zu viele Standardantworten) haben.

Erwägen Sie, Ihren Schwellenwert zu erhöhen, wenn:

  • Sie sich in einer regulierten Branche befinden, in der falsche Informationen eine Haftung begründen
  • Ihr Produkt komplex ist und Kunden durch falsche Antworten frustriert werden
  • Ihre Konversationsabläufe keine guten Wiederherstellungspfade für Fehlklassifizierungen haben
  • Ihr KI-Agent neu ist und noch die Sprache Ihrer Kunden lernt

Erwägen Sie, Ihren Schwellenwert zu senken, wenn:

  • Ihr Konversationsdesign flexibel ist und sich von Fehlklassifizierungen erholen kann
  • Sie ein gründliches Intent-Training durchgeführt haben und Ihre Konfusionsmatrix minimale Überschneidungen aufweist
  • Sie Anfragen mit geringem Risiko bearbeiten, bei denen eine falsche Antwort leicht korrigiert werden kann
  • Sie über ausreichende Kapazität an menschlichen Agenten verfügen, um Eskalationen zu bearbeiten

Verwenden Sie bedingte Blöcke für eine differenzierte Steuerung. Anstatt einen Schwellenwert für alles festzulegen, können Sie die bedingte Logik von Zendesk verwenden, um verschiedene Antworten basierend auf dem tatsächlichen Konfidenzwert zu senden. Beispielsweise erhalten Übereinstimmungen mit hoher Konfidenz (80 %+) eine vollständig automatisierte Antwort, Übereinstimmungen mit mittlerer Konfidenz (60-79 %) erhalten eine Antwort mit einer "Hat dies Ihre Frage beantwortet?"-Prüfung und Übereinstimmungen mit niedriger Konfidenz werden sofort eskaliert.

Der Schlüssel liegt darin, Ihre Schwellenwertstrategie mit den Geschäftsergebnissen zu verbinden. Was kostet Sie eine falsche Antwort an Kundenzufriedenheit und Agentenzeit? Was kostet Sie das Senden einer Standardantwort an Automatisierungspotenzial? Ihr Schwellenwert sollte diese Berechnungen widerspiegeln.

Fehlerbehebung bei Problemen mit dem Konfidenzschwellenwert

Wenn Ihr KI-Agent nicht wie erwartet funktioniert, ist der Konfidenzschwellenwert oft die Ursache. So diagnostizieren und beheben Sie häufige Probleme.

Problem: Zu viele Standardantworten

Wenn Kunden häufig auf Ihre Ausweichantwort stoßen ("Ich bin mir nicht sicher, ob ich das verstehe" oder an Agenten eskalieren), haben Sie zwei Möglichkeiten:

  1. Senken Sie Ihren Konfidenzschwellenwert, um mehr Anfragen zu erfassen
  2. Verbessern Sie Ihr Intent-Training, damit die KI mehr Variationen der Kundensprache erkennt

Die zweite Option ist in der Regel langfristig besser. Überprüfen Sie Ihre Konversationsprotokolle auf Muster. Verwenden Kunden Phrasen, die Sie nicht trainiert haben? Gibt es Intents, die existieren sollten, aber nicht existieren? Das Hinzufügen von 20-30 neuen Ausdrücken zu Intents mit schlechter Leistung behebt das Problem oft, ohne den Schwellenwert zu berühren.

Problem: Häufige falsche Intent-Auslöser

Wenn Kunden in die falschen Konversationsabläufe geschickt werden, haben Sie die gegenteilige Herausforderung:

  1. Erhöhen Sie Ihren Konfidenzschwellenwert, um selektiver zu sein
  2. Verwenden Sie die Konfusionsmatrix, um sich überschneidende Intents zu identifizieren

Die Konfusionsmatrix ist ein visuelles Raster, das zeigt, welche Intents miteinander verwechselt werden. Dunkle Zellen außerhalb der diagonalen Linie deuten auf eine Verwechslung zwischen zwei Intents hin. Wenn "Bestellstatus" und "Versandanfrage" häufig verwechselt werden, müssen Sie sie entweder zu einem Intent zusammenführen oder jedem Intent mehr eindeutige Trainingsausdrücke hinzufügen.

Eine Visualisierung der Konfusionsmatrix, die die Genauigkeit der Intent-Erkennung und Überlappungsmuster anzeigt, wobei bestimmte Intents wie "Test-Gateway" und "Bestellstatus" auf der y-Achse beschriftet sind.
Eine Visualisierung der Konfusionsmatrix, die die Genauigkeit der Intent-Erkennung und Überlappungsmuster anzeigt, wobei bestimmte Intents wie "Test-Gateway" und "Bestellstatus" auf der y-Achse beschriftet sind.

Problem: Inkonsistente Konfidenzwerte

Manchmal erhält dieselbe Anfrage zu unterschiedlichen Zeiten unterschiedliche Konfidenzwerte. Dies deutet in der Regel auf Folgendes hin:

  • Intent-Überschneidung (die KI kann wirklich nicht erkennen, welcher Intent richtig ist)
  • Unzureichende Trainingsdaten für einen oder mehrere konkurrierende Intents
  • Ausdrücke, die sich über Intents hinweg zu ähnlich sind

Überprüfen Sie Ihre Intent-Health-Metriken. Zendesk berechnet dies als die durchschnittliche Konfidenz von Nachrichten, die einem Intent zugeordnet werden. Eine niedrige Intent-Health bedeutet, dass Sie mehr oder bessere Trainingsausdrücke benötigen. Eine hohe Intent-Health bei geringer Gesamtleistung deutet darauf hin, dass Ihr Schwellenwert möglicherweise nicht mit Ihrer Trainingsqualität übereinstimmt.

Messung der Auswirkungen von Schwellenwertänderungen

Bevor Sie Ihren Konfidenzschwellenwert anpassen, legen Sie Basis-Metriken fest. Messen Sie nach der Änderung die Auswirkungen. Folgendes sollten Sie verfolgen.

Lösungsrate: Welchen Prozentsatz der Konversationen löst Ihr KI-Agent ohne menschliches Eingreifen? Dies ist Ihre Nordstern-Metrik. Ein Schwellenwert, der zu hoch ist, beeinträchtigt diese Zahl (zu viele Eskalationen). Ein Schwellenwert, der zu niedrig ist, kann sie ebenfalls beeinträchtigen (falsche Antworten verursachen mehr Arbeit).

Eskalationsrate: Welchen Prozentsatz der Konversationen wird an menschliche Agenten übergeben? Verfolgen Sie dies nach Intent, um zu sehen, ob bestimmte Themen Probleme verursachen.

Kundenzufriedenheit (CSAT): Sind Kunden mit KI-geführten Konversationen zufrieden? Ein Schwellenwert, der zu niedrig ist, zeigt sich oft zuerst hier, da frustrierte Kunden Interaktionen schlecht bewerten.

Konversationsprotokollanalyse: Überprüfen Sie wöchentlich eine Stichprobe von Konversationen. Kategorisieren Sie die Ergebnisse als: richtiger Intent + hilfreiche Antwort, richtiger Intent + nicht hilfreiche Antwort, falscher Intent oder Standardantwort ausgelöst. Diese qualitativen Daten erklären die quantitativen Trends.

Verteilung der Konfidenzwerte: Betrachten Sie die Verteilung der Konfidenzwerte über Ihre Konversationen hinweg. Idealerweise wünschen Sie sich eine bimodale Verteilung: viele Übereinstimmungen mit hoher Konfidenz (80 %+) und viele Nicht-Übereinstimmungen mit niedriger Konfidenz (unter 40 %), mit weniger in der Mitte. Wenn sich die meisten Werte um Ihren Schwellenwert gruppieren, befinden Sie sich in der mehrdeutigen Zone, in der kleine Schwellenwertänderungen große Auswirkungen haben.

Passen Sie bei Tests von Schwellenwertänderungen diese schrittweise an (jeweils 5-10 %) und lassen Sie jede Änderung mindestens eine Woche lang laufen, um ausreichend Daten zu sammeln. Dokumentieren Sie, was Sie geändert haben und warum, damit Sie die Änderungen rückgängig machen können, wenn sich die Ergebnisse verschlechtern.

Wichtige Metriken, die bei der Optimierung von KI-Konfidenzschwellenwerten zu verfolgen sind
Wichtige Metriken, die bei der Optimierung von KI-Konfidenzschwellenwerten zu verfolgen sind

Ein komplementärer Ansatz: Testen von Schwellenwerten mit eesel AI

Hier ist die Herausforderung bei der Optimierung von Konfidenzschwellenwerten in Zendesk: Sie experimentieren mit Live-Kunden. Jede Schwellenwertanpassung sendet entweder mehr Anfragen an potenziell falsche Antworten oder eskaliert mehr Konversationen, die die KI hätte bearbeiten können. Beide Ergebnisse haben reale Kosten.

Wir haben eesel AI entwickelt, um dieses Problem zu lösen. Anstatt mit Live-Kunden zu testen, können Sie zuerst mit Ihren tatsächlichen historischen Tickets testen.

So funktioniert es: Verbinden Sie eesel AI mit Ihrem Zendesk Helpdesk und Wissensquellen (Helpcenter-Artikel, vergangene Tickets, Makros, sogar externe Dokumente wie Confluence oder Google Docs). Bevor Ihr KI-Agent jemals mit einem echten Kunden spricht, lassen Sie ihn gegen Tausende Ihrer historischen Tickets antreten. Sie erhalten eine klare Prognose der Lösungsraten, identifizieren, welche Anfragen ihn ausbremsen werden, und gewinnen Vertrauen in Ihre Konfiguration.

Dieser Simulationsansatz ergänzt die Live-Umgebung von Zendesk. Verwenden Sie eesel AI, um Ihre Intent-Struktur und Schwellenwerteinstellungen zu validieren, bevor Sie live gehen, und verwenden Sie dann die Konfusionsmatrix und die Konversationsprotokolle von Zendesk für die laufende Verfeinerung.

Wir verfolgen auch einen anderen Ansatz für Wissen. Während sich Zendesk auf Intent-basiertes Training konzentriert, lernen wir automatisch aus all Ihren vorhandenen Wissensquellen. Dies reduziert oft den Bedarf an umfangreichem manuellem Intent-Training und macht Schwellenwertentscheidungen einfacher.

Unsere Preise sind pauschal (keine Gebühren pro Lösung), was die Budgetierung bei der Skalierung Ihrer Automatisierung vorhersehbar macht. Wenn Sie KI für Ihr Supportteam in Betracht ziehen, lohnt es sich zu verstehen, wie eesel AI im Vergleich zu nativen Zendesk-Optionen abschneidet.

Der kontinuierliche Verbesserungszyklus für die Optimierung von KI-Konfidenzschwellenwerten
Der kontinuierliche Verbesserungszyklus für die Optimierung von KI-Konfidenzschwellenwerten

Optimierung des Schwellenwerts für die Intent-Konfidenz Ihres Zendesk KI-Agenten

Der Konfidenzschwellenwert ist einer der wichtigsten Hebel, um das Verhalten Ihres KI-Agenten zu steuern, aber es ist keine "Einmal einstellen und vergessen"-Konfiguration. Er erfordert fortlaufende Aufmerksamkeit, da sich Ihre Trainingsdaten verbessern und sich Ihre Geschäftsanforderungen weiterentwickeln.

Hier ist die Kurzfassung: Beginnen Sie bei 60 %, dem Zendesk-Standardwert. Überwachen Sie wöchentlich Ihre Konversationsprotokolle und die Konfusionsmatrix. Wenn Sie zu viele falsche Antworten sehen, erhöhen Sie den Schwellenwert oder verbessern Sie Ihr Intent-Training. Wenn Sie zu viele Standardantworten sehen, senken Sie den Schwellenwert oder fügen Sie Intents mit schlechter Leistung mehr Ausdrücke hinzu.

Denken Sie daran, dass der Schwellenwert nicht isoliert existiert. Er ist Teil eines kontinuierlichen Verbesserungszyklus: Trainieren Sie Ihre Intents, überprüfen Sie die Konfusionsmatrix, passen Sie Ihren Schwellenwert an, messen Sie die Ergebnisse und wiederholen Sie den Vorgang. Teams, die dies als fortlaufenden Prozess behandeln, übertreffen durchweg diejenigen, die einmal konfigurieren und weitermachen.

Wenn Sie diesen Prozess risikofreier gestalten und Konfigurationen testen möchten, bevor sie sich auf Live-Kunden auswirken, laden Sie eesel AI in Ihr Team ein. Unser Simulationsmodus ermöglicht es Ihnen, Ihren Ansatz anhand historischer Daten zu validieren, sodass Sie mit Zuversicht live gehen können.

Häufig gestellte Fragen

Der Standard-Schwellenwert beträgt 60 %. Zendesk hat diesen Wert auf der Grundlage aggregierter Leistungsdaten aus Tausenden von Bereitstellungen ausgewählt. Er stellt einen ausgewogenen Ausgangspunkt dar, der eine angemessene Automatisierungsabdeckung bietet und gleichzeitig eine akzeptable Genauigkeit für die meisten Anwendungsfälle gewährleistet. Die meisten erfolgreichen Bereitstellungen liegen letztendlich zwischen 50 % und 70 %, abhängig von der Trainingsqualität und den Geschäftsanforderungen.
Wenn Ihr Schwellenwert zu hoch ist, sehen Sie übermäßig viele Standardantworten und Eskalationen an menschliche Agenten, wobei die KI selten versucht, automatisierte Antworten zu geben. Wenn er zu niedrig ist, sehen Sie häufig falsche Intent-Auslöser, Kunden, die in falsche Konversationsabläufe geschickt werden, und sinkende Kundenzufriedenheitswerte. Überprüfen Sie Ihre Konversationsprotokolle wöchentlich, um festzustellen, welches Muster auf Ihre Situation zutrifft.
Während Zendesk einen einzigen globalen Schwellenwert für die Intent-Erkennung verwendet, können Sie mit bedingten Blöcken mit dem Parameter `confidence_score` eine differenzierte Steuerung erreichen. Auf diese Weise können Sie verschiedene Antworttypen basierend auf Konfidenzbereichen senden. Beispielsweise erhalten Übereinstimmungen mit hoher Konfidenz eine vollständige Automatisierung, Übereinstimmungen mit mittlerer Konfidenz erhalten Antworten mit Bestätigungsprüfungen und Übereinstimmungen mit niedriger Konfidenz werden sofort eskaliert.
Die Konfusionsmatrix zeigt Ihnen, welche Intents miteinander verwechselt werden, und hilft Ihnen so, herauszufinden, warum die Konfidenzwerte inkonsistent sein könnten. Wenn zwei Intents die KI häufig verwirren, werden Ausdrücke, die hoch bewertet werden sollten, niedriger bewertet, da die KI nicht zwischen ihnen unterscheiden kann. Beheben Sie zuerst die Intent-Überschneidung durch besseres Training oder Zusammenführen ähnlicher Intents, und passen Sie dann Ihren Schwellenwert an.
Verfolgen Sie die Lösungsrate (Prozentsatz der Konversationen, die ohne menschliches Eingreifen gelöst wurden), die Eskalationsrate (Prozentsatz, der an Agenten übergeben wurde), die Kundenzufriedenheitswerte für KI-geführte Konversationen und die Verteilung der Konfidenzwerte in Ihren Konversationsprotokollen. Passen Sie Ihren Schwellenwert schrittweise an (jeweils 5-10 %) und lassen Sie jede Änderung mindestens eine Woche lang laufen, um aussagekräftige Daten zu sammeln.
Zendesk bietet keinen nativen Simulationsmodus für das Testen von Schwellenwerten. Tools wie eesel AI bieten jedoch Simulationsfunktionen, mit denen Sie KI-Konfigurationen anhand historischer Tickets testen können, bevor Sie live gehen. Auf diese Weise können Sie die Lösungsraten prognostizieren und potenzielle Probleme identifizieren, ohne die Kundenerfahrung zu gefährden.

Diesen Beitrag teilen

Stevia undefined

Article by

Stevia Putri

Stevia Putri is a marketing generalist at eesel AI, where she helps turn powerful AI tools into stories that resonate. She’s driven by curiosity, clarity, and the human side of technology.