Was kann Claude Fable 5? Ein Leitfaden Funktion für Funktion

Geschrieben von

Riellvriany Indriawan

Geprüft von

Katelin Teen

Zuletzt bearbeitet June 17, 2026

Expertengeprüft

Redaktionelle Illustration für einen Leitfaden dazu, was Claude Fable 5, Anthropics leistungsstärkstes KI-Modell, kann

Kurz gesagt

Claude Fable 5 ist Anthropics leistungsstärkstes Modell, und die kurze Antwort auf „Was kann es?" lautet: echte, mehrstufige Arbeit, die tagelang läuft, ohne dass ein Mensch bei jedem Schritt neu nachfragen muss. Es plant, schreibt und liefert Code aus, liest riesige Dokumente, delegiert an Sub-Agenten und prüft seine eigene Ausgabe. In Anthropics eigenen Benchmarks ist es das stärkste Modell, das die Öffentlichkeit nutzen kann, und frühe Tester nennen es das beste verfügbare Coding-Modell.

Zwei ehrliche Einschränkungen stehen daneben. Es ist langsam und teuer, mit 10 $ pro Million Input-Tokens und 50 $ pro Million Output, doppelt so viel wie Opus 4.8. Und es antwortet nicht immer mit voller Stärke: Eine Sicherheitsschicht leitet manche Prompts unbemerkt an ein schwächeres Modell weiter.

Wenn Sie ein Support- oder Operations-Team leiten, ist die praktische Erkenntnis: Ein so leistungsfähiges Modell ist der Motor, nicht das Auto. Was Sie tatsächlich einsetzen, ist ein KI-Agent, der darauf aufbaut, mit dem Wissen, den Leitplanken und dem Testen, die das rohe Modell nicht enthält.

Was kann Claude Fable 5 also wirklich?

Claude Fable 5 ist Anthropics fünfte Modellgeneration und eine neue „Mythos-Klasse", die über Claude Opus 4.8 angesiedelt ist, das wiederum über Sonnet 4.6 steht. Wenn Sie unseren Claude-Überblick gelesen haben: Das ist die neue Obergrenze. Es wurde am 9. Juni 2026 veröffentlicht und läuft auf claude.ai, der Claude API, Claude Code, AWS und Microsoft Foundry.

Aber Specs und Tiers sind nicht wirklich das, was Menschen meinen, wenn sie fragen, was es kann. Sie meinen: Welche Arbeit kann ich ihm übergeben und darauf vertrauen, dass es sie zu Ende bringt? Hier ist die ehrliche Übersicht seiner konkreten Fähigkeiten, dann gehen wir jede einzeln durch.

Eine Übersicht dessen, was Claude Fable 5 kann: tagelang unbeaufsichtigt arbeiten, Code schreiben und ausliefern, Dokumente mit 1 Mio. Tokens lesen, die eigene Arbeit prüfen und Sub-Agenten parallel ausführen

Es arbeitet tagelang autonom und prüft dann seine eigene Arbeit

Das ist die Fähigkeit, um die Anthropic Fable 5 tatsächlich gebaut hat, und es ist die, die am meisten zählt. Lassen Sie es in einem Harness wie Claude Code oder Claude Managed Agents laufen, und in Anthropics Worten kann es „tagelang am Stück arbeiten: über Phasen hinweg planen, an Sub-Agenten delegieren und seine eigene Arbeit prüfen."

Diese Schleife – planen, dann delegieren, dann arbeiten, dann prüfen – ist der Teil, der wirklich neu ist. Frühere Modelle verloren bei langen, mehrstufigen Aufgaben den Faden; dieses behält den Überblick und korrigiert entscheidend seine eigenen Hausaufgaben. Anthropic beschreibt es als „gründlich, proaktiv und prüft seine eigene Arbeit," und die Cloud-Anbieter beschreiben eine eingebaute Plan-, Prüf-, Verfeinerungs-Schleife. Selbstkorrektur ist der Unterschied zwischen einem Agenten, den man babysitten muss, und einem, den man über Nacht laufen lassen kann.

Wie Claude Fable 5 als Long-Horizon-Agent arbeitet: über Phasen hinweg planen, an Sub-Agenten delegieren, die Arbeit erledigen, die eigene Arbeit prüfen und dann in einer Schleife bis zur Fertigstellung

Die Größenordnung, die das ermöglicht, ist real. In frühen Tests richtete Stripe Fable 5 auf eine 50 Millionen Zeilen umfassende Ruby-Codebasis und führte an einem Tag eine Migration über das gesamte Projekt durch, und Community-Berichte beschreiben Sessions mit bis zu 1.000 parallelen Sub-Agenten für Arbeit in Codebasis-Größe. Diese Fähigkeit, ein Ziel festzuhalten, es in Phasen zu zerlegen und sich durchzuarbeiten, ist genau das, was einen KI-Agenten von einem regelbasierten Chatbot unterscheidet: Der eine bringt die Aufgabe zu Ende, der andere wartet auf die nächste Anweisung.

Es schreibt und liefert produktionsreifen Code aus

Das Spektakulärste, was Claude Fable 5 kann, ist Software zu schreiben, die tatsächlich funktioniert. In Anthropics veröffentlichtem Vergleich erreicht es 80,3 % auf SWE-Bench Pro beim agentischen Coding, gegenüber 69,2 % für Opus 4.8, mit GPT 5.5 bei 58,6 % und Gemini 3.1 Pro bei 54,2 %. Beim härteren FrontierCode-(Diamond-)Benchmark verdoppelt es Opus mehr als und springt von 13,4 % auf 29,3 %. CNBC berichtete von einem Abstand von mehr als 10 % über Opus 4.8 bei einigen Tests.

Anthropics Benchmark-Tabelle, die Claude Mythos 5 / Fable 5 mit Claude Opus 4.8, GPT 5.5 und Gemini 3.1 Pro vergleicht, entnommen von Anthropic

Zahlen sind eine Sache; ein ganzer Tag echter Arbeit eine andere. Der Entwickler Simon Willison richtete Fable auf seine Open-Source-LLM-Library, und es identifizierte und implementierte vier separate Fixes und lieferte dann ein neues Release aus, das fast vollständig vom Modell geschrieben wurde. Sein Urteil fasst die Produktivitätsobergrenze zusammen:

„Ich bin wirklich beeindruckt von der Qualität des API-Designs, der Tests, des Codes und der Dokumentation, die Fable dafür zusammengestellt hat. Ich habe heute mehrere Stunden daran gearbeitet, aber es fühlt sich an wie mehrere Tage Arbeit." - Simon Willison

Er war nicht allein. Andrej Karpathy nannte es einen Sprung, der einen Major-Version-Bump wert ist, und ein Entwickler, der den FrontierCode-Benchmark laufen ließ, postete eine eindrucksvolle Entwicklung: Opus 4.7 bei 5,2 %, Opus 4.8 bei 13,4 %, Fable 5 bei 29,3 %. Wenn Sie abwägen, wo es im Vergleich zum Rest des Feldes steht, sind unsere Übersicht der besten KI-Coding-Assistenten und der besten Claude-KI-Entwickler-Tools eine gute nächste Lektüre.

Es liest die langen, unübersichtlichen Dokumente, die Sie bereits haben

Viel Geschäftsarbeit ist kein Code, sondern Dokumente, und hier verdient sich das Kontextfenster von 1.000.000 Tokens seinen Lohn. Fable 5 „versteht Diagramme, Charts und Tabellen, die in Dateien und PDFs verschachtelt sind," was Anthropic rund um Finanz-, Rechts- und Analyse-Arbeit positioniert, und es gibt keinen Preisaufschlag für das Füllen dieses vollen Kontexts.

Der konkrete Beweis kam von einem Hacker-News-Nutzer, der ihm ein 50-seitiges PDF mit dichten, miteinander verbundenen Spezifikationen übergab und eine korrekte Aufschlüsselung dessen zurückbekam, was erledigt, teilweise erledigt und fehlend war:

„Ich gab ihm ein 50-seitiges PDF mit ziemlich dichten und miteinander verbundenen Spezifikationen und fragte, welche umgesetzt worden waren... es identifizierte korrekt, was erledigt, was teilweise erledigt und was fehlend war." - Hacker-News-Kommentator

Für jedes Team, das auf einem Stapel von Verträgen, Richtliniendokumenten oder einer weitläufigen Wissensdatenbank sitzt, ist das im Tagesgeschäft nützlicher als ein weiterer Punkt auf einem Coding-Leaderboard. Es ist auch derselbe Muskel, den ein Support-Agent nutzt, wenn er Ihre Hilfe-Dokumente und vergangenen Tickets liest, um einem Kunden zu antworten – nur auf interne Dokumente gerichtet.

Was all das kostet

Hier ist der Teil, der die Begeisterung dämpft. Alles oben Genannte läuft zu Frontier-Tool-Preisen: 10 $ pro Million Input-Tokens und 50 $ pro Million Output, genau doppelt so viel wie Opus 4.8. Gecachte Input-Tokens erhalten einen 90-%-Rabatt, und es gibt einen 1,1-fachen Aufschlag für US-only-Inferenz, aber der Schlagzeilen-Tarif ist das, was Sie spüren werden. Wie sich Fable 5 gegen den Rest der Reihe schlägt, schlüsselt unser Claude-Pricing-Leitfaden für jede Stufe auf, und der Claude-Pro-Plan ist der Ort, an dem die meisten Einzelpersonen ihm zuerst begegnen.

Spezifikation	Claude Fable 5
Veröffentlicht	9. Juni 2026
Modellklasse	„Mythos-Klasse", eine Stufe über Opus 4.8
Kontextfenster	1.000.000 Tokens
Max. Output	128.000 Tokens
Wissensstand	Januar 2026
Input-Preis	10 $ / 1 Mio. Tokens (1 $ gecacht)
Output-Preis	50 $ / 1 Mio. Tokens
Long-Context-Aufschlag	Keiner

Wie viel Sie tatsächlich ausgeben, hängt fast ausschließlich davon ab, wie intensiv Sie es denken lassen. Simon Willison ließ seinen Test „zeichne einen Pelikan auf einem Fahrrad" über alle fünf Denkaufwand-Stufen laufen, und die Kosten für ein einzelnes Bild reichten von unter 10 Cent bei „low" bis etwa 72 Cent bei „max". Die Aufwandsstufe ist ein Regler, den Sie einstellen, und sie ist der Haupthebel für Ihre Rechnung.

Der Denkaufwand-Regler von Claude Fable 5: Dieselbe Aufgabe kostet etwa 10 Cent bei niedrigem Aufwand und etwa 72 Cent bei maximalem Aufwand, eine 7-fache Schwankung, die Sie steuern

Die Rechnung läuft am oberen Ende schnell auf. Willison verfolgte einen einzigen Testtag mit 110,42 $ Token-Ausgaben. Aber es gibt ein echtes Gegengewicht: Canvas Evaluations-Leiter stellte fest, dass Fable etwa die Hälfte der Tokens von Opus 4.8 in ihren internen agentischen Harnesses verbrauchte, sodass ein klügeres Modell, das in weniger Schritten fertig wird, bei ungefähr denselben realen Kosten landen kann. Die Lektion ist nicht „Fable ist unbezahlbar", sondern dass Ihre Kosten vollständig davon abhängen, wie Sie es betreiben.

Was Claude Fable 5 nicht tun wird

Fähigkeiten schneiden in beide Richtungen, und es gibt eine Sache, die Fable 5 bewusst nicht mit voller Stärke tun wird. Bei Prompts zu Cybersicherheit, Biologie, Chemie und Modell-Distillation erkennt eine neue Generation von Klassifikatoren das Thema und leitet Ihre Antwort stattdessen an Opus 4.8 weiter, und Sie werden darüber informiert. Anthropic sagt, mindestens 95 % der Sessions lösen nie einen Fallback aus.

Der Haken sind die False Positives. Entwickler berichteten, mitten in der Session bei völlig harmloser Arbeit auf das schwächere Modell umgeschaltet worden zu sein, darunter ein Nutzer, dem ein grundlegendes Flüssigkeits-Handhabungs-Protokoll verweigert wurde, an dem nichts Riskantes war. Der KI-Politik-Autor Nathan Lambert wies auf einen zweiten, leiseren Mechanismus für Prompts hin, die wie Frontier-KI-Forschung aussehen, bei dem das Modell weniger effektiv werden kann, ohne es Ihnen zu sagen. Der praktische Rat: Wenn Ihre Arbeit in einer technischen Vertical liegt, testen Sie, bevor Sie sich darauf festlegen.

Was all das bedeutet, wenn Sie ein Support-Team leiten

Hier sind wir zu Hause, also lassen Sie uns konkret werden. Sollte ein Support-Verantwortlicher angesichts all dessen, was Fable 5 kann, es überstürzt in seinen Helpdesk einbinden? Meistens nicht so sehr, wie der Hype suggeriert.

Hier ist die unbequeme Wahrheit über KI für den Kundenservice: Bei Tier-1-Tickets ist das Modell selten der Engpass. Die meisten Teams, die nach Kundenservice-Automatisierung suchen, überbewerten leise, welches Modell darunter sitzt. Ein gut geerdetes Opus 4.8 oder sogar Sonnet 4.6 beantwortet bereits die überwältigende Mehrheit der Fragen wie „Wo ist meine Bestellung", „Wie setze ich mein Passwort zurück", „Was ist Ihre Rückerstattungsrichtlinie" korrekt. Das Doppelte für Fable 5 zu zahlen, um sie zu beantworten, ist, als würde man einen Formel-1-Wagen für die Fahrt zur Schule mieten. Was tatsächlich darüber entscheidet, ob Ihr KI-Helpdesk-Agent funktioniert, ist alles, was um das Modell herum gewickelt ist. Es ist dasselbe Muster, das die starken Tools in jeder Übersicht zu KI-Helpdesk-Software von den vergesslichen unterscheidet.

Was ein rohes Modell in einen kundenfähigen Support-Agenten verwandelt: Das Frontier-Modell ist der Motor, mit Wissen, Konfidenz-Routing und Integrationen, die darauf gestapelt sind

Drei Dinge sind wichtiger als die Modellstufe. Erstens: Kennt es Ihr Geschäft? Der Gewinn kommt vom Training auf Ihren vergangenen Tickets und Hilfe-Dokumenten, nicht von einem klügeren Basismodell. Zweitens: Weiß es, wann es schweigen soll? Rohe Modelle antworten selbstbewusst, auch wenn sie falsch liegen, was genau der Grund ist, warum Chatbots schlechte Antworten geben; Produktions-Agenten brauchen konfidenzbasiertes Routing, das Herzstück jedes guten Ticket-Triage-Setups, damit Tickets mit niedriger Konfidenz entworfen oder eskaliert und nicht automatisch gesendet werden. Wie es ein CX-Leiter eines DTC-Nahrungsergänzungsmittel-Anbieters in einem Kundeninterview formulierte: Die KI wird nie 100 % der Fragen beantworten, also wollen sie eigentlich einen Agenten, der nur die Tickets bearbeitet, bei denen er sich sicher ist, und den Rest in Ruhe lässt. Das ist eine Produktfähigkeit, keine Modellfähigkeit.

Drittens: Können Sie ihm vertrauen, bevor es live geht? Das führt direkt zur Build-versus-Buy-Frage, die ständig aufkommt: „Anthropic hat gerade ein unglaubliches Modell ausgeliefert, warum nicht unseren Support-Bot auf der API bauen?" Können Sie. Es ist auch ein größeres Projekt, als es aussieht, denn das Modell gibt Ihnen Intelligenz, aber nicht die Helpdesk-Anbindung, die Leitplanken, die Simulationsumgebung oder das Reporting. Mehrere technische Teams, die es versuchten, stiegen stattdessen auf Kaufen um:

„Wir hätten versuchen können, unsere eigene LLM-Anwendung zu schreiben, aber wir wollten unsere Zeit nicht darin investieren. Wir wollten etwas, das wir nicht warten müssen." - Karel, GENERAL BYTES

Ein Frontier-Modell ist die unterste Schicht des Stacks, nicht der ganze Stack. Wenn Ihr Kernprodukt KI ist, bauen Sie. Wenn es etwas anderes ist und Sie einfach nur Tickets gut beantwortet haben wollen, ist der Kauf der Schichten über dem Modell schneller, günstiger und weniger fragil – dieselbe Logik, die hinter der Wahl jeder KI für Ticket-Automatisierung gegenüber einem selbstgebauten Skript steckt.

Probieren Sie eesel aus

eesel AI ist die Schicht, die auf Frontier-Modellen wie Claude aufsitzt, sodass Sie die Fähigkeit ohne das Engineering-Projekt bekommen. Es lässt sich in Ihren bestehenden Helpdesk einbinden (Zendesk, Freshdesk, HubSpot, Gorgias und über 100 Integrationen), lernt am ersten Tag aus Ihren vergangenen Tickets und Hilfe-Dokumenten und antwortet über Triage, Entwurf und Lösung hinweg.

Übersicht des eesel-AI-Helpdesk-Dashboards, das zeigt, wie es sich mit Ihren bestehenden Tools verbindet und Support-Tickets löst

Das Unterscheidungsmerkmal ist der Teil, den Fable 5 Ihnen allein nicht geben kann: ein Simulationsmodus, der den Agenten gegen Tausende Ihrer vergangenen Tickets laufen lässt, sodass Sie genau sehen, wie er reagiert hätte und wie hoch Ihre Lösungsrate wäre, bevor ein einziger Kunde mit ihm spricht. So erreichte Gridwise im ersten Monat eine Lösungsquote von 73 % der Tier-1-Anfragen. Und weil das Pricing nutzungsbasiert bei 0,40 $ pro gelöstem Ticket ohne Pro-Platz-Gebühren liegt, zahlen Sie für Ergebnisse, nicht für Tokens, die Sie nicht vorhersagen können. Sie können eesel kostenlos mit 50 $ Nutzungsguthaben und ohne Kreditkarte ausprobieren.

Häufig gestellte Fragen

Was kann Claude Fable 5, was ältere Modelle nicht konnten?

Das Wichtigste, was Claude Fable 5 kann, ist lange, mehrstufige Arbeit durchzuhalten: Anthropic sagt, es könne tagelang arbeiten, über Phasen hinweg planen, an Sub-Agenten delegieren und seine eigene Arbeit prüfen, wo frühere Modelle aufgaben. Es führt außerdem die agentischen Coding-Benchmarks an und liest Dokumente mit 1 Mio. Tokens. Wenn Sie diese Fähigkeit auf Support-Tickets richten möchten, ist genau dafür ein KI-Helpdesk-Agent gemacht.

Kann Claude Fable 5 selbstständig Code schreiben und ausführen?

Ja. Es erreicht 80,3 % auf SWE-Bench Pro beim agentischen Coding, und der Entwickler Simon Willison ließ es an einem Nachmittag fast ein ganzes Open-Source-Library-Release schreiben. Für einen breiteren Überblick über das Feld lesen Sie unsere Übersicht der besten KI-Coding-Assistenten.

Kann Claude Fable 5 Kundensupport-Fragen bearbeiten?

Es kann sie beantworten, aber man möchte selten ein rohes Frontier-Modell direkt an eine Warteschlange anschließen. Das Modell ist bei Tier-1-Tickets selten der Engpass; Grounding und Routing entscheiden, ob Antworten richtig sind. Eine Plattform wie eesel AI ergänzt das Wissen, das Konfidenz-Routing und das Testen, das ein Modell allein nicht bietet.

Wie viel kostet der Betrieb von Claude Fable 5?

Claude Fable 5 kostet 10 $ pro Million Input-Tokens und 50 $ pro Million Output-Tokens, doppelt so viel wie Opus 4.8, und es gibt keinen Aufpreis für die Nutzung des vollen Kontexts. Wenn Sie lieber pro Ergebnis als pro Token zahlen, beginnt das nutzungsbasierte Pricing von eesel bei 0,40 $ pro gelöstem Ticket.

Was kann Claude Fable 5 nicht?

Es antwortet nicht immer mit voller Stärke: Bei Prompts zu Cybersicherheit, Biologie und Chemie leiten seine Sicherheitsklassifikatoren die Antwort zurück an Opus 4.8, und auch manche harmlose technische Arbeit wird erfasst. Es verwaltet außerdem nicht Ihren Helpdesk, Ihre Leitplanken oder Ihr Reporting; das ist die Aufgabe einer Schicht wie eines KI-Agenten, der darauf aufbaut.

Stellen Sie Ihren KI-Teamkollegen ein

In Minuten eingerichtet. Keine Kreditkarte erforderlich.

Kostenlos testen Demo buchen

Share this article

Article by

Riellvriany Indriawan

Riell is a designer and writer at eesel AI with about two years of experience researching CX platforms, AI chatbots, and helpdesk software. She combines her design background with a sharp eye for how these tools actually look and feel in practice — making her comparisons unusually visual and user-focused.