
Was xAI tatsächlich verkauft
xAI ist Elon Musks KI-Forschungsunternehmen, das 2023 gegründet wurde und vor allem für die Grok-Modellfamilie bekannt ist. Das Unternehmen verarbeitet über 1 Million API-Aufrufe pro Tag mit Latenzzeiten unter 200 ms auf seiner selbst beschriebenen Colossus-Infrastruktur. Community-Prognosen schätzen den eigenständigen Umsatz für 2025 auf 500 Millionen $, mit einem Wachstum in Richtung 2 Milliarden $ im Jahr 2026 - wobei es sich hierbei um Schätzungen der Community handelt, nicht um geprüfte Zahlen.
Das Produkt hat zwei Modi: einen Consumer-Chatbot (Grok) und eine Entwickler-API. Die Preisgestaltung für beide ist komplett unterschiedlich, was oft der erste Stolperstein für Nutzer ist.
Consumer-Pläne: Free und SuperGrok
Das Endverbraucher-Produkt befindet sich unter grok.com sowie auf iOS und Android. Sowohl die kostenlose als auch die kostenpflichtige Stufe enthalten dieselben Kernfunktionen: Grok Chat, Echtzeit-Web- und X/Twitter-Integration, Bildgenerierung, Videogenerierung (bis zu 15 Sekunden bei 720p), Sprachkonversationen und Dateianalyse. Die Liste ist für eine kostenlose Stufe überraschend lang.
SuperGrok bietet zusätzliche Kapazitäten und Funktionen. Für ca. 30 $/Monat (ebenfalls enthalten in X Premium+) erhalten Sie:
- Höhere tägliche Limits über alle Funktionskategorien hinweg
- Prioritärer Zugriff während Stoßzeiten, wenn die kostenlose Stufe Warteschlangen bildet
- Multi-Agent-Modus - das größte Differenzierungsmerkmal. Mehrere Agenten bearbeiten Teilprobleme parallel, jeder zeigt seine Argumentationskette, und die Ergebnisse werden in einer einzigen Antwort mit Quellenangaben zusammengeführt
- Grok Build Beta für Coding-Automatisierungen und Plan-Modus-Workflows
Der kostenlose Plan ist großzügig genug für gelegentliche Nutzung. Die Frage ist, ob Sie an die Grenzen stoßen. Wenn Sie als Entwickler die Modelle testen, ist die kostenlose Consumer-Stufe schnell erschöpft, und die API ist fast immer der bessere Weg.

| Funktion | Free | SuperGrok (~30 $/Mo.) |
|---|---|---|
| Chat | Ja | Ja |
| Echtzeit-Web + X-Suche | Ja | Ja |
| Bildgenerierung | Ja | Ja |
| Videogenerierung (bis zu 15s, 720p) | Ja | Ja |
| Sprachkonversationen | Ja | Ja |
| Datei- und PDF-Analyse | Ja | Ja |
| Multi-Agent-Modus | Nein | Ja |
| Höhere tägliche Limits | Nein | Ja |
| Prioritärer Zugriff | Nein | Ja |
| Grok Build Beta | Nein | Ja |
xAI API-Preise: Die vollständige Aufschlüsselung
Die xAI API wird in fünf verschiedenen Kategorien abgerechnet: Text/Reasoning, Bilder, Video, Sprache und Tools. Jede wird separat gemessen. Das Gesamtbild zu verstehen ist wichtig, da ein realistischer Workload, der Textantworten mit Websuche und Dateiabruf kombiniert, zwei- bis dreimal mehr kosten kann, als der reine Token-Preis vermuten lässt.

Chat und Reasoning: grok-4.3 und grok-build-0.1
Die zwei aktuellen Textmodelle sind grok-4.3 (das Flaggschiff mit Reasoning) und grok-build-0.1 (das Coding-Modell, gestartet am 29. Mai 2026).
| Modell | Kontext | Input | Gecachter Input | Output |
|---|---|---|---|---|
| grok-4.3 | 1M Token | 1,25 $/1M | 0,20 $/1M | 2,50 $/1M |
| grok-4.20-multi-agent-0309 | 1M Token | 1,25 $/1M | 0,20 $/1M | 2,50 $/1M |
| grok-4.20-0309-reasoning | 1M Token | 1,25 $/1M | 0,20 $/1M | 2,50 $/1M |
| grok-4.20-0309-non-reasoning | 1M Token | 1,25 $/1M | 0,20 $/1M | 2,50 $/1M |
| grok-build-0.1 | 256k Token | 1,00 $/1M | 0,20 $/1M | 2,00 $/1M |
grok-4.3 unterstützt einen konfigurierbaren reasoning_effort-Parameter, sodass Sie das Reasoning hoch- oder herunterschalten können, ohne das Modell zu wechseln. Dies ist wichtig für die Kostenkontrolle - ein Community-Entwickler merkte auf r/singularity an, dass das Modell selbst bei reasoning_effort auf low unerwartet von 1.500 auf 10.000 Thinking-Token ansteigen kann. Planen Sie Ihr Budget mit etwas Puffer.
grok-build-0.1 ist speziell für agentische Coding-Workflows trainiert und hat ein Kontextfenster von 256k - kürzer als die 1M des Flaggschiffs, aber immer noch beträchtlich. Es befindet sich derzeit im Early Access.

Eines wird in den API-Docs klar erwähnt: Anfragen, die gegen die xAI-Nutzungsrichtlinien verstoßen, werden dennoch berechnet. Wenn ein Responses-API-Aufruf vor der Generierung wegen eines Verstoßes abgefangen wird, werden Ihnen unabhängig davon 0,05 $ pro Anfrage berechnet. Das ist ein kleiner Betrag, aber wissenswert, wenn Sie automatisierte Workflows mit hohem Volumen betreiben.
Batch API: Der Rabatt von 20-50 %
Die xAI Batch API reduziert die Token-Kosten für Text- und Reasoning-Modelle um 20 % bis 50 %. Der Kompromiss: Die Antworten treffen innerhalb von 24 Stunden statt in Echtzeit ein. Im Vergleich zur Batch API von OpenAI, die einen pauschalen Rabatt von 50 % bietet, ist die variable Spanne von 20-50 % bei xAI einen Test mit Ihrem spezifischen Workload wert - der tatsächliche Rabatt hängt von der Auslastung ab.
Wenn Sie Batch-Inferenz, Klassifizierung oder Dokumentenverarbeitungspipelines betreiben, bei denen Latenz keine Rolle spielt, ist dies der direkteste Weg, Kosten zu senken. Bild- und Videogenerierung qualifizieren sich nicht für den Batch-Rabatt und bleiben bei den Standardtarifen.
Grok Imagine: Bilder und Video
Die Imagine API wird nach Ausgabegröße und Qualitätsstufe abgerechnet.
| Modell | Beschreibung | Input | Output |
|---|---|---|---|
| grok-imagine-image | Text/Bild → Bild, Standard | 0,002 $/Bild | 0,02 $/Bild (1K oder 2K) |
| grok-imagine-image-quality | Text/Bild → Bild, hohe Qualität | 0,01 $/Bild | 0,05 $/Bild (1K), 0,07 $/Bild (2K) |
| grok-imagine-video | Text/Bild/Video → Video | 0,01 $/sek + 0,002 $/Bild | 0,05 $/sek (480p), 0,07 $/sek (720p) |
| grok-imagine-video-1.5-preview | Bild → Video (Vorschau) | 0,01 $/Bild | 0,08 $/sek (480p), 0,14 $/sek (720p) |
Ein standardmäßiges 1K-Bild über das Basis-Imagine-Modell kostet 0,02 $. Ein 15-sekündiges 720p-Video über das 1.5-Vorschau-Modell kostet 2,10 $ an Output-Gebühren zuzüglich des Inputs. Dies sind wettbewerbsfähige Preise im Vergleich zu Midjourney und ähnlichen Diensten, aber sie summieren sich in Produktions-Workflows, in denen Sie in großem Umfang generieren, schnell.

Grok Voice API
Bei der Voice API wird die Preisgestaltung von xAI wirklich ungewöhnlich - und hier hat das Produkt einen echten Vorteil. Artificial Analysis kürte den Grok Voice Agent Anfang 2026 zum führenden Speech-Reasoning-Modell, noch vor den nativen Audiomodellen von Google und Amazon.
| Modus | Kosten |
|---|---|
| Echtzeit-Agent | 3,00 $/Stunde |
| Echtzeit-Texteingabe | 0,004 $/Nachricht |
| Text-to-Speech (TTS) | 15,00 $/1M Zeichen |
| Speech-to-Text, REST | 0,10 $/Stunde |
| Speech-to-Text, Streaming | 0,20 $/Stunde |
Die Echtzeitrate von 3 $/Stunde ist der Punkt, an dem die meisten Anwendungen diesen Posten spüren werden. Bei dieser Rate kosten 1.000 Stunden Sprachkonversationen 3.000 $ - berücksichtigen Sie das, bevor Sie Voice-First-Funktionen entwickeln. Vergleichen Sie dies mit der Realtime API von OpenAI, wenn Sie Ihre Architekturwahl finalisieren.

Tool-Aufrufe: Die größten versteckten Kosten
Hier weichen realistische xAI API-Rechnungen stark von der reinen Token-Schätzung ab. Serverseitige Tools werden pro Aufruf abgerechnet, zusätzlich zu den Token-Kosten.
| Tool | API-Name | Kosten |
|---|---|---|
| Websuche | web_search | 5,00 $/1k Aufrufe |
| X-Suche | x_search | 5,00 $/1k Aufrufe |
| Code-Ausführung | code_execution / code_interpreter | 5,00 $/1k Aufrufe |
| Dateianhänge | attachment_search | 10,00 $/1k Aufrufe |
| Collections-Suche (RAG) | collections_search / file_search | 2,50 $/1k Aufrufe |
| Bildverständnis | view_image | Nur tokenbasiert |
Wenn Ihr Agent bei jedem Durchgang eine Websuche durchführt, sind das 5 $ pro 1.000 Anfragen zusätzlich zu den Token-Kosten. Ein Workload mit 10.000 Anfragen und aktivierter Websuche bei jedem Schritt fügt der Rechnung 50 $ hinzu, noch bevor Token- oder Speichergebühren anfallen. Die Community stellte dies klar fest: "Grok ist um Größenordnungen billiger und umgeht die X API-Datenabruflimits" - die X-Suchintegration ist ein echtes Alleinstellungsmerkmal, aber sie ist nicht kostenlos.
Speicher
Dateien und Collections (RAG) werden pro GiB und Tag abgerechnet.
| Ressource | Rate |
|---|---|
| Dateispeicher | 0,025 $/GiB/Tag |
| Collection-Speicher | 0,10 $/GiB/Tag |
| Datei-Downloads | 0,20 $/GiB |
| Collection-Downloads | 0,20 $/GiB |
Collections (Vektorsuche) kosten im Unterhalt viermal mehr als reiner Dateispeicher. Wenn Sie eine RAG-Pipeline auf xAI aufbauen, ist es wert, dies im Voraus zu kalkulieren. 100 GiB Collection-Speicher kosten 10 $/Tag oder 300 $/Monat allein an Speichergebühren - vor jeglichen Abfragekosten.
Die Preisentwicklung: Wie wir hierher gekommen sind
Die Preisentwicklung von xAI zu kennen ist hilfreich, um die aktuellen Zahlen einzuordnen.

Grok 4 startete im Juli 2025 mit 3,00 $/1M Input und 15,00 $/1M Output - vergleichbar mit Claude Sonnet zu dieser Zeit, aber teurer als Commodity-Alternativen. xAI führte dann Grok 4 Fast mit dramatisch günstigeren 0,20 $/1M Input und 0,50 $/1M Output ein, was die API für preisbewusste Workloads wirklich wettbewerbsfähig machte.
"Grok-4-1-fast-reasoning kostet 0,20 $ für Input. grok-4.3 kostet 1,20 $. Ich nutze Grok nur als visuellen Prozessor, daher wird mich die Kostensteigerung nicht so hart treffen, aber trotzdem - das fühlt sich nach einer wirtschaftlichen Entscheidung an, genauso wie nach einer Entscheidung, 'Nutzer auf die neueste Plattform zu zwingen'."
-- u/slickriptide auf r/MyBoyfriendIsAI
Im Mai 2026 stellte xAI acht Modelle ein, darunter Grok 3, Grok 4 Fast, grok-4-1-fast-reasoning und grok-code-fast-1. Der Effekt: Nutzer, die auf den günstigen Fast-Modellen aufgebaut hatten, mussten auf grok-4.3 migrieren, was 6-mal mehr pro Input-Token kostet. Die aktuelle Preisgestaltung von 1,25 $/2,50 $ stellt zwar eine Reduzierung um 58 % gegenüber dem ursprünglichen Startpreis von Grok 4 dar, ist aber ein deutlicher Preissprung für alle, die auf die Fast-Tier-Alternativen angewiesen waren, die es nicht mehr gibt.
Die andere signifikante Änderung: xAI beendete im Mai 2025 sein "Data-Sharing-Programm", das 150 $/Monat an kostenlosen API-Credits bereitgestellt hatte. Es gibt keine kostenlose API-Stufe mehr für neue Entwickler.
Versteckte Kosten, die Sie einplanen sollten
Einige Dinge, die in den Token-Raten nicht direkt ersichtlich sind:
Reasoning-Token-Spitzen. grok-4.3 verwendet einen konfigurierbaren Reasoning-Effort-Parameter, aber ein "niedriger" Effort garantiert keine niedrigen Token-Zahlen. Ein Entwickler auf r/singularity berichtete, dass das Modell bei demselben Prompt ohne Erklärung von durchschnittlich 1.500 Thinking-Token auf 10.000 sprang. Wenn Sie Kostenobergrenzen festlegen, planen Sie mindestens den 3- bis 4-fachen Puffer über Ihrer erwarteten Reasoning-Token-Basis ein.
Modell-Einstellungsfenster. Acht Modelle wurden im Mai 2026 mit kurzer Vorankündigung eingestellt. Wenn Sie sich auf einen versionierten Modellnamen (z. B. grok-4-0709) festlegen, erhalten Sie Stabilität bis zum Einstellungsdatum; wenn Sie den Alias (grok-4.3) verwenden, migrieren Sie automatisch, können aber auf unerwartete Fähigkeitsänderungen stoßen. Keines von beidem ist offensichtlich sicherer - das eine bietet Gewissheit über das Ende, das andere Kontinuität, bis es sie nicht mehr gibt.
Tool-Aufrufe bei jedem Durchgang. Die API ist OpenAI-kompatibel, was die Migration erleichtert, aber die Tools von OpenAI werden nicht auf die gleiche Weise abgerechnet. web_search für 5 $/1k Aufrufe ist ein neuer Posten für Teams, die von einem Tool-Calling-Setup kommen, das zuvor nicht pro Aufruf abgerechnet wurde. Überprüfen Sie Ihre durchschnittlichen Tool-Aufrufe pro Sitzung, bevor Sie die Gesamtkosten kalkulieren.
Verstöße gegen die Nutzungsrichtlinien. Eine Gebühr von 0,05 $ wird für jede Anfrage fällig, die vor der Generierung als Verstoß gegen die Nutzungsrichtlinien erkannt wird. Für die meisten legitimen Workloads wird dies nie ausgelöst, aber für Content-Moderations-Pipelines oder Adversarial Testing ist es erwähnenswert.
Wer für was bezahlen sollte
Kostenloses Grok: Eignet sich gut für Einzelpersonen, die Grok als Recherche-Tool, Schreibassistenten oder für gelegentliche Fragen nutzen. Das multimodale Feature-Set ist für null Kosten großzügig. Bei intensiver Nutzung werden Sie jedoch an die täglichen Limits stoßen.
SuperGrok (~30 $/Mo.): Lohnt sich, wenn Sie für Rechercheaufgaben auf den Multi-Agent-Modus angewiesen sind, regelmäßig an die täglichen Limits der kostenlosen Stufe stoßen oder Grok Build für Coding-Automatisierungen nutzen möchten. Mit pauschal 30 $ ist es vergleichbar mit den Claude Pro Preisen und ChatGPT Preisen in ihren jeweiligen Plus-Stufen.
xAI API: Die richtige Wahl für Entwickler, die Anwendungen erstellen. Die Token-Preise sind wettbewerbsfähig, die OpenAI-SDK-Kompatibilität bedeutet geringen Migrationsaufwand, und die X-Suchintegration ist wirklich einzigartig, wenn Sie etwas bauen, das soziale Echtzeitdaten benötigt. Achten Sie auf die Tool- und Speichergebühren; diese machen bei agentenbasierten Workloads den Hauptteil der Rechnung aus.
Batch API: Die offensichtliche Wahl für jeden asynchronen Workload - Dokumentenverarbeitung, Massenklassifizierung, Offline-Evaluierung. Der Rabatt von 20-50 % ist bei entsprechendem Volumen signifikant.
Azure/Oracle/Google Cloud: Wenn Ihre Infrastruktur bereits in einer dieser Clouds liegt und Sie Grok ohne eine separate Anbieterbeziehung nutzen möchten, sind die Cloud-Marktplätze der richtige Weg. Die Preise variieren je nach Anbieter und sollten vor einer Festlegung mit den direkten Raten von xAI verglichen werden. Die Seiten OpenAI Modell-Liste und Qwen Preise sind lesenswert, um zu vergleichen, was verschiedene API-Anbieter derzeit für Modelle der Spitzenklasse verlangen.
Testen Sie eesel
Wenn Sie KI-APIs evaluieren, um Ihre Support- oder Wissens-Workflows zu unterstützen, lohnt sich ein Blick auf eesel parallel zur reinen Modell-Preisgestaltung. eesel setzt autonome KI-Agenten direkt in Ihren bestehenden Tools ein - Zendesk, Slack, Freshdesk, Shopify und über 100 andere -, ohne dass Sie LLM-APIs, Tool-Aufrufe und Speicherabrechnung selbst verknüpfen müssen. Die Preisgestaltung ist aufgabenbasiert: 0,40 $ pro regulärer Aufgabe (Ticket, Chat-Antwort) mit einem kostenlosen 50 $-Guthaben zum Start. Es gibt keine Plattformgebühr für Self-Serve, keine Kosten pro Sitzplatz, und die Agenten pausieren bei Erreichen Ihres Ausgabenlimits. Für Teams, die KI-Lösungen ohne Token-Abrechnung wünschen, ist eesels Preismodell der klarere Vergleich zu SuperGrok als die reinen API-Raten.
Häufig gestellte Fragen
Share this article

Article by







