Les tarifs de xAI expliqués : le guide complet pour 2026

Q: Combien coûte l'API Grok de xAI par million de jetons ?

Le modèle phare actuel, grok-4.3 , coûte 1,25 $ par million de jetons d'entrée et 2,50 $ par million de jetons de sortie. Les entrées mises en cache tombent à 0,20 $ par million. Le modèle axé sur le code grok-build-0.1 est légèrement moins cher à 1,00 $/2,00 $ par million de jetons. Ces deux prix datent de mai 2026 et représentent une réduction significative par rapport aux tarifs de lancement de Grok 4 qui étaient de 3 $/15 $ par million en juillet 2025.

Q: Quelle est la différence entre SuperGrok et le forfait Grok gratuit ?

Les deux forfaits incluent le chat Grok , la génération d'images, la voix et la recherche en temps réel sur X/web. SuperGrok (environ 30 $/mois) ajoute des limites quotidiennes plus élevées, un accès prioritaire pendant les heures de pointe et le mode multi-agents où des agents parallèles s'attaquent simultanément à des sous-problèmes et fusionnent leur raisonnement en une réponse citée. Grok Build Beta est également inclus avec SuperGrok et X Premium+. Le forfait gratuit est limité en termes de débit mais accède par ailleurs aux mêmes fonctionnalités de base.

Q: L'API xAI propose-t-elle une réduction pour la tarification par lots (batch) ?

Oui. L' API xAI Batch réduit les coûts des jetons de 20 % à 50 % par rapport aux tarifs standard en temps réel. Le compromis est la latence de réponse : les requêtes par lots sont traitées dans les 24 heures plutôt qu'immédiatement. La réduction batch s'applique aux modèles de texte et de raisonnement ; la génération d'images et de vidéos est toujours facturée aux tarifs standard, quel que soit le mode par lots.

Écrit par

Alicia Kirana Utomo

Relu par

Katelin Teen

Dernière modification June 5, 2026

Vérifié par un expert

Illustration éditoriale des niveaux de tarification de xAI sur un fond blanc cassé chaleureux avec des accents olive sourds

L'essentiel

xAI gère deux types de tarification distincts qui ne se chevauchent pas beaucoup. Le produit grand public - Grok - est soit gratuit (avec des limites quotidiennes), soit à 30 $/mois pour SuperGrok, qui ajoute le mode multi-agents et des plafonds plus élevés. L'API est facturée au jeton sans minimum mensuel.

Le modèle phare actuel de l'API, grok-4.3, coûte 1,25 $ par million de jetons d'entrée et 2,50 $ par million de jetons de sortie - en baisse par rapport aux 3 $/15 $ lors du lancement de Grok 4 en juillet 2025. C'est le chiffre principal, mais la facture réelle dépend fortement de l'utilisation de la recherche web (5 $ pour 1 000 appels), de la voix (3 $/heure en temps réel) ou du stockage de fichiers (0,025 $/GiB/jour). Chacun de ces éléments est comptabilisé séparément et s'additionne plus vite que le seul coût des jetons.

Le niveau d'API gratuit (qui offrait 150 $/mois de crédits) a pris fin en mai 2025. Les nouveaux développeurs paient dès le premier jour. Si vous comparez xAI à des alternatives à xAI, les prix des jetons semblent compétitifs, mais les frais d'outils et de stockage modifient considérablement le coût total de possession.

Ce que xAI vend réellement

xAI est la société de recherche en IA d'Elon Musk, fondée en 2023 et surtout connue pour la famille de modèles Grok. L'entreprise gère plus d'un million d'appels API par jour avec une latence inférieure à 200 ms sur son infrastructure Colossus, et les projections de la communauté situent ses revenus autonomes à 500 millions de dollars en 2025, progressant vers 2 milliards de dollars en 2026 - bien que ces chiffres soient des estimations rapportées par la communauté et non des chiffres audités.

Le produit a deux modes : un chatbot grand public (Grok) et une API pour développeurs. La tarification de chacun est complètement différente, ce qui est la première chose qui déroute les utilisateurs.

Page de l'API xAI montrant les niveaux de tarification et les options pour les développeurs

Forfaits grand public : Gratuit et SuperGrok

Le produit grand public se trouve sur grok.com et sur iOS et Android. Les niveaux gratuit et payant incluent les mêmes fonctionnalités de base : chat Grok, intégration web et X/Twitter en temps réel, génération d'images, génération de vidéos (jusqu'à 15 secondes en 720p), conversations vocales et analyse de fichiers. La liste est étonnamment longue pour un niveau gratuit.

Ce que SuperGrok apporte, c'est de la marge de manœuvre et des capacités supplémentaires. Pour environ 30 $/mois (également inclus avec X Premium+), vous obtenez :

Des limites quotidiennes plus élevées dans toutes les catégories de fonctionnalités
Un accès prioritaire pendant les heures de pointe lorsque le niveau gratuit est en file d'attente
Le mode multi-agents - le plus grand facteur de différenciation. Plusieurs agents s'attaquent aux sous-problèmes en parallèle, chacun montre sa chaîne de raisonnement, et les résultats sont fusionnés en une seule réponse citée
Grok Build Beta pour les automatisations de code et les flux de travail en mode plan

Le forfait gratuit est assez généreux pour une utilisation occasionnelle. La question est de savoir si vous atteignez les limites. Si vous êtes un développeur testant les modèles, le niveau gratuit grand public s'épuise rapidement et l'API est presque toujours la meilleure option.

Page produit grand public Grok montrant les options de forfaits Gratuit et SuperGrok

Comparaison des niveaux grand public xAI : Gratuit vs SuperGrok

Fonctionnalité	Gratuit	SuperGrok (~30 $/mois)
Chat	Oui	Oui
Recherche Web + X en temps réel	Oui	Oui
Génération d'images	Oui	Oui
Génération de vidéos (jusqu'à 15s, 720p)	Oui	Oui
Conversations vocales	Oui	Oui
Analyse de fichiers et de PDF	Oui	Oui
Mode multi-agents	Non	Oui
Limites quotidiennes plus élevées	Non	Oui
Accès prioritaire	Non	Oui
Grok Build Beta	Non	Oui

Tarification de l'API xAI : le détail complet

L'API xAI est facturée selon cinq catégories distinctes : texte/raisonnement, images, vidéo, voix et outils. Chacune est comptabilisée séparément. Il est important de comprendre l'image globale car une charge de travail réaliste combinant des réponses textuelles avec la recherche web et la récupération de fichiers peut coûter deux à trois fois plus cher que ce que le prix du jeton seul suggère.

Détail complet de la tarification de l'API xAI par catégorie

Chat et raisonnement : grok-4.3 et grok-build-0.1

Les deux modèles de texte actuels sont grok-4.3 (le modèle phare, avec raisonnement) et grok-build-0.1 (le modèle de code, lancé le 29 mai 2026).

Modèle	Contexte	Entrée	Entrée mise en cache	Sortie
grok-4.3	1M jetons	1,25 $/1M	0,20 $/1M	2,50 $/1M
grok-4.20-multi-agent-0309	1M jetons	1,25 $/1M	0,20 $/1M	2,50 $/1M
grok-4.20-0309-reasoning	1M jetons	1,25 $/1M	0,20 $/1M	2,50 $/1M
grok-4.20-0309-non-reasoning	1M jetons	1,25 $/1M	0,20 $/1M	2,50 $/1M
grok-build-0.1	256k jetons	1,00 $/1M	0,20 $/1M	2,00 $/1M

grok-4.3 prend en charge un paramètre reasoning_effort configurable afin que vous puissiez augmenter ou diminuer le raisonnement sans changer de modèle. C'est important pour le contrôle des coûts - un développeur de la communauté a noté sur r/singularity que même avec reasoning_effort réglé sur low, le modèle pouvait toujours passer de 1 500 à 10 000 jetons de réflexion de manière inattendue. Prévoyez un budget avec une certaine marge.

grok-build-0.1 est spécifiquement entraîné pour les flux de travail de codage agentiques et possède une fenêtre de contexte de 256k - plus courte que le 1M du modèle phare mais toujours substantielle. Il est actuellement en accès anticipé.

Carte d'annonce du modèle de code grok-build-0.1

Une chose que la documentation de l'API mentionne clairement : les requêtes qui violent les directives d'utilisation de xAI sont toujours facturées. Si un appel à l'API de réponses est bloqué pour une violation avant la génération, vous êtes facturé 0,05 $ par requête, quel que soit le cas. C'est un petit montant mais il est bon de le savoir si vous exécutez des flux de travail automatisés à haut volume.

API Batch : la réduction de 20 à 50 %

L'API xAI Batch réduit les coûts des jetons de 20 % à 50 % sur les modèles de texte et de raisonnement. Le compromis : les réponses arrivent dans les 24 heures plutôt qu'en temps réel. Par rapport à l'API OpenAI Batch qui offre une réduction forfaitaire de 50 %, la plage variable de 20 à 50 % de xAI mérite d'être testée sur votre charge de travail spécifique - la réduction réelle dépend de la charge.

Si vous exécutez des pipelines d'inférence par lots, de classification ou de traitement de documents où la latence n'a pas d'importance, c'est le moyen le plus direct de réduire les coûts. La génération d'images et de vidéos n'est pas éligible à la réduction batch et reste aux tarifs standard.

Grok Imagine : images et vidéo

L'API Imagine est comptabilisée selon la taille de sortie et le niveau de qualité.

Modèle	Description	Entrée	Sortie
grok-imagine-image	Texte/image → image, standard	0,002 $/img	0,02 $/img (1K ou 2K)
grok-imagine-image-quality	Texte/image → image, haute qualité	0,01 $/img	0,05 $/img (1K), 0,07 $/img (2K)
grok-imagine-video	Texte/image/vidéo → vidéo	0,01 $/sec + 0,002 $/img	0,05 $/sec (480p), 0,07 $/sec (720p)
grok-imagine-video-1.5-preview	Image → vidéo (preview)	0,01 $/img	0,08 $/sec (480p), 0,14 $/sec (720p)

Une image standard 1K via le modèle Imagine de base coûte 0,02 $. Une vidéo de 15 secondes en 720p via le modèle 1.5 preview coûte 2,10 $ en frais de sortie plus l'entrée. Ce sont des tarifs compétitifs par rapport à Midjourney et à des services similaires, mais ils s'additionnent rapidement dans les flux de travail de production où vous générez à grande échelle.

Annonce du modèle grok-imagine-1.5 preview

API Grok Voice

L'API Voice est l'endroit où la tarification de xAI devient véritablement inhabituelle - et où le produit a un réel argument. Artificial Analysis a désigné l'agent vocal Grok comme le principal modèle de raisonnement vocal début 2026, devant les modèles audio natifs de Google et Amazon.

Mode	Coût
Agent temps réel	3,00 $/heure
Entrée texte temps réel	0,004 $/message
Synthèse vocale (TTS)	15,00 $/1M caractères
Parole vers texte, REST	0,10 $/heure
Parole vers texte, streaming	0,20 $/heure

Le tarif en temps réel de 3 $/heure est la manière dont la plupart des applications atteindront ce poste de dépense. À ce tarif, 1 000 heures de conversations vocales coûtent 3 000 $ - tenez-en compte avant de créer des fonctionnalités axées sur la voix. Comparez-le à l'API Realtime d'OpenAI lors de la finalisation de votre choix d'architecture.

Partenariat xAI et Vapi propulsant Grok Voice, tel que tiré de x.ai

Appels d'outils : le coût caché le plus important

C'est ici que les factures réelles de l'API xAI divergent fortement de l'estimation basée uniquement sur les jetons. Les outils côté serveur sont facturés par appel, en plus du coût des jetons.

Outil	Nom de l'API	Coût
Recherche Web	`web_search`	5,00 $/1k appels
Recherche X	`x_search`	5,00 $/1k appels
Exécution de code	`code_execution` / `code_interpreter`	5,00 $/1k appels
Pièces jointes	`attachment_search`	10,00 $/1k appels
Recherche de collections (RAG)	`collections_search` / `file_search`	2,50 $/1k appels
Compréhension d'images	`view_image`	Basé sur les jetons uniquement

Si votre agent effectue une recherche web à chaque tour, cela représente 5 $ pour 1 000 requêtes en plus du coût des jetons. Une charge de travail de 10 000 requêtes avec la recherche web activée à chaque tour ajoute 50 $ à la facture avant tout frais de jeton ou de stockage. La communauté l'a noté clairement : "Grok est bien moins cher et contourne les limites d'extraction de données de l'API X" - l'intégration de la recherche X est réellement différenciée, mais elle n'est pas gratuite.

Stockage

Les fichiers et les collections (RAG) sont facturés par GiB et par jour.

Ressource	Tarif
Stockage de fichiers	0,025 $/GiB/jour
Stockage de collections	0,10 $/GiB/jour
Téléchargements de fichiers	0,20 $/GiB
Téléchargements de collections	0,20 $/GiB

Le maintien des collections (recherche vectorielle) coûte quatre fois plus cher que le stockage de fichiers bruts. Si vous construisez un pipeline RAG sur xAI, cela vaut la peine de faire des projections. 100 GiB de stockage de collections coûtent 10 $/jour soit 300 $/mois en frais de stockage seuls - avant tout coût de requête.

L'historique des prix : comment nous en sommes arrivés là

L'évolution de la tarification de xAI mérite d'être connue car elle permet de mieux interpréter les chiffres actuels.

Historique des prix de l'API xAI Grok du lancement à juin 2026

Grok 4 a été lancé en juillet 2025 à 3,00 $/1M d'entrée et 15,00 $/1M de sortie - comparable à Claude Sonnet à l'époque, mais plus cher que les alternatives de commodité. xAI a ensuite introduit Grok 4 Fast à un prix radicalement moins cher de 0,20 $/1M d'entrée et 0,50 $/1M de sortie, ce qui a rendu l'API véritablement compétitive pour les charges de travail sensibles au prix.

"Grok-4-1-fast-reasoning est à 0,20 $ pour l'entrée. grok-4.3 est à 1,20 $. J'utilise uniquement Grok comme processeur visuel, donc l'augmentation des coûts ne me frappera pas si fort, mais quand même - cela ressemble autant à une décision économique qu'à une décision de 'forcer les utilisateurs à passer sur la dernière plateforme'."

-- u/slickriptide sur r/MyBoyfriendIsAI

En mai 2026, xAI a retiré huit modèles dont Grok 3, Grok 4 Fast, grok-4-1-fast-reasoning et grok-code-fast-1. Résultat : les utilisateurs qui avaient construit sur les modèles économiques Fast ont dû migrer vers grok-4.3, qui coûte 6 fois plus cher par jeton d'entrée. La tarification actuelle de 1,25 $/2,50 $ représente une réduction de 58 % par rapport au prix de lancement original de Grok 4, mais une forte augmentation pour quiconque comptait sur les alternatives de niveau Fast qui n'existent plus.

L'autre changement significatif : xAI a mis fin à son "programme de partage de données" en mai 2025, qui fournissait 150 $/mois en crédits API gratuits. Il n'existe plus de niveau d'API gratuit pour les nouveaux développeurs.

Coûts cachés à prévoir

Quelques éléments qui n'apparaissent pas de manière évidente dans les tarifs de jetons principaux :

Pics de jetons de raisonnement. grok-4.3 utilise un paramètre d'effort de raisonnement configurable, mais un effort "bas" ne garantit pas un nombre de jetons faible. Un développeur sur r/singularity a signalé que le modèle passait d'une moyenne de 1 500 jetons de réflexion à 10 000 pour la même invite sans explication. Si vous fixez des limites de coûts, prévoyez une marge d'au moins 3 à 4 fois par rapport à votre base de jetons de raisonnement attendue.

Fenêtres de retrait de modèles. Huit modèles ont été retirés avec un préavis court en mai 2026. Si vous vous fixez sur un nom de modèle versionné (ex: grok-4-0709), vous obtenez de la stabilité jusqu'à la date de retrait ; si vous utilisez l'alias (grok-4.3), vous migrez automatiquement mais pouvez rencontrer des changements de capacités inattendus. Aucune des deux options n'est évidemment plus sûre : l'une vous donne la certitude de la fin de vie, l'autre vous donne la continuité jusqu'à ce que ce ne soit plus le cas.

Appels d'outils à chaque tour. L'API est compatible avec OpenAI, ce qui facilite la migration, mais les outils d'OpenAI ne sont pas facturés de la même manière. web_search à 5 $/1k appels est un nouveau poste de dépense pour les équipes passant d'une configuration d'appel d'outils qui ne facturait pas auparavant par appel. Vérifiez votre moyenne d'appels d'outils par session avant de projeter le coût total.

Violations des directives d'utilisation. Des frais de 0,05 $ s'appliquent à toute requête interceptée pour violation des directives d'utilisation avant la génération. Pour la plupart des charges de travail légitimes, cela n'est jamais déclenché, mais pour les pipelines de modération de contenu ou les tests contradictoires, il convient de le noter.

Qui devrait payer pour quoi

Grok gratuit : Convient aux particuliers utilisant Grok comme outil de recherche, assistant d'écriture ou pour des questions-réponses occasionnelles. L'ensemble des fonctionnalités multimodales est généreux pour un coût nul. Vous atteindrez les limites quotidiennes si vous l'utilisez intensivement.

SuperGrok (~30 $/mois) : Vaut le coup si vous comptez sur le mode multi-agents pour des tâches de recherche, si vous atteignez régulièrement les limites quotidiennes du niveau gratuit ou si vous voulez Grok Build pour les automatisations de code. À 30 $ fixe, c'est comparable aux tarifs de Claude Pro et aux tarifs de ChatGPT à leurs niveaux Plus respectifs.

API xAI : Le bon choix pour les développeurs créant des applications. Les prix des jetons sont compétitifs, la compatibilité avec le SDK OpenAI signifie une faible friction de migration, et l'intégration de la recherche X est véritablement unique si vous construisez quoi que ce soit nécessitant des données sociales en temps réel. Surveillez les frais d'outils et de stockage ; c'est là que réside réellement la facture pour les charges de travail basées sur des agents.

API Batch : Le choix évident pour toute charge de travail asynchrone - traitement de documents, classification en masse, évaluation hors ligne. La réduction de 20 à 50 % est significative à grande échelle.

Azure/Oracle/Google Cloud : Si votre infrastructure est déjà dans l'un de ces clouds et que vous voulez Grok sans une relation fournisseur distincte, les routes des marketplaces cloud fonctionnent. Les tarifs varient selon le fournisseur et méritent d'être comparés aux tarifs directs de xAI avant de s'engager. Les pages sur la liste des modèles OpenAI et les tarifs de Qwen valent la peine d'être lues en parallèle pour comparer ce que les différents fournisseurs d'API facturent actuellement pour les modèles de classe "frontière".

Essayez eesel

Si vous évaluez des API d'IA pour alimenter vos flux de travail de support ou de connaissances, eesel mérite d'être examiné en plus de la tarification brute des modèles. eesel déploie des agents d'IA autonomes directement dans vos outils existants - Zendesk, Slack, Freshdesk, Shopify et plus de 100 autres - sans vous obliger à câbler vous-même les API LLM, les appels d'outils et la facturation du stockage. La tarification est basée sur les tâches : 0,40 $ par tâche régulière (ticket, réponse par chat) avec un crédit gratuit de 50 $ pour commencer. Il n'y a pas de frais de plateforme en libre-service, pas de coût par siège, et les agents s'arrêtent à votre plafond de dépenses. Pour les équipes qui veulent une résolution par l'IA sans la comptabilité par jeton, la tarification d'eesel est une comparaison plus claire à SuperGrok que les tarifs bruts de l'API.

Foire Aux Questions

Combien coûte l'API Grok de xAI par million de jetons ?

Le modèle phare actuel, grok-4.3, coûte 1,25 $ par million de jetons d'entrée et 2,50 $ par million de jetons de sortie. Les entrées mises en cache tombent à 0,20 $ par million. Le modèle axé sur le code grok-build-0.1 est légèrement moins cher à 1,00 $/2,00 $ par million de jetons. Ces deux prix datent de mai 2026 et représentent une réduction significative par rapport aux tarifs de lancement de Grok 4 qui étaient de 3 $/15 $ par million en juillet 2025.

Quelle est la différence entre SuperGrok et le forfait Grok gratuit ?

Les deux forfaits incluent le chat Grok, la génération d'images, la voix et la recherche en temps réel sur X/web. SuperGrok (environ 30 $/mois) ajoute des limites quotidiennes plus élevées, un accès prioritaire pendant les heures de pointe et le mode multi-agents où des agents parallèles s'attaquent simultanément à des sous-problèmes et fusionnent leur raisonnement en une réponse citée. Grok Build Beta est également inclus avec SuperGrok et X Premium+. Le forfait gratuit est limité en termes de débit mais accède par ailleurs aux mêmes fonctionnalités de base.

L'API xAI propose-t-elle une réduction pour la tarification par lots (batch) ?

Oui. L'API xAI Batch réduit les coûts des jetons de 20 % à 50 % par rapport aux tarifs standard en temps réel. Le compromis est la latence de réponse : les requêtes par lots sont traitées dans les 24 heures plutôt qu'immédiatement. La réduction batch s'applique aux modèles de texte et de raisonnement ; la génération d'images et de vidéos est toujours facturée aux tarifs standard, quel que soit le mode par lots.

Comment les prix de l'API xAI ont-ils évolué depuis le lancement de Grok 4 ?

De manière significative. Grok 4 a été lancé en juillet 2025 à 3,00 $/1M de jetons d'entrée et 15,00 $/1M de jetons de sortie. xAI a ensuite introduit Grok 4 Fast à 0,20 $/1M d'entrée et 0,50 $/1M de sortie avant de le retirer en mai 2026. Le modèle actuel grok-4.3 se situe à 1,25 $/2,50 $ par million de jetons - une réduction de 58 % par rapport au prix de lancement mais une augmentation par 6 pour les utilisateurs qui comptaient sur les modèles fast/budget avant leur retrait. Vous pouvez comparer cette évolution avec les alternatives à xAI pour voir où elle se situe aujourd'hui.

Puis-je accéder aux modèles Grok via des fournisseurs cloud comme Azure ou Google Cloud ?

Oui. Les modèles xAI Grok sont disponibles via Microsoft Azure AI Foundry, Oracle Cloud Infrastructure Generative AI et Google Cloud Vertex Model Garden. Les tarifs cloud varient selon le fournisseur et peuvent différer des tarifs directs de l'API xAI. L'API xAI elle-même est compatible avec OpenAI, donc migrer depuis la tarification de l'API ChatGPT ou de l'API Claude ne nécessite souvent que des modifications minimales du code.

Recrutez votre collègue IA

Configuration en quelques minutes. Pas de carte bancaire requise.

Essayer gratuitement Réserver une démo

Share this article

Article by

Alicia Kirana Utomo

Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.