
L'essentiel
xAI gère deux types de tarification distincts qui ne se chevauchent pas beaucoup. Le produit grand public - Grok - est soit gratuit (avec des limites quotidiennes), soit à 30 $/mois pour SuperGrok, qui ajoute le mode multi-agents et des plafonds plus élevés. L'API est facturée au jeton sans minimum mensuel.
Le modèle phare actuel de l'API, grok-4.3, coûte 1,25 $ par million de jetons d'entrée et 2,50 $ par million de jetons de sortie - en baisse par rapport aux 3 $/15 $ lors du lancement de Grok 4 en juillet 2025. C'est le chiffre principal, mais la facture réelle dépend fortement de l'utilisation de la recherche web (5 $ pour 1 000 appels), de la voix (3 $/heure en temps réel) ou du stockage de fichiers (0,025 $/GiB/jour). Chacun de ces éléments est comptabilisé séparément et s'additionne plus vite que le seul coût des jetons.
Le niveau d'API gratuit (qui offrait 150 $/mois de crédits) a pris fin en mai 2025. Les nouveaux développeurs paient dès le premier jour. Si vous comparez xAI à des alternatives à xAI, les prix des jetons semblent compétitifs, mais les frais d'outils et de stockage modifient considérablement le coût total de possession.
Ce que xAI vend réellement
xAI est la société de recherche en IA d'Elon Musk, fondée en 2023 et surtout connue pour la famille de modèles Grok. L'entreprise gère plus d'un million d'appels API par jour avec une latence inférieure à 200 ms sur son infrastructure Colossus, et les projections de la communauté situent ses revenus autonomes à 500 millions de dollars en 2025, progressant vers 2 milliards de dollars en 2026 - bien que ces chiffres soient des estimations rapportées par la communauté et non des chiffres audités.
Le produit a deux modes : un chatbot grand public (Grok) et une API pour développeurs. La tarification de chacun est complètement différente, ce qui est la première chose qui déroute les utilisateurs.
Forfaits grand public : Gratuit et SuperGrok
Le produit grand public se trouve sur grok.com et sur iOS et Android. Les niveaux gratuit et payant incluent les mêmes fonctionnalités de base : chat Grok, intégration web et X/Twitter en temps réel, génération d'images, génération de vidéos (jusqu'à 15 secondes en 720p), conversations vocales et analyse de fichiers. La liste est étonnamment longue pour un niveau gratuit.
Ce que SuperGrok apporte, c'est de la marge de manœuvre et des capacités supplémentaires. Pour environ 30 $/mois (également inclus avec X Premium+), vous obtenez :
- Des limites quotidiennes plus élevées dans toutes les catégories de fonctionnalités
- Un accès prioritaire pendant les heures de pointe lorsque le niveau gratuit est en file d'attente
- Le mode multi-agents - le plus grand facteur de différenciation. Plusieurs agents s'attaquent aux sous-problèmes en parallèle, chacun montre sa chaîne de raisonnement, et les résultats sont fusionnés en une seule réponse citée
- Grok Build Beta pour les automatisations de code et les flux de travail en mode plan
Le forfait gratuit est assez généreux pour une utilisation occasionnelle. La question est de savoir si vous atteignez les limites. Si vous êtes un développeur testant les modèles, le niveau gratuit grand public s'épuise rapidement et l'API est presque toujours la meilleure option.

| Fonctionnalité | Gratuit | SuperGrok (~30 $/mois) |
|---|---|---|
| Chat | Oui | Oui |
| Recherche Web + X en temps réel | Oui | Oui |
| Génération d'images | Oui | Oui |
| Génération de vidéos (jusqu'à 15s, 720p) | Oui | Oui |
| Conversations vocales | Oui | Oui |
| Analyse de fichiers et de PDF | Oui | Oui |
| Mode multi-agents | Non | Oui |
| Limites quotidiennes plus élevées | Non | Oui |
| Accès prioritaire | Non | Oui |
| Grok Build Beta | Non | Oui |
Tarification de l'API xAI : le détail complet
L'API xAI est facturée selon cinq catégories distinctes : texte/raisonnement, images, vidéo, voix et outils. Chacune est comptabilisée séparément. Il est important de comprendre l'image globale car une charge de travail réaliste combinant des réponses textuelles avec la recherche web et la récupération de fichiers peut coûter deux à trois fois plus cher que ce que le prix du jeton seul suggère.

Chat et raisonnement : grok-4.3 et grok-build-0.1
Les deux modèles de texte actuels sont grok-4.3 (le modèle phare, avec raisonnement) et grok-build-0.1 (le modèle de code, lancé le 29 mai 2026).
| Modèle | Contexte | Entrée | Entrée mise en cache | Sortie |
|---|---|---|---|---|
| grok-4.3 | 1M jetons | 1,25 $/1M | 0,20 $/1M | 2,50 $/1M |
| grok-4.20-multi-agent-0309 | 1M jetons | 1,25 $/1M | 0,20 $/1M | 2,50 $/1M |
| grok-4.20-0309-reasoning | 1M jetons | 1,25 $/1M | 0,20 $/1M | 2,50 $/1M |
| grok-4.20-0309-non-reasoning | 1M jetons | 1,25 $/1M | 0,20 $/1M | 2,50 $/1M |
| grok-build-0.1 | 256k jetons | 1,00 $/1M | 0,20 $/1M | 2,00 $/1M |
grok-4.3 prend en charge un paramètre reasoning_effort configurable afin que vous puissiez augmenter ou diminuer le raisonnement sans changer de modèle. C'est important pour le contrôle des coûts - un développeur de la communauté a noté sur r/singularity que même avec reasoning_effort réglé sur low, le modèle pouvait toujours passer de 1 500 à 10 000 jetons de réflexion de manière inattendue. Prévoyez un budget avec une certaine marge.
grok-build-0.1 est spécifiquement entraîné pour les flux de travail de codage agentiques et possède une fenêtre de contexte de 256k - plus courte que le 1M du modèle phare mais toujours substantielle. Il est actuellement en accès anticipé.

Une chose que la documentation de l'API mentionne clairement : les requêtes qui violent les directives d'utilisation de xAI sont toujours facturées. Si un appel à l'API de réponses est bloqué pour une violation avant la génération, vous êtes facturé 0,05 $ par requête, quel que soit le cas. C'est un petit montant mais il est bon de le savoir si vous exécutez des flux de travail automatisés à haut volume.
API Batch : la réduction de 20 à 50 %
L'API xAI Batch réduit les coûts des jetons de 20 % à 50 % sur les modèles de texte et de raisonnement. Le compromis : les réponses arrivent dans les 24 heures plutôt qu'en temps réel. Par rapport à l'API OpenAI Batch qui offre une réduction forfaitaire de 50 %, la plage variable de 20 à 50 % de xAI mérite d'être testée sur votre charge de travail spécifique - la réduction réelle dépend de la charge.
Si vous exécutez des pipelines d'inférence par lots, de classification ou de traitement de documents où la latence n'a pas d'importance, c'est le moyen le plus direct de réduire les coûts. La génération d'images et de vidéos n'est pas éligible à la réduction batch et reste aux tarifs standard.
Grok Imagine : images et vidéo
L'API Imagine est comptabilisée selon la taille de sortie et le niveau de qualité.
| Modèle | Description | Entrée | Sortie |
|---|---|---|---|
| grok-imagine-image | Texte/image → image, standard | 0,002 $/img | 0,02 $/img (1K ou 2K) |
| grok-imagine-image-quality | Texte/image → image, haute qualité | 0,01 $/img | 0,05 $/img (1K), 0,07 $/img (2K) |
| grok-imagine-video | Texte/image/vidéo → vidéo | 0,01 $/sec + 0,002 $/img | 0,05 $/sec (480p), 0,07 $/sec (720p) |
| grok-imagine-video-1.5-preview | Image → vidéo (preview) | 0,01 $/img | 0,08 $/sec (480p), 0,14 $/sec (720p) |
Une image standard 1K via le modèle Imagine de base coûte 0,02 $. Une vidéo de 15 secondes en 720p via le modèle 1.5 preview coûte 2,10 $ en frais de sortie plus l'entrée. Ce sont des tarifs compétitifs par rapport à Midjourney et à des services similaires, mais ils s'additionnent rapidement dans les flux de travail de production où vous générez à grande échelle.

API Grok Voice
L'API Voice est l'endroit où la tarification de xAI devient véritablement inhabituelle - et où le produit a un réel argument. Artificial Analysis a désigné l'agent vocal Grok comme le principal modèle de raisonnement vocal début 2026, devant les modèles audio natifs de Google et Amazon.
| Mode | Coût |
|---|---|
| Agent temps réel | 3,00 $/heure |
| Entrée texte temps réel | 0,004 $/message |
| Synthèse vocale (TTS) | 15,00 $/1M caractères |
| Parole vers texte, REST | 0,10 $/heure |
| Parole vers texte, streaming | 0,20 $/heure |
Le tarif en temps réel de 3 $/heure est la manière dont la plupart des applications atteindront ce poste de dépense. À ce tarif, 1 000 heures de conversations vocales coûtent 3 000 $ - tenez-en compte avant de créer des fonctionnalités axées sur la voix. Comparez-le à l'API Realtime d'OpenAI lors de la finalisation de votre choix d'architecture.

Appels d'outils : le coût caché le plus important
C'est ici que les factures réelles de l'API xAI divergent fortement de l'estimation basée uniquement sur les jetons. Les outils côté serveur sont facturés par appel, en plus du coût des jetons.
| Outil | Nom de l'API | Coût |
|---|---|---|
| Recherche Web | web_search | 5,00 $/1k appels |
| Recherche X | x_search | 5,00 $/1k appels |
| Exécution de code | code_execution / code_interpreter | 5,00 $/1k appels |
| Pièces jointes | attachment_search | 10,00 $/1k appels |
| Recherche de collections (RAG) | collections_search / file_search | 2,50 $/1k appels |
| Compréhension d'images | view_image | Basé sur les jetons uniquement |
Si votre agent effectue une recherche web à chaque tour, cela représente 5 $ pour 1 000 requêtes en plus du coût des jetons. Une charge de travail de 10 000 requêtes avec la recherche web activée à chaque tour ajoute 50 $ à la facture avant tout frais de jeton ou de stockage. La communauté l'a noté clairement : "Grok est bien moins cher et contourne les limites d'extraction de données de l'API X" - l'intégration de la recherche X est réellement différenciée, mais elle n'est pas gratuite.
Stockage
Les fichiers et les collections (RAG) sont facturés par GiB et par jour.
| Ressource | Tarif |
|---|---|
| Stockage de fichiers | 0,025 $/GiB/jour |
| Stockage de collections | 0,10 $/GiB/jour |
| Téléchargements de fichiers | 0,20 $/GiB |
| Téléchargements de collections | 0,20 $/GiB |
Le maintien des collections (recherche vectorielle) coûte quatre fois plus cher que le stockage de fichiers bruts. Si vous construisez un pipeline RAG sur xAI, cela vaut la peine de faire des projections. 100 GiB de stockage de collections coûtent 10 $/jour soit 300 $/mois en frais de stockage seuls - avant tout coût de requête.
L'historique des prix : comment nous en sommes arrivés là
L'évolution de la tarification de xAI mérite d'être connue car elle permet de mieux interpréter les chiffres actuels.

Grok 4 a été lancé en juillet 2025 à 3,00 $/1M d'entrée et 15,00 $/1M de sortie - comparable à Claude Sonnet à l'époque, mais plus cher que les alternatives de commodité. xAI a ensuite introduit Grok 4 Fast à un prix radicalement moins cher de 0,20 $/1M d'entrée et 0,50 $/1M de sortie, ce qui a rendu l'API véritablement compétitive pour les charges de travail sensibles au prix.
"Grok-4-1-fast-reasoning est à 0,20 $ pour l'entrée. grok-4.3 est à 1,20 $. J'utilise uniquement Grok comme processeur visuel, donc l'augmentation des coûts ne me frappera pas si fort, mais quand même - cela ressemble autant à une décision économique qu'à une décision de 'forcer les utilisateurs à passer sur la dernière plateforme'."
-- u/slickriptide sur r/MyBoyfriendIsAI
En mai 2026, xAI a retiré huit modèles dont Grok 3, Grok 4 Fast, grok-4-1-fast-reasoning et grok-code-fast-1. Résultat : les utilisateurs qui avaient construit sur les modèles économiques Fast ont dû migrer vers grok-4.3, qui coûte 6 fois plus cher par jeton d'entrée. La tarification actuelle de 1,25 $/2,50 $ représente une réduction de 58 % par rapport au prix de lancement original de Grok 4, mais une forte augmentation pour quiconque comptait sur les alternatives de niveau Fast qui n'existent plus.
L'autre changement significatif : xAI a mis fin à son "programme de partage de données" en mai 2025, qui fournissait 150 $/mois en crédits API gratuits. Il n'existe plus de niveau d'API gratuit pour les nouveaux développeurs.
Coûts cachés à prévoir
Quelques éléments qui n'apparaissent pas de manière évidente dans les tarifs de jetons principaux :
Pics de jetons de raisonnement. grok-4.3 utilise un paramètre d'effort de raisonnement configurable, mais un effort "bas" ne garantit pas un nombre de jetons faible. Un développeur sur r/singularity a signalé que le modèle passait d'une moyenne de 1 500 jetons de réflexion à 10 000 pour la même invite sans explication. Si vous fixez des limites de coûts, prévoyez une marge d'au moins 3 à 4 fois par rapport à votre base de jetons de raisonnement attendue.
Fenêtres de retrait de modèles. Huit modèles ont été retirés avec un préavis court en mai 2026. Si vous vous fixez sur un nom de modèle versionné (ex: grok-4-0709), vous obtenez de la stabilité jusqu'à la date de retrait ; si vous utilisez l'alias (grok-4.3), vous migrez automatiquement mais pouvez rencontrer des changements de capacités inattendus. Aucune des deux options n'est évidemment plus sûre : l'une vous donne la certitude de la fin de vie, l'autre vous donne la continuité jusqu'à ce que ce ne soit plus le cas.
Appels d'outils à chaque tour. L'API est compatible avec OpenAI, ce qui facilite la migration, mais les outils d'OpenAI ne sont pas facturés de la même manière. web_search à 5 $/1k appels est un nouveau poste de dépense pour les équipes passant d'une configuration d'appel d'outils qui ne facturait pas auparavant par appel. Vérifiez votre moyenne d'appels d'outils par session avant de projeter le coût total.
Violations des directives d'utilisation. Des frais de 0,05 $ s'appliquent à toute requête interceptée pour violation des directives d'utilisation avant la génération. Pour la plupart des charges de travail légitimes, cela n'est jamais déclenché, mais pour les pipelines de modération de contenu ou les tests contradictoires, il convient de le noter.
Qui devrait payer pour quoi
Grok gratuit : Convient aux particuliers utilisant Grok comme outil de recherche, assistant d'écriture ou pour des questions-réponses occasionnelles. L'ensemble des fonctionnalités multimodales est généreux pour un coût nul. Vous atteindrez les limites quotidiennes si vous l'utilisez intensivement.
SuperGrok (~30 $/mois) : Vaut le coup si vous comptez sur le mode multi-agents pour des tâches de recherche, si vous atteignez régulièrement les limites quotidiennes du niveau gratuit ou si vous voulez Grok Build pour les automatisations de code. À 30 $ fixe, c'est comparable aux tarifs de Claude Pro et aux tarifs de ChatGPT à leurs niveaux Plus respectifs.
API xAI : Le bon choix pour les développeurs créant des applications. Les prix des jetons sont compétitifs, la compatibilité avec le SDK OpenAI signifie une faible friction de migration, et l'intégration de la recherche X est véritablement unique si vous construisez quoi que ce soit nécessitant des données sociales en temps réel. Surveillez les frais d'outils et de stockage ; c'est là que réside réellement la facture pour les charges de travail basées sur des agents.
API Batch : Le choix évident pour toute charge de travail asynchrone - traitement de documents, classification en masse, évaluation hors ligne. La réduction de 20 à 50 % est significative à grande échelle.
Azure/Oracle/Google Cloud : Si votre infrastructure est déjà dans l'un de ces clouds et que vous voulez Grok sans une relation fournisseur distincte, les routes des marketplaces cloud fonctionnent. Les tarifs varient selon le fournisseur et méritent d'être comparés aux tarifs directs de xAI avant de s'engager. Les pages sur la liste des modèles OpenAI et les tarifs de Qwen valent la peine d'être lues en parallèle pour comparer ce que les différents fournisseurs d'API facturent actuellement pour les modèles de classe "frontière".
Essayez eesel
Si vous évaluez des API d'IA pour alimenter vos flux de travail de support ou de connaissances, eesel mérite d'être examiné en plus de la tarification brute des modèles. eesel déploie des agents d'IA autonomes directement dans vos outils existants - Zendesk, Slack, Freshdesk, Shopify et plus de 100 autres - sans vous obliger à câbler vous-même les API LLM, les appels d'outils et la facturation du stockage. La tarification est basée sur les tâches : 0,40 $ par tâche régulière (ticket, réponse par chat) avec un crédit gratuit de 50 $ pour commencer. Il n'y a pas de frais de plateforme en libre-service, pas de coût par siège, et les agents s'arrêtent à votre plafond de dépenses. Pour les équipes qui veulent une résolution par l'IA sans la comptabilité par jeton, la tarification d'eesel est une comparaison plus claire à SuperGrok que les tarifs bruts de l'API.
Foire Aux Questions
Share this article

Article by
Kira
A Computer Science student deeply passionate in the fields of UI/UX Design and Web Development with a knack on writing. Fusing technical expertise with a creative flair, I'm driven to craft innovative and user-centric solutions, leveraging both coding proficiency and design sensibilities to create seamless, impactful experiences.







