Les tarifs de xAI expliqués : le guide complet pour 2026

Kira
Écrit par

Kira

Katelin Teen
Relu par

Katelin Teen

Dernière modification June 5, 2026

Vérifié par un expert
Illustration éditoriale des niveaux de tarification de xAI sur un fond blanc cassé chaleureux avec des accents olive sourds

L'essentiel

xAI gère deux types de tarification distincts qui ne se chevauchent pas beaucoup. Le produit grand public - Grok - est soit gratuit (avec des limites quotidiennes), soit à 30 $/mois pour SuperGrok, qui ajoute le mode multi-agents et des plafonds plus élevés. L'API est facturée au jeton sans minimum mensuel.

Le modèle phare actuel de l'API, grok-4.3, coûte 1,25 $ par million de jetons d'entrée et 2,50 $ par million de jetons de sortie - en baisse par rapport aux 3 $/15 $ lors du lancement de Grok 4 en juillet 2025. C'est le chiffre principal, mais la facture réelle dépend fortement de l'utilisation de la recherche web (5 $ pour 1 000 appels), de la voix (3 $/heure en temps réel) ou du stockage de fichiers (0,025 $/GiB/jour). Chacun de ces éléments est comptabilisé séparément et s'additionne plus vite que le seul coût des jetons.

Le niveau d'API gratuit (qui offrait 150 $/mois de crédits) a pris fin en mai 2025. Les nouveaux développeurs paient dès le premier jour. Si vous comparez xAI à des alternatives à xAI, les prix des jetons semblent compétitifs, mais les frais d'outils et de stockage modifient considérablement le coût total de possession.

Ce que xAI vend réellement

xAI est la société de recherche en IA d'Elon Musk, fondée en 2023 et surtout connue pour la famille de modèles Grok. L'entreprise gère plus d'un million d'appels API par jour avec une latence inférieure à 200 ms sur son infrastructure Colossus, et les projections de la communauté situent ses revenus autonomes à 500 millions de dollars en 2025, progressant vers 2 milliards de dollars en 2026 - bien que ces chiffres soient des estimations rapportées par la communauté et non des chiffres audités.

Le produit a deux modes : un chatbot grand public (Grok) et une API pour développeurs. La tarification de chacun est complètement différente, ce qui est la première chose qui déroute les utilisateurs.

Page de l'API xAI montrant les niveaux de tarification et les options pour les développeurs

Forfaits grand public : Gratuit et SuperGrok

Le produit grand public se trouve sur grok.com et sur iOS et Android. Les niveaux gratuit et payant incluent les mêmes fonctionnalités de base : chat Grok, intégration web et X/Twitter en temps réel, génération d'images, génération de vidéos (jusqu'à 15 secondes en 720p), conversations vocales et analyse de fichiers. La liste est étonnamment longue pour un niveau gratuit.

Ce que SuperGrok apporte, c'est de la marge de manœuvre et des capacités supplémentaires. Pour environ 30 $/mois (également inclus avec X Premium+), vous obtenez :

  • Des limites quotidiennes plus élevées dans toutes les catégories de fonctionnalités
  • Un accès prioritaire pendant les heures de pointe lorsque le niveau gratuit est en file d'attente
  • Le mode multi-agents - le plus grand facteur de différenciation. Plusieurs agents s'attaquent aux sous-problèmes en parallèle, chacun montre sa chaîne de raisonnement, et les résultats sont fusionnés en une seule réponse citée
  • Grok Build Beta pour les automatisations de code et les flux de travail en mode plan

Le forfait gratuit est assez généreux pour une utilisation occasionnelle. La question est de savoir si vous atteignez les limites. Si vous êtes un développeur testant les modèles, le niveau gratuit grand public s'épuise rapidement et l'API est presque toujours la meilleure option.

Page produit grand public Grok montrant les options de forfaits Gratuit et SuperGrok
Comparaison des niveaux grand public xAI : Gratuit vs SuperGrok
Comparaison des niveaux grand public xAI : Gratuit vs SuperGrok
FonctionnalitéGratuitSuperGrok (~30 $/mois)
ChatOuiOui
Recherche Web + X en temps réelOuiOui
Génération d'imagesOuiOui
Génération de vidéos (jusqu'à 15s, 720p)OuiOui
Conversations vocalesOuiOui
Analyse de fichiers et de PDFOuiOui
Mode multi-agentsNonOui
Limites quotidiennes plus élevéesNonOui
Accès prioritaireNonOui
Grok Build BetaNonOui

Tarification de l'API xAI : le détail complet

L'API xAI est facturée selon cinq catégories distinctes : texte/raisonnement, images, vidéo, voix et outils. Chacune est comptabilisée séparément. Il est important de comprendre l'image globale car une charge de travail réaliste combinant des réponses textuelles avec la recherche web et la récupération de fichiers peut coûter deux à trois fois plus cher que ce que le prix du jeton seul suggère.

Détail complet de la tarification de l'API xAI par catégorie
Détail complet de la tarification de l'API xAI par catégorie

Chat et raisonnement : grok-4.3 et grok-build-0.1

Les deux modèles de texte actuels sont grok-4.3 (le modèle phare, avec raisonnement) et grok-build-0.1 (le modèle de code, lancé le 29 mai 2026).

ModèleContexteEntréeEntrée mise en cacheSortie
grok-4.31M jetons1,25 $/1M0,20 $/1M2,50 $/1M
grok-4.20-multi-agent-03091M jetons1,25 $/1M0,20 $/1M2,50 $/1M
grok-4.20-0309-reasoning1M jetons1,25 $/1M0,20 $/1M2,50 $/1M
grok-4.20-0309-non-reasoning1M jetons1,25 $/1M0,20 $/1M2,50 $/1M
grok-build-0.1256k jetons1,00 $/1M0,20 $/1M2,00 $/1M

grok-4.3 prend en charge un paramètre reasoning_effort configurable afin que vous puissiez augmenter ou diminuer le raisonnement sans changer de modèle. C'est important pour le contrôle des coûts - un développeur de la communauté a noté sur r/singularity que même avec reasoning_effort réglé sur low, le modèle pouvait toujours passer de 1 500 à 10 000 jetons de réflexion de manière inattendue. Prévoyez un budget avec une certaine marge.

grok-build-0.1 est spécifiquement entraîné pour les flux de travail de codage agentiques et possède une fenêtre de contexte de 256k - plus courte que le 1M du modèle phare mais toujours substantielle. Il est actuellement en accès anticipé.

Carte d'annonce du modèle de code grok-build-0.1
Carte d'annonce du modèle de code grok-build-0.1

Une chose que la documentation de l'API mentionne clairement : les requêtes qui violent les directives d'utilisation de xAI sont toujours facturées. Si un appel à l'API de réponses est bloqué pour une violation avant la génération, vous êtes facturé 0,05 $ par requête, quel que soit le cas. C'est un petit montant mais il est bon de le savoir si vous exécutez des flux de travail automatisés à haut volume.

API Batch : la réduction de 20 à 50 %

L'API xAI Batch réduit les coûts des jetons de 20 % à 50 % sur les modèles de texte et de raisonnement. Le compromis : les réponses arrivent dans les 24 heures plutôt qu'en temps réel. Par rapport à l'API OpenAI Batch qui offre une réduction forfaitaire de 50 %, la plage variable de 20 à 50 % de xAI mérite d'être testée sur votre charge de travail spécifique - la réduction réelle dépend de la charge.

Si vous exécutez des pipelines d'inférence par lots, de classification ou de traitement de documents où la latence n'a pas d'importance, c'est le moyen le plus direct de réduire les coûts. La génération d'images et de vidéos n'est pas éligible à la réduction batch et reste aux tarifs standard.

Grok Imagine : images et vidéo

L'API Imagine est comptabilisée selon la taille de sortie et le niveau de qualité.

ModèleDescriptionEntréeSortie
grok-imagine-imageTexte/image → image, standard0,002 $/img0,02 $/img (1K ou 2K)
grok-imagine-image-qualityTexte/image → image, haute qualité0,01 $/img0,05 $/img (1K), 0,07 $/img (2K)
grok-imagine-videoTexte/image/vidéo → vidéo0,01 $/sec + 0,002 $/img0,05 $/sec (480p), 0,07 $/sec (720p)
grok-imagine-video-1.5-previewImage → vidéo (preview)0,01 $/img0,08 $/sec (480p), 0,14 $/sec (720p)

Une image standard 1K via le modèle Imagine de base coûte 0,02 $. Une vidéo de 15 secondes en 720p via le modèle 1.5 preview coûte 2,10 $ en frais de sortie plus l'entrée. Ce sont des tarifs compétitifs par rapport à Midjourney et à des services similaires, mais ils s'additionnent rapidement dans les flux de travail de production où vous générez à grande échelle.

Annonce du modèle grok-imagine-1.5 preview
Annonce du modèle grok-imagine-1.5 preview

API Grok Voice

L'API Voice est l'endroit où la tarification de xAI devient véritablement inhabituelle - et où le produit a un réel argument. Artificial Analysis a désigné l'agent vocal Grok comme le principal modèle de raisonnement vocal début 2026, devant les modèles audio natifs de Google et Amazon.

ModeCoût
Agent temps réel3,00 $/heure
Entrée texte temps réel0,004 $/message
Synthèse vocale (TTS)15,00 $/1M caractères
Parole vers texte, REST0,10 $/heure
Parole vers texte, streaming0,20 $/heure

Le tarif en temps réel de 3 $/heure est la manière dont la plupart des applications atteindront ce poste de dépense. À ce tarif, 1 000 heures de conversations vocales coûtent 3 000 $ - tenez-en compte avant de créer des fonctionnalités axées sur la voix. Comparez-le à l'API Realtime d'OpenAI lors de la finalisation de votre choix d'architecture.

Partenariat xAI et Vapi propulsant Grok Voice, tel que tiré de x.ai
Partenariat xAI et Vapi propulsant Grok Voice, tel que tiré de x.ai

Appels d'outils : le coût caché le plus important

C'est ici que les factures réelles de l'API xAI divergent fortement de l'estimation basée uniquement sur les jetons. Les outils côté serveur sont facturés par appel, en plus du coût des jetons.

OutilNom de l'APICoût
Recherche Webweb_search5,00 $/1k appels
Recherche Xx_search5,00 $/1k appels
Exécution de codecode_execution / code_interpreter5,00 $/1k appels
Pièces jointesattachment_search10,00 $/1k appels
Recherche de collections (RAG)collections_search / file_search2,50 $/1k appels
Compréhension d'imagesview_imageBasé sur les jetons uniquement

Si votre agent effectue une recherche web à chaque tour, cela représente 5 $ pour 1 000 requêtes en plus du coût des jetons. Une charge de travail de 10 000 requêtes avec la recherche web activée à chaque tour ajoute 50 $ à la facture avant tout frais de jeton ou de stockage. La communauté l'a noté clairement : "Grok est bien moins cher et contourne les limites d'extraction de données de l'API X" - l'intégration de la recherche X est réellement différenciée, mais elle n'est pas gratuite.

Stockage

Les fichiers et les collections (RAG) sont facturés par GiB et par jour.

RessourceTarif
Stockage de fichiers0,025 $/GiB/jour
Stockage de collections0,10 $/GiB/jour
Téléchargements de fichiers0,20 $/GiB
Téléchargements de collections0,20 $/GiB

Le maintien des collections (recherche vectorielle) coûte quatre fois plus cher que le stockage de fichiers bruts. Si vous construisez un pipeline RAG sur xAI, cela vaut la peine de faire des projections. 100 GiB de stockage de collections coûtent 10 $/jour soit 300 $/mois en frais de stockage seuls - avant tout coût de requête.

L'historique des prix : comment nous en sommes arrivés là

L'évolution de la tarification de xAI mérite d'être connue car elle permet de mieux interpréter les chiffres actuels.

Historique des prix de l'API xAI Grok du lancement à juin 2026
Historique des prix de l'API xAI Grok du lancement à juin 2026

Grok 4 a été lancé en juillet 2025 à 3,00 $/1M d'entrée et 15,00 $/1M de sortie - comparable à Claude Sonnet à l'époque, mais plus cher que les alternatives de commodité. xAI a ensuite introduit Grok 4 Fast à un prix radicalement moins cher de 0,20 $/1M d'entrée et 0,50 $/1M de sortie, ce qui a rendu l'API véritablement compétitive pour les charges de travail sensibles au prix.

"Grok-4-1-fast-reasoning est à 0,20 $ pour l'entrée. grok-4.3 est à 1,20 $. J'utilise uniquement Grok comme processeur visuel, donc l'augmentation des coûts ne me frappera pas si fort, mais quand même - cela ressemble autant à une décision économique qu'à une décision de 'forcer les utilisateurs à passer sur la dernière plateforme'."

-- u/slickriptide sur r/MyBoyfriendIsAI

En mai 2026, xAI a retiré huit modèles dont Grok 3, Grok 4 Fast, grok-4-1-fast-reasoning et grok-code-fast-1. Résultat : les utilisateurs qui avaient construit sur les modèles économiques Fast ont dû migrer vers grok-4.3, qui coûte 6 fois plus cher par jeton d'entrée. La tarification actuelle de 1,25 $/2,50 $ représente une réduction de 58 % par rapport au prix de lancement original de Grok 4, mais une forte augmentation pour quiconque comptait sur les alternatives de niveau Fast qui n'existent plus.

L'autre changement significatif : xAI a mis fin à son "programme de partage de données" en mai 2025, qui fournissait 150 $/mois en crédits API gratuits. Il n'existe plus de niveau d'API gratuit pour les nouveaux développeurs.

Coûts cachés à prévoir

Quelques éléments qui n'apparaissent pas de manière évidente dans les tarifs de jetons principaux :

Pics de jetons de raisonnement. grok-4.3 utilise un paramètre d'effort de raisonnement configurable, mais un effort "bas" ne garantit pas un nombre de jetons faible. Un développeur sur r/singularity a signalé que le modèle passait d'une moyenne de 1 500 jetons de réflexion à 10 000 pour la même invite sans explication. Si vous fixez des limites de coûts, prévoyez une marge d'au moins 3 à 4 fois par rapport à votre base de jetons de raisonnement attendue.

Fenêtres de retrait de modèles. Huit modèles ont été retirés avec un préavis court en mai 2026. Si vous vous fixez sur un nom de modèle versionné (ex: grok-4-0709), vous obtenez de la stabilité jusqu'à la date de retrait ; si vous utilisez l'alias (grok-4.3), vous migrez automatiquement mais pouvez rencontrer des changements de capacités inattendus. Aucune des deux options n'est évidemment plus sûre : l'une vous donne la certitude de la fin de vie, l'autre vous donne la continuité jusqu'à ce que ce ne soit plus le cas.

Appels d'outils à chaque tour. L'API est compatible avec OpenAI, ce qui facilite la migration, mais les outils d'OpenAI ne sont pas facturés de la même manière. web_search à 5 $/1k appels est un nouveau poste de dépense pour les équipes passant d'une configuration d'appel d'outils qui ne facturait pas auparavant par appel. Vérifiez votre moyenne d'appels d'outils par session avant de projeter le coût total.

Violations des directives d'utilisation. Des frais de 0,05 $ s'appliquent à toute requête interceptée pour violation des directives d'utilisation avant la génération. Pour la plupart des charges de travail légitimes, cela n'est jamais déclenché, mais pour les pipelines de modération de contenu ou les tests contradictoires, il convient de le noter.

Qui devrait payer pour quoi

Grok gratuit : Convient aux particuliers utilisant Grok comme outil de recherche, assistant d'écriture ou pour des questions-réponses occasionnelles. L'ensemble des fonctionnalités multimodales est généreux pour un coût nul. Vous atteindrez les limites quotidiennes si vous l'utilisez intensivement.

SuperGrok (~30 $/mois) : Vaut le coup si vous comptez sur le mode multi-agents pour des tâches de recherche, si vous atteignez régulièrement les limites quotidiennes du niveau gratuit ou si vous voulez Grok Build pour les automatisations de code. À 30 $ fixe, c'est comparable aux tarifs de Claude Pro et aux tarifs de ChatGPT à leurs niveaux Plus respectifs.

API xAI : Le bon choix pour les développeurs créant des applications. Les prix des jetons sont compétitifs, la compatibilité avec le SDK OpenAI signifie une faible friction de migration, et l'intégration de la recherche X est véritablement unique si vous construisez quoi que ce soit nécessitant des données sociales en temps réel. Surveillez les frais d'outils et de stockage ; c'est là que réside réellement la facture pour les charges de travail basées sur des agents.

API Batch : Le choix évident pour toute charge de travail asynchrone - traitement de documents, classification en masse, évaluation hors ligne. La réduction de 20 à 50 % est significative à grande échelle.

Azure/Oracle/Google Cloud : Si votre infrastructure est déjà dans l'un de ces clouds et que vous voulez Grok sans une relation fournisseur distincte, les routes des marketplaces cloud fonctionnent. Les tarifs varient selon le fournisseur et méritent d'être comparés aux tarifs directs de xAI avant de s'engager. Les pages sur la liste des modèles OpenAI et les tarifs de Qwen valent la peine d'être lues en parallèle pour comparer ce que les différents fournisseurs d'API facturent actuellement pour les modèles de classe "frontière".

Essayez eesel

Si vous évaluez des API d'IA pour alimenter vos flux de travail de support ou de connaissances, eesel mérite d'être examiné en plus de la tarification brute des modèles. eesel déploie des agents d'IA autonomes directement dans vos outils existants - Zendesk, Slack, Freshdesk, Shopify et plus de 100 autres - sans vous obliger à câbler vous-même les API LLM, les appels d'outils et la facturation du stockage. La tarification est basée sur les tâches : 0,40 $ par tâche régulière (ticket, réponse par chat) avec un crédit gratuit de 50 $ pour commencer. Il n'y a pas de frais de plateforme en libre-service, pas de coût par siège, et les agents s'arrêtent à votre plafond de dépenses. Pour les équipes qui veulent une résolution par l'IA sans la comptabilité par jeton, la tarification d'eesel est une comparaison plus claire à SuperGrok que les tarifs bruts de l'API.

Foire Aux Questions

Le modèle phare actuel, grok-4.3, coûte 1,25 $ par million de jetons d'entrée et 2,50 $ par million de jetons de sortie. Les entrées mises en cache tombent à 0,20 $ par million. Le modèle axé sur le code grok-build-0.1 est légèrement moins cher à 1,00 $/2,00 $ par million de jetons. Ces deux prix datent de mai 2026 et représentent une réduction significative par rapport aux tarifs de lancement de Grok 4 qui étaient de 3 $/15 $ par million en juillet 2025.
Les deux forfaits incluent le chat Grok, la génération d'images, la voix et la recherche en temps réel sur X/web. SuperGrok (environ 30 $/mois) ajoute des limites quotidiennes plus élevées, un accès prioritaire pendant les heures de pointe et le mode multi-agents où des agents parallèles s'attaquent simultanément à des sous-problèmes et fusionnent leur raisonnement en une réponse citée. Grok Build Beta est également inclus avec SuperGrok et X Premium+. Le forfait gratuit est limité en termes de débit mais accède par ailleurs aux mêmes fonctionnalités de base.
Oui. L'API xAI Batch réduit les coûts des jetons de 20 % à 50 % par rapport aux tarifs standard en temps réel. Le compromis est la latence de réponse : les requêtes par lots sont traitées dans les 24 heures plutôt qu'immédiatement. La réduction batch s'applique aux modèles de texte et de raisonnement ; la génération d'images et de vidéos est toujours facturée aux tarifs standard, quel que soit le mode par lots.
De manière significative. Grok 4 a été lancé en juillet 2025 à 3,00 $/1M de jetons d'entrée et 15,00 $/1M de jetons de sortie. xAI a ensuite introduit Grok 4 Fast à 0,20 $/1M d'entrée et 0,50 $/1M de sortie avant de le retirer en mai 2026. Le modèle actuel grok-4.3 se situe à 1,25 $/2,50 $ par million de jetons - une réduction de 58 % par rapport au prix de lancement mais une augmentation par 6 pour les utilisateurs qui comptaient sur les modèles fast/budget avant leur retrait. Vous pouvez comparer cette évolution avec les alternatives à xAI pour voir où elle se situe aujourd'hui.
Oui. Les modèles xAI Grok sont disponibles via Microsoft Azure AI Foundry, Oracle Cloud Infrastructure Generative AI et Google Cloud Vertex Model Garden. Les tarifs cloud varient selon le fournisseur et peuvent différer des tarifs directs de l'API xAI. L'API xAI elle-même est compatible avec OpenAI, donc migrer depuis la tarification de l'API ChatGPT ou de l'API Claude ne nécessite souvent que des modifications minimales du code.

Share this article

Kira

Article by

Kira

A Computer Science student deeply passionate in the fields of UI/UX Design and Web Development with a knack on writing. Fusing technical expertise with a creative flair, I'm driven to craft innovative and user-centric solutions, leveraging both coding proficiency and design sensibilities to create seamless, impactful experiences.

Related Posts

All posts →
Bannière d'analyse des tarifs Gamma 2026
AI tools

Tarifs Gamma en 2026 : tous les forfaits, tous les pièges et le coût réel

Une analyse complète des tarifs Gamma en 2026 : chaque forfait, chaque coût de crédit, le piège du remboursement sous 3 jours et ce que les utilisateurs réels paient réellement.

Rama Adi NugrahaRama Adi NugrahaJun 5, 2026
Guide des tarifs HeyGen 2026 - analyse des forfaits et des crédits
AI Tools

Tarifs HeyGen (2026) : forfaits, crédits et ce que vous allez réellement payer

Les tarifs de HeyGen commencent à 29 $/mois, mais le calcul des crédits change tout. Voici ce que chaque forfait coûte réellement en tenant compte de l'utilisation d'Avatar IV.

Stevia PutriStevia PutriJun 5, 2026
Illustration éditoriale des niveaux de tarification et du coût des jetons de Leonardo.AI
AI Tools

Tarifs Leonardo.AI : tous les forfaits, jetons et coûts cachés (2026)

Analyse des tarifs Leonardo.AI pour 2026 : chaque forfait, le calcul des jetons, ce que l'« illimité » exclut réellement et les coûts cachés qui piègent les équipes.

Riellvriany IndriawanRiellvriany IndriawanJun 5, 2026
Tarifs Luma AI 2026 - forfaits Luma Agents, Dream Machine et Ray 3
AI Tools

Tarifs Luma AI (2026) : Dream Machine, Luma Agents et le coût réel par clip

Les tarifs de Luma ont été réinitialisés pour 2026. Voici ce que chaque forfait coûte réellement une fois que l'on prend en compte la consommation de crédits, l'absence de report et l'écart entre Plus et Pro.

Rama Adi NugrahaRama Adi NugrahaJun 5, 2026
Guide des tarifs Midjourney 2026 - forfaits, heures GPU et coûts cachés
AI Tools

Tarifs Midjourney en 2026 : Forfaits, heures GPU et coût réel

Les quatre forfaits de Midjourney vont de 10 $ à 120 $/mois - mais l'élément confus est que vous achetez du temps de calcul GPU, pas des images. Voici ce que chaque forfait vous offre réellement en 2026.

Stevia PutriStevia PutriJun 5, 2026
Image d'en-tête de l'aperçu des forfaits tarifaires de Pika AI
AI Tools

Tarifs Pika AI (2026) : Forfaits, crédits et ce que vous payez réellement

Pika AI commence à 0 $, mais le calcul des crédits est complexe. Voici chaque forfait, chaque coût par vidéo et les pièges à connaître avant de vous abonner.

Stevia PutriStevia PutriJun 5, 2026
Flux de travail du terminal Claude Code avec le logo Anthropic sur un fond éditorial blanc cassé chaleureux
AI Tools

Avis sur Claude Code (2026) : l'outil de codage agentique d'Anthropic au banc d'essai

Nous avons testé Claude Code sur tous les supports et forfaits. Voici ce que propose réellement le forfait Pro à 17 $/mois, quand le forfait Max à 100 $/mois devient pertinent, et notre avis honnête sur les limites d'utilisation.

Stevia PutriStevia PutriJun 4, 2026
Infographie de présentation des tarifs Qwen montrant les niveaux de modèles et les coûts d'API
AI Tools

Tarifs Qwen en 2026 : tous les modèles, ce que vous payez réellement et quand cela en vaut la peine

Analyse complète des tarifs de l'API Qwen pour 2026 : tous les niveaux de modèles, coûts du mode réflexion, modifications de l'offre gratuite et exemples de coûts concrets par rapport à Claude et GPT.

Stevia PutriStevia PutriJun 4, 2026

Prêt à recruter votre collègue IA ?

Configuration en quelques minutes. Pas de carte bancaire requise.

Commencer gratuitement