
Resumo
A xAI opera dois modelos de preços separados que não se sobrepõem muito. O produto para o consumidor - Grok - é gratuito (com limites diários) ou custa $30/mês para o SuperGrok, que adiciona o modo multiagente e limites mais altos. A API cobra por token, sem valor mensal mínimo.
O carro-chefe atual da API, grok-4.3, custa $1,25 por milhão de tokens de entrada e $2,50 por milhão de tokens de saída - uma queda em relação aos $3/$15 no lançamento do Grok 4 em julho de 2025. Esse é o número principal, mas a conta real depende muito de você usar a busca na web ($5 por 1.000 chamadas), voz ($3/hora em tempo real) ou armazenamento de arquivos ($0,025/GiB/dia). Cada um desses itens é medido separadamente e soma mais rápido do que apenas o custo dos tokens.
O nível gratuito da API (que oferecia $150/mês em créditos) terminou em maio de 2025. Novos desenvolvedores pagam desde o primeiro dia. Se você estiver avaliando a xAI em comparação com as alternativas à xAI, os preços dos tokens parecem competitivos, mas as taxas de ferramentas e armazenamento mudam substancialmente o cenário do custo total de propriedade.
O que a xAI realmente vende
A xAI é a empresa de pesquisa em IA de Elon Musk, fundada em 2023 e mais conhecida pela família de modelos Grok. A empresa processa mais de 1 milhão de chamadas de API por dia com latência inferior a 200ms em sua infraestrutura Colossus, e projeções da comunidade estimam sua receita independente em $500 milhões em 2025, crescendo para $2 bilhões em 2026 - embora esses números sejam estimativas da comunidade e não números auditados.
O produto tem dois modos: um chatbot para o consumidor (Grok) e uma API para desenvolvedores. O preço de cada um é completamente diferente, que é a primeira coisa que confunde as pessoas.
Planos para o consumidor: Gratuito e SuperGrok
O produto para o consumidor reside em grok.com e nos aplicativos para iOS e Android. Tanto o nível gratuito quanto o pago incluem os mesmos recursos principais: chat Grok, integração em tempo real com a web e o X/Twitter, geração de imagens, geração de vídeo (até 15 segundos em 720p), conversas por voz e análise de arquivos. A lista é surpreendentemente longa para um nível gratuito.
O que o SuperGrok adiciona é fôlego e capacidade. Por aproximadamente $30/mês (também incluído no X Premium+), você recebe:
- Limites diários mais altos em todas as categorias de recursos
- Acesso prioritário durante horários de pico, quando o nível gratuito entra em fila
- Modo multiagente - o maior diferencial. Vários agentes resolvem subproblemas em paralelo, cada um mostra sua cadeia de raciocínio e os resultados são mesclados em uma única resposta citada
- Grok Build Beta para automações de código e fluxos de trabalho em modo plano
O plano gratuito é generoso o suficiente para uso ocasional. A questão é se você atingirá os limites. Se você é um desenvolvedor testando os modelos, o nível gratuito para o consumidor se esgota rapidamente e a API é quase sempre o melhor caminho.

| Recurso | Gratuito | SuperGrok (~$30/mês) |
|---|---|---|
| Chat | Sim | Sim |
| Busca em tempo real na web + X | Sim | Sim |
| Geração de imagem | Sim | Sim |
| Geração de vídeo (até 15s, 720p) | Sim | Sim |
| Conversas por voz | Sim | Sim |
| Análise de arquivos e PDF | Sim | Sim |
| Modo multiagente | Não | Sim |
| Limites diários mais altos | Não | Sim |
| Acesso prioritário | Não | Sim |
| Grok Build Beta | Não | Sim |
Preços da xAI API: o detalhamento completo
A xAI API é faturada em cinco categorias distintas: texto/raciocínio, imagens, vídeo, voz e ferramentas. Cada uma é medida separadamente. Entender o quadro completo é importante porque uma carga de trabalho realista que combina respostas de texto com busca na web e recuperação de arquivos pode custar duas a três vezes mais do que o preço do token sugere isoladamente.

Chat e raciocínio: grok-4.3 e grok-build-0.1
Os dois modelos de texto atuais são o grok-4.3 (o carro-chefe, com raciocínio) e o grok-build-0.1 (o modelo de codificação, lançado em 29 de maio de 2026).
| Modelo | Contexto | Entrada | Entrada em cache | Saída |
|---|---|---|---|---|
| grok-4.3 | 1M tokens | $1,25/1M | $0,20/1M | $2,50/1M |
| grok-4.20-multi-agent-0309 | 1M tokens | $1,25/1M | $0,20/1M | $2,50/1M |
| grok-4.20-0309-reasoning | 1M tokens | $1,25/1M | $0,20/1M | $2,50/1M |
| grok-4.20-0309-non-reasoning | 1M tokens | $1,25/1M | $0,20/1M | $2,50/1M |
| grok-build-0.1 | 256k tokens | $1,00/1M | $0,20/1M | $2,00/1M |
O grok-4.3 suporta um parâmetro configurável reasoning_effort para que você possa aumentar ou diminuir o raciocínio sem trocar de modelo. Isso é importante para o controle de custos - um desenvolvedor da comunidade observou no r/singularity que mesmo com reasoning_effort definido como low, o modelo ainda podia saltar de 1.500 para 10.000 tokens de pensamento inesperadamente. Planeje o orçamento com alguma folga.
O grok-build-0.1 é treinado especificamente para fluxos de trabalho de codificação baseados em agentes e tem uma janela de contexto de 256k - menor que o 1M do carro-chefe, mas ainda assim substancial. Atualmente, está em acesso antecipado.

Um ponto que a documentação da API menciona claramente: solicitações que violam as diretrizes de uso da xAI ainda são cobradas. Se uma chamada da Responses API for interrompida por uma violação antes da geração, você será cobrado em $0,05 por solicitação, independentemente de qualquer coisa. É um valor pequeno, mas vale a pena saber se você estiver executando fluxos de trabalho automatizados de alto volume.
Batch API: o desconto de 20-50%
A xAI Batch API reduz os custos de tokens em 20% a 50% nos modelos de texto e raciocínio. A troca: as respostas chegam em até 24 horas, em vez de em tempo real. Comparado à Batch API da OpenAI, que oferece um desconto fixo de 50%, a faixa variável de 20-50% da xAI vale a pena ser testada em sua carga de trabalho específica - o desconto real depende da carga do sistema.
Se você estiver executando inferência em lote, classificação ou pipelines de processamento de documentos onde a latência não importa, esta é a maneira mais direta de reduzir custos. A geração de imagem e vídeo não se qualifica para o desconto de lote e permanece nas taxas padrão.
Grok Imagine: imagens e vídeo
A Imagine API é medida pelo tamanho da saída e pelo nível de qualidade.
| Modelo | Descrição | Entrada | Saída |
|---|---|---|---|
| grok-imagine-image | Texto/imagem → imagem, padrão | $0,002/img | $0,02/img (1K ou 2K) |
| grok-imagine-image-quality | Texto/imagem → imagem, alta qualidade | $0,01/img | $0,05/img (1K), $0,07/img (2K) |
| grok-imagine-video | Texto/imagem/vídeo → vídeo | $0,01/seg + $0,002/img | $0,05/seg (480p), $0,07/seg (720p) |
| grok-imagine-video-1.5-preview | Imagem → vídeo (preview) | $0,01/img | $0,08/seg (480p), $0,14/seg (720p) |
Uma imagem 1K padrão através do modelo Imagine básico custa $0,02. Um vídeo de 15 segundos em 720p através do modelo 1.5 preview custa $2,10 em taxas de saída mais a entrada. Estas são taxas competitivas em comparação com o Midjourney e serviços similares, mas somam rapidamente em fluxos de trabalho de produção onde você gera em escala.

Grok Voice API
A Voice API é onde os preços da xAI se tornam genuinamente incomuns - e onde o produto tem um diferencial real. A Artificial Analysis nomeou o Grok Voice Agent como o modelo de raciocínio de fala líder no início de 2026, à frente dos modelos de áudio nativos do Google e da Amazon.
| Modo | Custo |
|---|---|
| Agente em tempo real | $3,00/hora |
| Entrada de texto em tempo real | $0,004/mensagem |
| Texto para fala (TTS) | $15,00/1M caracteres |
| Fala para texto, REST | $0,10/hora |
| Fala para texto, streaming | $0,20/hora |
A taxa de $3/hora em tempo real é como a maioria das aplicações atingirá este item de linha. Nessa taxa, 1.000 horas de conversas de voz custam $3.000 - leve isso em conta antes de criar recursos baseados prioritariamente em voz. Compare-o com a Realtime API da OpenAI ao finalizar sua escolha de arquitetura.

Chamadas de ferramentas: o maior custo oculto
É aqui que as faturas reais da xAI API divergem drasticamente da estimativa baseada apenas em tokens. As ferramentas do lado do servidor são cobradas por chamada, além dos custos de tokens.
| Ferramenta | Nome da API | Custo |
|---|---|---|
| Busca na web | web_search | $5,00/1k chamadas |
| Busca no X | x_search | $5,00/1k chamadas |
| Execução de código | code_execution / code_interpreter | $5,00/1k chamadas |
| Anexos de arquivo | attachment_search | $10,00/1k chamadas |
| Busca em coleções (RAG) | collections_search / file_search | $2,50/1k chamadas |
| Compreensão de imagem | view_image | Apenas baseado em tokens |
Se o seu agente realizar uma busca na web em cada interação, isso custará $5 por 1.000 solicitações, além do custo dos tokens. Uma carga de trabalho de 10.000 solicitações com busca na web ativada em cada turno adiciona $50 à conta antes de qualquer taxa de token ou armazenamento. A comunidade notou isso claramente: "O Grok é ordens de grandeza mais barato e ignora os limites de extração de dados da X API" - a integração de busca no X é genuinamente diferenciada, mas não é gratuita.
Armazenamento
Arquivos e coleções (RAG) são cobrados por GiB por dia.
| Recurso | Taxa |
|---|---|
| Armazenamento de arquivos | $0,025/GiB/dia |
| Armazenamento de coleções | $0,10/GiB/dia |
| Downloads de arquivos | $0,20/GiB |
| Downloads de coleções | $0,20/GiB |
As coleções (busca vetorial) custam quatro vezes mais para manter do que o armazenamento de arquivos brutos. Se você estiver construindo um pipeline de RAG na xAI, vale a pena projetar isso. 100 GiB de armazenamento de coleção custam $10/dia ou $300/mês apenas em taxas de armazenamento - antes de qualquer custo de consulta.
O histórico de preços: como chegamos aqui
A trajetória de preços da xAI vale a pena ser conhecida porque molda como ler os números atuais.

O Grok 4 foi lançado em julho de 2025 a $3,00/1M de entrada e $15,00/1M de saída - comparável ao Claude Sonnet na época, mas mais caro que alternativas comuns. A xAI então introduziu o Grok 4 Fast por um valor dramaticamente mais barato de $0,20/1M de entrada e $0,50/1M de saída, o que tornou a API genuinamente competitiva para cargas de trabalho sensíveis ao preço.
"O Grok-4-1-fast-reasoning custa $0,20 para entrada. O grok-4.3 custa $1,20. Eu só uso o Grok como processador visual, então o aumento de custo não vai bater tão forte, mas ainda assim - isso parece uma decisão econômica tanto quanto uma decisão de 'forçar os usuários para a plataforma mais recente'."
-- u/slickriptide no r/MyBoyfriendIsAI
Em maio de 2026, a xAI descontinuou oito modelos, incluindo Grok 3, Grok 4 Fast, grok-4-1-fast-reasoning e grok-code-fast-1. O efeito: os usuários que criaram com base nos modelos econômicos rápidos tiveram que migrar para o grok-4.3, que custa 6x mais por token de entrada. O preço atual de $1,25/$2,50 representa uma redução de 58% em relação ao preço de lançamento original do Grok 4, mas um aumento acentuado para quem dependia das alternativas de nível fast que não existem mais.
A outra mudança significativa: a xAI encerrou seu "programa de compartilhamento de dados" em maio de 2025, que fornecia $150/mês em créditos gratuitos de API. Não há mais um nível de API gratuito para novos desenvolvedores.
Custos ocultos para incluir no orçamento
Algumas coisas que não aparecem de forma óbvia nas taxas de token principais:
Picos de tokens de raciocínio. O grok-4.3 usa um parâmetro de esforço de raciocínio configurável, mas o esforço "baixo" não garante contagens baixas de tokens. Um desenvolvedor no r/singularity relatou que o modelo saltou de uma média de 1.500 tokens de pensamento para 10.000 no mesmo prompt sem explicação. Se você estiver definindo limites de custo, preveja pelo menos 3-4x de folga sobre sua base esperada de tokens de raciocínio.
Janelas de descontinuação de modelos. Oito modelos foram descontinuados com pouco aviso prévio em maio de 2026. Se você fixar um nome de modelo versionado (por exemplo, grok-4-0709), terá estabilidade até a data de descontinuação; se usar o alias (grok-4.3), será migrado automaticamente, mas poderá sofrer mudanças inesperadas de capacidade. Nenhum dos dois é obviamente mais seguro - um oferece a certeza do fim, o outro oferece continuidade até que não ofereça mais.
Chamadas de ferramentas em cada turno. A API é compatível com OpenAI, o que facilita a migração, mas as ferramentas da OpenAI não são faturadas da mesma maneira. O web_search a $5/1k chamadas é um novo item de linha para equipes que mudam de uma configuração de chamada de ferramenta que anteriormente não cobrava por chamada. Audite suas chamadas de ferramenta médias por sessão antes de projetar o custo total.
Violações das diretrizes de uso. Uma taxa de $0,05 se aplica a qualquer solicitação flagrada violando as diretrizes de uso antes da geração. Para a maioria das cargas de trabalho legítimas, isso nunca é acionado, mas para pipelines de moderação de conteúdo ou testes adversários, vale a pena notar.
Quem deve pagar pelo quê
Grok Gratuito: Funciona bem para indivíduos que usam o Grok como ferramenta de pesquisa, assistente de escrita ou para tirar dúvidas casuais. O conjunto de recursos multimodais é generoso a custo zero. Você atingirá os limites diários se usá-lo intensamente.
SuperGrok (~$30/mês): Vale a pena se você depende do modo multiagente para tarefas de pesquisa, atinge regularmente os limites diários do nível gratuito ou deseja o Grok Build para automações de código. A um valor fixo de $30, é comparável aos preços do Claude Pro e aos preços do ChatGPT em seus respectivos níveis Plus.
xAI API: A escolha certa para desenvolvedores que criam aplicativos. Os preços dos tokens são competitivos, a compatibilidade com o SDK da OpenAI significa baixa fricção na migração e a integração de busca no X é genuinamente única se você estiver construindo algo que precise de dados sociais em tempo real. Fique atento às taxas de ferramentas e armazenamento; é onde a conta realmente reside para cargas de trabalho baseadas em agentes.
Batch API: A escolha óbvia para qualquer carga de trabalho assíncrona - processamento de documentos, classificação em massa, avaliação offline. O desconto de 20-50% é significativo em volume.
Azure/Oracle/Google Cloud: Se sua infraestrutura já estiver em uma dessas nuvens e você quiser o Grok sem um relacionamento separado com o fornecedor, as rotas do marketplace na nuvem funcionam. Os preços variam de acordo com o provedor e vale a pena comparar com as taxas diretas da xAI antes de se comprometer. As páginas da lista de modelos OpenAI e de preços Qwen valem a leitura junto com esta para comparar o que diferentes provedores de API cobram por modelos de classe frontier no momento.
Experimente o eesel
Se você estiver avaliando APIs de IA para alimentar seus fluxos de trabalho de suporte ou conhecimento, o eesel merece uma olhada junto com os preços brutos dos modelos. O eesel implementa agentes de IA autônomos diretamente dentro de suas ferramentas existentes - Zendesk, Slack, Freshdesk, Shopify e mais de 100 outras - sem exigir que você mesmo conecte APIs de LLM, chamadas de ferramentas e faturamento de armazenamento. O preço é baseado em tarefas: $0,40 por tarefa regular (ticket, resposta no chat) com um crédito gratuito de $50 para começar. Não há taxa de plataforma no autoatendimento, nem custos por assento, e os agentes pausam ao atingir seu limite de gastos. Para equipes que desejam resolução por IA sem a contabilidade por token, o preço do eesel é uma comparação mais clara com o SuperGrok do que as taxas brutas da API.
Perguntas Frequentes
Share this article

Article by
Kira
A Computer Science student deeply passionate in the fields of UI/UX Design and Web Development with a knack on writing. Fusing technical expertise with a creative flair, I'm driven to craft innovative and user-centric solutions, leveraging both coding proficiency and design sensibilities to create seamless, impactful experiences.







