Preços da xAI explicados: um guia completo para 2026

Q: Quanto custa a xAI Grok API por milhão de tokens?

O modelo carro-chefe atual, grok-4.3 , custa $1,25 por milhão de tokens de entrada e $2,50 por milhão de tokens de saída. Entradas em cache caem para $0,20 por milhão. O grok-build-0.1 , focado em codificação, é um pouco mais barato, custando $1,00/$2,00 por milhão de tokens. Ambos os preços são de maio de 2026 e representam uma redução significativa em relação ao preço de lançamento do Grok 4, de $3/$15 por milhão em julho de 2025.

Q: Qual é a diferença entre o SuperGrok e o plano gratuito do Grok?

Ambos os planos incluem o chat Grok , geração de imagens, voz e busca em tempo real no X/web. O SuperGrok (aproximadamente $30/mês) adiciona limites diários mais altos, acesso prioritário durante horários de pico e o modo multiagente, onde agentes paralelos resolvem subproblemas simultaneamente e mesclam seu raciocínio em uma única resposta citada. O Grok Build Beta também está incluído no SuperGrok e no X Premium+. O plano gratuito tem limite de taxa, mas, fora isso, acessa os mesmos recursos principais.

Escrito por

Alicia Kirana Utomo

Revisado por

Katelin Teen

Última edição June 5, 2026

Verificado por especialista

Ilustração editorial dos níveis de preços da xAI em um fundo esbranquiçado quente com toques de verde-oliva suaves

Resumo

A xAI opera dois modelos de preços separados que não se sobrepõem muito. O produto para o consumidor - Grok - é gratuito (com limites diários) ou custa $30/mês para o SuperGrok, que adiciona o modo multiagente e limites mais altos. A API cobra por token, sem valor mensal mínimo.

O carro-chefe atual da API, grok-4.3, custa $1,25 por milhão de tokens de entrada e $2,50 por milhão de tokens de saída - uma queda em relação aos $3/$15 no lançamento do Grok 4 em julho de 2025. Esse é o número principal, mas a conta real depende muito de você usar a busca na web ($5 por 1.000 chamadas), voz ($3/hora em tempo real) ou armazenamento de arquivos ($0,025/GiB/dia). Cada um desses itens é medido separadamente e soma mais rápido do que apenas o custo dos tokens.

O nível gratuito da API (que oferecia $150/mês em créditos) terminou em maio de 2025. Novos desenvolvedores pagam desde o primeiro dia. Se você estiver avaliando a xAI em comparação com as alternativas à xAI, os preços dos tokens parecem competitivos, mas as taxas de ferramentas e armazenamento mudam substancialmente o cenário do custo total de propriedade.

O que a xAI realmente vende

A xAI é a empresa de pesquisa em IA de Elon Musk, fundada em 2023 e mais conhecida pela família de modelos Grok. A empresa processa mais de 1 milhão de chamadas de API por dia com latência inferior a 200ms em sua infraestrutura Colossus, e projeções da comunidade estimam sua receita independente em $500 milhões em 2025, crescendo para $2 bilhões em 2026 - embora esses números sejam estimativas da comunidade e não números auditados.

O produto tem dois modos: um chatbot para o consumidor (Grok) e uma API para desenvolvedores. O preço de cada um é completamente diferente, que é a primeira coisa que confunde as pessoas.

Página da xAI API mostrando níveis de preços e opções para desenvolvedores

Planos para o consumidor: Gratuito e SuperGrok

O produto para o consumidor reside em grok.com e nos aplicativos para iOS e Android. Tanto o nível gratuito quanto o pago incluem os mesmos recursos principais: chat Grok, integração em tempo real com a web e o X/Twitter, geração de imagens, geração de vídeo (até 15 segundos em 720p), conversas por voz e análise de arquivos. A lista é surpreendentemente longa para um nível gratuito.

O que o SuperGrok adiciona é fôlego e capacidade. Por aproximadamente $30/mês (também incluído no X Premium+), você recebe:

Limites diários mais altos em todas as categorias de recursos
Acesso prioritário durante horários de pico, quando o nível gratuito entra em fila
Modo multiagente - o maior diferencial. Vários agentes resolvem subproblemas em paralelo, cada um mostra sua cadeia de raciocínio e os resultados são mesclados em uma única resposta citada
Grok Build Beta para automações de código e fluxos de trabalho em modo plano

O plano gratuito é generoso o suficiente para uso ocasional. A questão é se você atingirá os limites. Se você é um desenvolvedor testando os modelos, o nível gratuito para o consumidor se esgota rapidamente e a API é quase sempre o melhor caminho.

Página do produto de consumo Grok mostrando as opções dos planos Gratuito e SuperGrok

Comparação dos níveis de consumo da xAI: Gratuito vs SuperGrok

Recurso	Gratuito	SuperGrok (~$30/mês)
Chat	Sim	Sim
Busca em tempo real na web + X	Sim	Sim
Geração de imagem	Sim	Sim
Geração de vídeo (até 15s, 720p)	Sim	Sim
Conversas por voz	Sim	Sim
Análise de arquivos e PDF	Sim	Sim
Modo multiagente	Não	Sim
Limites diários mais altos	Não	Sim
Acesso prioritário	Não	Sim
Grok Build Beta	Não	Sim

Preços da xAI API: o detalhamento completo

A xAI API é faturada em cinco categorias distintas: texto/raciocínio, imagens, vídeo, voz e ferramentas. Cada uma é medida separadamente. Entender o quadro completo é importante porque uma carga de trabalho realista que combina respostas de texto com busca na web e recuperação de arquivos pode custar duas a três vezes mais do que o preço do token sugere isoladamente.

Detalhamento completo dos preços da xAI API por categoria

Chat e raciocínio: grok-4.3 e grok-build-0.1

Os dois modelos de texto atuais são o grok-4.3 (o carro-chefe, com raciocínio) e o grok-build-0.1 (o modelo de codificação, lançado em 29 de maio de 2026).

Modelo	Contexto	Entrada	Entrada em cache	Saída
grok-4.3	1M tokens	$1,25/1M	$0,20/1M	$2,50/1M
grok-4.20-multi-agent-0309	1M tokens	$1,25/1M	$0,20/1M	$2,50/1M
grok-4.20-0309-reasoning	1M tokens	$1,25/1M	$0,20/1M	$2,50/1M
grok-4.20-0309-non-reasoning	1M tokens	$1,25/1M	$0,20/1M	$2,50/1M
grok-build-0.1	256k tokens	$1,00/1M	$0,20/1M	$2,00/1M

O grok-4.3 suporta um parâmetro configurável reasoning_effort para que você possa aumentar ou diminuir o raciocínio sem trocar de modelo. Isso é importante para o controle de custos - um desenvolvedor da comunidade observou no r/singularity que mesmo com reasoning_effort definido como low, o modelo ainda podia saltar de 1.500 para 10.000 tokens de pensamento inesperadamente. Planeje o orçamento com alguma folga.

O grok-build-0.1 é treinado especificamente para fluxos de trabalho de codificação baseados em agentes e tem uma janela de contexto de 256k - menor que o 1M do carro-chefe, mas ainda assim substancial. Atualmente, está em acesso antecipado.

Card de anúncio do modelo de codificação grok-build-0.1

Um ponto que a documentação da API menciona claramente: solicitações que violam as diretrizes de uso da xAI ainda são cobradas. Se uma chamada da Responses API for interrompida por uma violação antes da geração, você será cobrado em $0,05 por solicitação, independentemente de qualquer coisa. É um valor pequeno, mas vale a pena saber se você estiver executando fluxos de trabalho automatizados de alto volume.

Batch API: o desconto de 20-50%

A xAI Batch API reduz os custos de tokens em 20% a 50% nos modelos de texto e raciocínio. A troca: as respostas chegam em até 24 horas, em vez de em tempo real. Comparado à Batch API da OpenAI, que oferece um desconto fixo de 50%, a faixa variável de 20-50% da xAI vale a pena ser testada em sua carga de trabalho específica - o desconto real depende da carga do sistema.

Se você estiver executando inferência em lote, classificação ou pipelines de processamento de documentos onde a latência não importa, esta é a maneira mais direta de reduzir custos. A geração de imagem e vídeo não se qualifica para o desconto de lote e permanece nas taxas padrão.

Grok Imagine: imagens e vídeo

A Imagine API é medida pelo tamanho da saída e pelo nível de qualidade.

Modelo	Descrição	Entrada	Saída
grok-imagine-image	Texto/imagem → imagem, padrão	$0,002/img	$0,02/img (1K ou 2K)
grok-imagine-image-quality	Texto/imagem → imagem, alta qualidade	$0,01/img	$0,05/img (1K), $0,07/img (2K)
grok-imagine-video	Texto/imagem/vídeo → vídeo	$0,01/seg + $0,002/img	$0,05/seg (480p), $0,07/seg (720p)
grok-imagine-video-1.5-preview	Imagem → vídeo (preview)	$0,01/img	$0,08/seg (480p), $0,14/seg (720p)

Uma imagem 1K padrão através do modelo Imagine básico custa $0,02. Um vídeo de 15 segundos em 720p através do modelo 1.5 preview custa $2,10 em taxas de saída mais a entrada. Estas são taxas competitivas em comparação com o Midjourney e serviços similares, mas somam rapidamente em fluxos de trabalho de produção onde você gera em escala.

Anúncio do modelo grok-imagine-1.5 preview

Grok Voice API

A Voice API é onde os preços da xAI se tornam genuinamente incomuns - e onde o produto tem um diferencial real. A Artificial Analysis nomeou o Grok Voice Agent como o modelo de raciocínio de fala líder no início de 2026, à frente dos modelos de áudio nativos do Google e da Amazon.

Modo	Custo
Agente em tempo real	$3,00/hora
Entrada de texto em tempo real	$0,004/mensagem
Texto para fala (TTS)	$15,00/1M caracteres
Fala para texto, REST	$0,10/hora
Fala para texto, streaming	$0,20/hora

A taxa de $3/hora em tempo real é como a maioria das aplicações atingirá este item de linha. Nessa taxa, 1.000 horas de conversas de voz custam $3.000 - leve isso em conta antes de criar recursos baseados prioritariamente em voz. Compare-o com a Realtime API da OpenAI ao finalizar sua escolha de arquitetura.

Parceria entre xAI e Vapi alimentando o Grok Voice, conforme retirado de x.ai

Chamadas de ferramentas: o maior custo oculto

É aqui que as faturas reais da xAI API divergem drasticamente da estimativa baseada apenas em tokens. As ferramentas do lado do servidor são cobradas por chamada, além dos custos de tokens.

Ferramenta	Nome da API	Custo
Busca na web	`web_search`	$5,00/1k chamadas
Busca no X	`x_search`	$5,00/1k chamadas
Execução de código	`code_execution` / `code_interpreter`	$5,00/1k chamadas
Anexos de arquivo	`attachment_search`	$10,00/1k chamadas
Busca em coleções (RAG)	`collections_search` / `file_search`	$2,50/1k chamadas
Compreensão de imagem	`view_image`	Apenas baseado em tokens

Se o seu agente realizar uma busca na web em cada interação, isso custará $5 por 1.000 solicitações, além do custo dos tokens. Uma carga de trabalho de 10.000 solicitações com busca na web ativada em cada turno adiciona $50 à conta antes de qualquer taxa de token ou armazenamento. A comunidade notou isso claramente: "O Grok é ordens de grandeza mais barato e ignora os limites de extração de dados da X API" - a integração de busca no X é genuinamente diferenciada, mas não é gratuita.

Armazenamento

Arquivos e coleções (RAG) são cobrados por GiB por dia.

Recurso	Taxa
Armazenamento de arquivos	$0,025/GiB/dia
Armazenamento de coleções	$0,10/GiB/dia
Downloads de arquivos	$0,20/GiB
Downloads de coleções	$0,20/GiB

As coleções (busca vetorial) custam quatro vezes mais para manter do que o armazenamento de arquivos brutos. Se você estiver construindo um pipeline de RAG na xAI, vale a pena projetar isso. 100 GiB de armazenamento de coleção custam $10/dia ou $300/mês apenas em taxas de armazenamento - antes de qualquer custo de consulta.

O histórico de preços: como chegamos aqui

A trajetória de preços da xAI vale a pena ser conhecida porque molda como ler os números atuais.

Histórico de preços da xAI Grok API desde o lançamento até junho de 2026

O Grok 4 foi lançado em julho de 2025 a $3,00/1M de entrada e $15,00/1M de saída - comparável ao Claude Sonnet na época, mas mais caro que alternativas comuns. A xAI então introduziu o Grok 4 Fast por um valor dramaticamente mais barato de $0,20/1M de entrada e $0,50/1M de saída, o que tornou a API genuinamente competitiva para cargas de trabalho sensíveis ao preço.

"O Grok-4-1-fast-reasoning custa $0,20 para entrada. O grok-4.3 custa $1,20. Eu só uso o Grok como processador visual, então o aumento de custo não vai bater tão forte, mas ainda assim - isso parece uma decisão econômica tanto quanto uma decisão de 'forçar os usuários para a plataforma mais recente'."

-- u/slickriptide no r/MyBoyfriendIsAI

Em maio de 2026, a xAI descontinuou oito modelos, incluindo Grok 3, Grok 4 Fast, grok-4-1-fast-reasoning e grok-code-fast-1. O efeito: os usuários que criaram com base nos modelos econômicos rápidos tiveram que migrar para o grok-4.3, que custa 6x mais por token de entrada. O preço atual de $1,25/$2,50 representa uma redução de 58% em relação ao preço de lançamento original do Grok 4, mas um aumento acentuado para quem dependia das alternativas de nível fast que não existem mais.

A outra mudança significativa: a xAI encerrou seu "programa de compartilhamento de dados" em maio de 2025, que fornecia $150/mês em créditos gratuitos de API. Não há mais um nível de API gratuito para novos desenvolvedores.

Custos ocultos para incluir no orçamento

Algumas coisas que não aparecem de forma óbvia nas taxas de token principais:

Picos de tokens de raciocínio. O grok-4.3 usa um parâmetro de esforço de raciocínio configurável, mas o esforço "baixo" não garante contagens baixas de tokens. Um desenvolvedor no r/singularity relatou que o modelo saltou de uma média de 1.500 tokens de pensamento para 10.000 no mesmo prompt sem explicação. Se você estiver definindo limites de custo, preveja pelo menos 3-4x de folga sobre sua base esperada de tokens de raciocínio.

Janelas de descontinuação de modelos. Oito modelos foram descontinuados com pouco aviso prévio em maio de 2026. Se você fixar um nome de modelo versionado (por exemplo, grok-4-0709), terá estabilidade até a data de descontinuação; se usar o alias (grok-4.3), será migrado automaticamente, mas poderá sofrer mudanças inesperadas de capacidade. Nenhum dos dois é obviamente mais seguro - um oferece a certeza do fim, o outro oferece continuidade até que não ofereça mais.

Chamadas de ferramentas em cada turno. A API é compatível com OpenAI, o que facilita a migração, mas as ferramentas da OpenAI não são faturadas da mesma maneira. O web_search a $5/1k chamadas é um novo item de linha para equipes que mudam de uma configuração de chamada de ferramenta que anteriormente não cobrava por chamada. Audite suas chamadas de ferramenta médias por sessão antes de projetar o custo total.

Violações das diretrizes de uso. Uma taxa de $0,05 se aplica a qualquer solicitação flagrada violando as diretrizes de uso antes da geração. Para a maioria das cargas de trabalho legítimas, isso nunca é acionado, mas para pipelines de moderação de conteúdo ou testes adversários, vale a pena notar.

Quem deve pagar pelo quê

Grok Gratuito: Funciona bem para indivíduos que usam o Grok como ferramenta de pesquisa, assistente de escrita ou para tirar dúvidas casuais. O conjunto de recursos multimodais é generoso a custo zero. Você atingirá os limites diários se usá-lo intensamente.

SuperGrok (~$30/mês): Vale a pena se você depende do modo multiagente para tarefas de pesquisa, atinge regularmente os limites diários do nível gratuito ou deseja o Grok Build para automações de código. A um valor fixo de $30, é comparável aos preços do Claude Pro e aos preços do ChatGPT em seus respectivos níveis Plus.

xAI API: A escolha certa para desenvolvedores que criam aplicativos. Os preços dos tokens são competitivos, a compatibilidade com o SDK da OpenAI significa baixa fricção na migração e a integração de busca no X é genuinamente única se você estiver construindo algo que precise de dados sociais em tempo real. Fique atento às taxas de ferramentas e armazenamento; é onde a conta realmente reside para cargas de trabalho baseadas em agentes.

Batch API: A escolha óbvia para qualquer carga de trabalho assíncrona - processamento de documentos, classificação em massa, avaliação offline. O desconto de 20-50% é significativo em volume.

Azure/Oracle/Google Cloud: Se sua infraestrutura já estiver em uma dessas nuvens e você quiser o Grok sem um relacionamento separado com o fornecedor, as rotas do marketplace na nuvem funcionam. Os preços variam de acordo com o provedor e vale a pena comparar com as taxas diretas da xAI antes de se comprometer. As páginas da lista de modelos OpenAI e de preços Qwen valem a leitura junto com esta para comparar o que diferentes provedores de API cobram por modelos de classe frontier no momento.

Experimente o eesel

Se você estiver avaliando APIs de IA para alimentar seus fluxos de trabalho de suporte ou conhecimento, o eesel merece uma olhada junto com os preços brutos dos modelos. O eesel implementa agentes de IA autônomos diretamente dentro de suas ferramentas existentes - Zendesk, Slack, Freshdesk, Shopify e mais de 100 outras - sem exigir que você mesmo conecte APIs de LLM, chamadas de ferramentas e faturamento de armazenamento. O preço é baseado em tarefas: $0,40 por tarefa regular (ticket, resposta no chat) com um crédito gratuito de $50 para começar. Não há taxa de plataforma no autoatendimento, nem custos por assento, e os agentes pausam ao atingir seu limite de gastos. Para equipes que desejam resolução por IA sem a contabilidade por token, o preço do eesel é uma comparação mais clara com o SuperGrok do que as taxas brutas da API.

Perguntas Frequentes

Quanto custa a xAI Grok API por milhão de tokens?

O modelo carro-chefe atual, grok-4.3, custa $1,25 por milhão de tokens de entrada e $2,50 por milhão de tokens de saída. Entradas em cache caem para $0,20 por milhão. O grok-build-0.1, focado em codificação, é um pouco mais barato, custando $1,00/$2,00 por milhão de tokens. Ambos os preços são de maio de 2026 e representam uma redução significativa em relação ao preço de lançamento do Grok 4, de $3/$15 por milhão em julho de 2025.

Qual é a diferença entre o SuperGrok e o plano gratuito do Grok?

Ambos os planos incluem o chat Grok, geração de imagens, voz e busca em tempo real no X/web. O SuperGrok (aproximadamente $30/mês) adiciona limites diários mais altos, acesso prioritário durante horários de pico e o modo multiagente, onde agentes paralelos resolvem subproblemas simultaneamente e mesclam seu raciocínio em uma única resposta citada. O Grok Build Beta também está incluído no SuperGrok e no X Premium+. O plano gratuito tem limite de taxa, mas, fora isso, acessa os mesmos recursos principais.

A xAI API oferece desconto para processamento em lote (batch pricing)?

Sim. A xAI Batch API reduz os custos de tokens em 20% a 50% em comparação com as taxas padrão em tempo real. A compensação é a latência da resposta: as solicitações em lote são processadas em até 24 horas, em vez de imediatamente. O desconto de lote aplica-se a modelos de texto e raciocínio; a geração de imagem e vídeo ainda é faturada pelas taxas padrão, independentemente do modo de lote.

Como os preços da xAI API mudaram desde o lançamento do Grok 4?

Significativamente. O Grok 4 foi lançado em julho de 2025 a $3,00/1M de tokens de entrada e $15,00/1M de tokens de saída. A xAI introduziu posteriormente o Grok 4 Fast a $0,20/1M de entrada e $0,50/1M de saída antes de descontinuá-lo em maio de 2026. O grok-4.3 atual está em $1,25/$2,50 por milhão de tokens - uma redução de 58% em relação ao preço de lançamento, mas um aumento de 6x para usuários que dependiam dos modelos fast/budget antes de serem descontinuados. Você pode comparar essa trajetória com as alternativas à xAI para ver onde ela se posiciona hoje.

Posso acessar os modelos Grok por meio de provedores de nuvem como Azure ou Google Cloud?

Sim. Os modelos xAI Grok estão disponíveis através do Microsoft Azure AI Foundry, Oracle Cloud Infrastructure Generative AI e Google Cloud Vertex Model Garden. Os preços na nuvem variam de acordo com o provedor e podem ser diferentes das taxas diretas da API da xAI. A própria xAI API é compatível com OpenAI, portanto, a migração dos preços da ChatGPT API ou Claude API geralmente requer mudanças mínimas no código.

Contrate seu colega de IA

Configure em minutos. Sem cartão de crédito.

Teste grátis Agendar demo

Share this article

Article by

Alicia Kirana Utomo

Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.