Preços da xAI explicados: um guia completo para 2026

Kira
Escrito por

Kira

Katelin Teen
Revisado por

Katelin Teen

Última edição June 5, 2026

Verificado por especialista
Ilustração editorial dos níveis de preços da xAI em um fundo esbranquiçado quente com toques de verde-oliva suaves

Resumo

A xAI opera dois modelos de preços separados que não se sobrepõem muito. O produto para o consumidor - Grok - é gratuito (com limites diários) ou custa $30/mês para o SuperGrok, que adiciona o modo multiagente e limites mais altos. A API cobra por token, sem valor mensal mínimo.

O carro-chefe atual da API, grok-4.3, custa $1,25 por milhão de tokens de entrada e $2,50 por milhão de tokens de saída - uma queda em relação aos $3/$15 no lançamento do Grok 4 em julho de 2025. Esse é o número principal, mas a conta real depende muito de você usar a busca na web ($5 por 1.000 chamadas), voz ($3/hora em tempo real) ou armazenamento de arquivos ($0,025/GiB/dia). Cada um desses itens é medido separadamente e soma mais rápido do que apenas o custo dos tokens.

O nível gratuito da API (que oferecia $150/mês em créditos) terminou em maio de 2025. Novos desenvolvedores pagam desde o primeiro dia. Se você estiver avaliando a xAI em comparação com as alternativas à xAI, os preços dos tokens parecem competitivos, mas as taxas de ferramentas e armazenamento mudam substancialmente o cenário do custo total de propriedade.

O que a xAI realmente vende

A xAI é a empresa de pesquisa em IA de Elon Musk, fundada em 2023 e mais conhecida pela família de modelos Grok. A empresa processa mais de 1 milhão de chamadas de API por dia com latência inferior a 200ms em sua infraestrutura Colossus, e projeções da comunidade estimam sua receita independente em $500 milhões em 2025, crescendo para $2 bilhões em 2026 - embora esses números sejam estimativas da comunidade e não números auditados.

O produto tem dois modos: um chatbot para o consumidor (Grok) e uma API para desenvolvedores. O preço de cada um é completamente diferente, que é a primeira coisa que confunde as pessoas.

Página da xAI API mostrando níveis de preços e opções para desenvolvedores

Planos para o consumidor: Gratuito e SuperGrok

O produto para o consumidor reside em grok.com e nos aplicativos para iOS e Android. Tanto o nível gratuito quanto o pago incluem os mesmos recursos principais: chat Grok, integração em tempo real com a web e o X/Twitter, geração de imagens, geração de vídeo (até 15 segundos em 720p), conversas por voz e análise de arquivos. A lista é surpreendentemente longa para um nível gratuito.

O que o SuperGrok adiciona é fôlego e capacidade. Por aproximadamente $30/mês (também incluído no X Premium+), você recebe:

  • Limites diários mais altos em todas as categorias de recursos
  • Acesso prioritário durante horários de pico, quando o nível gratuito entra em fila
  • Modo multiagente - o maior diferencial. Vários agentes resolvem subproblemas em paralelo, cada um mostra sua cadeia de raciocínio e os resultados são mesclados em uma única resposta citada
  • Grok Build Beta para automações de código e fluxos de trabalho em modo plano

O plano gratuito é generoso o suficiente para uso ocasional. A questão é se você atingirá os limites. Se você é um desenvolvedor testando os modelos, o nível gratuito para o consumidor se esgota rapidamente e a API é quase sempre o melhor caminho.

Página do produto de consumo Grok mostrando as opções dos planos Gratuito e SuperGrok
Comparação dos níveis de consumo da xAI: Gratuito vs SuperGrok
Comparação dos níveis de consumo da xAI: Gratuito vs SuperGrok
RecursoGratuitoSuperGrok (~$30/mês)
ChatSimSim
Busca em tempo real na web + XSimSim
Geração de imagemSimSim
Geração de vídeo (até 15s, 720p)SimSim
Conversas por vozSimSim
Análise de arquivos e PDFSimSim
Modo multiagenteNãoSim
Limites diários mais altosNãoSim
Acesso prioritárioNãoSim
Grok Build BetaNãoSim

Preços da xAI API: o detalhamento completo

A xAI API é faturada em cinco categorias distintas: texto/raciocínio, imagens, vídeo, voz e ferramentas. Cada uma é medida separadamente. Entender o quadro completo é importante porque uma carga de trabalho realista que combina respostas de texto com busca na web e recuperação de arquivos pode custar duas a três vezes mais do que o preço do token sugere isoladamente.

Detalhamento completo dos preços da xAI API por categoria
Detalhamento completo dos preços da xAI API por categoria

Chat e raciocínio: grok-4.3 e grok-build-0.1

Os dois modelos de texto atuais são o grok-4.3 (o carro-chefe, com raciocínio) e o grok-build-0.1 (o modelo de codificação, lançado em 29 de maio de 2026).

ModeloContextoEntradaEntrada em cacheSaída
grok-4.31M tokens$1,25/1M$0,20/1M$2,50/1M
grok-4.20-multi-agent-03091M tokens$1,25/1M$0,20/1M$2,50/1M
grok-4.20-0309-reasoning1M tokens$1,25/1M$0,20/1M$2,50/1M
grok-4.20-0309-non-reasoning1M tokens$1,25/1M$0,20/1M$2,50/1M
grok-build-0.1256k tokens$1,00/1M$0,20/1M$2,00/1M

O grok-4.3 suporta um parâmetro configurável reasoning_effort para que você possa aumentar ou diminuir o raciocínio sem trocar de modelo. Isso é importante para o controle de custos - um desenvolvedor da comunidade observou no r/singularity que mesmo com reasoning_effort definido como low, o modelo ainda podia saltar de 1.500 para 10.000 tokens de pensamento inesperadamente. Planeje o orçamento com alguma folga.

O grok-build-0.1 é treinado especificamente para fluxos de trabalho de codificação baseados em agentes e tem uma janela de contexto de 256k - menor que o 1M do carro-chefe, mas ainda assim substancial. Atualmente, está em acesso antecipado.

Card de anúncio do modelo de codificação grok-build-0.1
Card de anúncio do modelo de codificação grok-build-0.1

Um ponto que a documentação da API menciona claramente: solicitações que violam as diretrizes de uso da xAI ainda são cobradas. Se uma chamada da Responses API for interrompida por uma violação antes da geração, você será cobrado em $0,05 por solicitação, independentemente de qualquer coisa. É um valor pequeno, mas vale a pena saber se você estiver executando fluxos de trabalho automatizados de alto volume.

Batch API: o desconto de 20-50%

A xAI Batch API reduz os custos de tokens em 20% a 50% nos modelos de texto e raciocínio. A troca: as respostas chegam em até 24 horas, em vez de em tempo real. Comparado à Batch API da OpenAI, que oferece um desconto fixo de 50%, a faixa variável de 20-50% da xAI vale a pena ser testada em sua carga de trabalho específica - o desconto real depende da carga do sistema.

Se você estiver executando inferência em lote, classificação ou pipelines de processamento de documentos onde a latência não importa, esta é a maneira mais direta de reduzir custos. A geração de imagem e vídeo não se qualifica para o desconto de lote e permanece nas taxas padrão.

Grok Imagine: imagens e vídeo

A Imagine API é medida pelo tamanho da saída e pelo nível de qualidade.

ModeloDescriçãoEntradaSaída
grok-imagine-imageTexto/imagem → imagem, padrão$0,002/img$0,02/img (1K ou 2K)
grok-imagine-image-qualityTexto/imagem → imagem, alta qualidade$0,01/img$0,05/img (1K), $0,07/img (2K)
grok-imagine-videoTexto/imagem/vídeo → vídeo$0,01/seg + $0,002/img$0,05/seg (480p), $0,07/seg (720p)
grok-imagine-video-1.5-previewImagem → vídeo (preview)$0,01/img$0,08/seg (480p), $0,14/seg (720p)

Uma imagem 1K padrão através do modelo Imagine básico custa $0,02. Um vídeo de 15 segundos em 720p através do modelo 1.5 preview custa $2,10 em taxas de saída mais a entrada. Estas são taxas competitivas em comparação com o Midjourney e serviços similares, mas somam rapidamente em fluxos de trabalho de produção onde você gera em escala.

Anúncio do modelo grok-imagine-1.5 preview
Anúncio do modelo grok-imagine-1.5 preview

Grok Voice API

A Voice API é onde os preços da xAI se tornam genuinamente incomuns - e onde o produto tem um diferencial real. A Artificial Analysis nomeou o Grok Voice Agent como o modelo de raciocínio de fala líder no início de 2026, à frente dos modelos de áudio nativos do Google e da Amazon.

ModoCusto
Agente em tempo real$3,00/hora
Entrada de texto em tempo real$0,004/mensagem
Texto para fala (TTS)$15,00/1M caracteres
Fala para texto, REST$0,10/hora
Fala para texto, streaming$0,20/hora

A taxa de $3/hora em tempo real é como a maioria das aplicações atingirá este item de linha. Nessa taxa, 1.000 horas de conversas de voz custam $3.000 - leve isso em conta antes de criar recursos baseados prioritariamente em voz. Compare-o com a Realtime API da OpenAI ao finalizar sua escolha de arquitetura.

Parceria entre xAI e Vapi alimentando o Grok Voice, conforme retirado de x.ai
Parceria entre xAI e Vapi alimentando o Grok Voice, conforme retirado de x.ai

Chamadas de ferramentas: o maior custo oculto

É aqui que as faturas reais da xAI API divergem drasticamente da estimativa baseada apenas em tokens. As ferramentas do lado do servidor são cobradas por chamada, além dos custos de tokens.

FerramentaNome da APICusto
Busca na webweb_search$5,00/1k chamadas
Busca no Xx_search$5,00/1k chamadas
Execução de códigocode_execution / code_interpreter$5,00/1k chamadas
Anexos de arquivoattachment_search$10,00/1k chamadas
Busca em coleções (RAG)collections_search / file_search$2,50/1k chamadas
Compreensão de imagemview_imageApenas baseado em tokens

Se o seu agente realizar uma busca na web em cada interação, isso custará $5 por 1.000 solicitações, além do custo dos tokens. Uma carga de trabalho de 10.000 solicitações com busca na web ativada em cada turno adiciona $50 à conta antes de qualquer taxa de token ou armazenamento. A comunidade notou isso claramente: "O Grok é ordens de grandeza mais barato e ignora os limites de extração de dados da X API" - a integração de busca no X é genuinamente diferenciada, mas não é gratuita.

Armazenamento

Arquivos e coleções (RAG) são cobrados por GiB por dia.

RecursoTaxa
Armazenamento de arquivos$0,025/GiB/dia
Armazenamento de coleções$0,10/GiB/dia
Downloads de arquivos$0,20/GiB
Downloads de coleções$0,20/GiB

As coleções (busca vetorial) custam quatro vezes mais para manter do que o armazenamento de arquivos brutos. Se você estiver construindo um pipeline de RAG na xAI, vale a pena projetar isso. 100 GiB de armazenamento de coleção custam $10/dia ou $300/mês apenas em taxas de armazenamento - antes de qualquer custo de consulta.

O histórico de preços: como chegamos aqui

A trajetória de preços da xAI vale a pena ser conhecida porque molda como ler os números atuais.

Histórico de preços da xAI Grok API desde o lançamento até junho de 2026
Histórico de preços da xAI Grok API desde o lançamento até junho de 2026

O Grok 4 foi lançado em julho de 2025 a $3,00/1M de entrada e $15,00/1M de saída - comparável ao Claude Sonnet na época, mas mais caro que alternativas comuns. A xAI então introduziu o Grok 4 Fast por um valor dramaticamente mais barato de $0,20/1M de entrada e $0,50/1M de saída, o que tornou a API genuinamente competitiva para cargas de trabalho sensíveis ao preço.

"O Grok-4-1-fast-reasoning custa $0,20 para entrada. O grok-4.3 custa $1,20. Eu só uso o Grok como processador visual, então o aumento de custo não vai bater tão forte, mas ainda assim - isso parece uma decisão econômica tanto quanto uma decisão de 'forçar os usuários para a plataforma mais recente'."

-- u/slickriptide no r/MyBoyfriendIsAI

Em maio de 2026, a xAI descontinuou oito modelos, incluindo Grok 3, Grok 4 Fast, grok-4-1-fast-reasoning e grok-code-fast-1. O efeito: os usuários que criaram com base nos modelos econômicos rápidos tiveram que migrar para o grok-4.3, que custa 6x mais por token de entrada. O preço atual de $1,25/$2,50 representa uma redução de 58% em relação ao preço de lançamento original do Grok 4, mas um aumento acentuado para quem dependia das alternativas de nível fast que não existem mais.

A outra mudança significativa: a xAI encerrou seu "programa de compartilhamento de dados" em maio de 2025, que fornecia $150/mês em créditos gratuitos de API. Não há mais um nível de API gratuito para novos desenvolvedores.

Custos ocultos para incluir no orçamento

Algumas coisas que não aparecem de forma óbvia nas taxas de token principais:

Picos de tokens de raciocínio. O grok-4.3 usa um parâmetro de esforço de raciocínio configurável, mas o esforço "baixo" não garante contagens baixas de tokens. Um desenvolvedor no r/singularity relatou que o modelo saltou de uma média de 1.500 tokens de pensamento para 10.000 no mesmo prompt sem explicação. Se você estiver definindo limites de custo, preveja pelo menos 3-4x de folga sobre sua base esperada de tokens de raciocínio.

Janelas de descontinuação de modelos. Oito modelos foram descontinuados com pouco aviso prévio em maio de 2026. Se você fixar um nome de modelo versionado (por exemplo, grok-4-0709), terá estabilidade até a data de descontinuação; se usar o alias (grok-4.3), será migrado automaticamente, mas poderá sofrer mudanças inesperadas de capacidade. Nenhum dos dois é obviamente mais seguro - um oferece a certeza do fim, o outro oferece continuidade até que não ofereça mais.

Chamadas de ferramentas em cada turno. A API é compatível com OpenAI, o que facilita a migração, mas as ferramentas da OpenAI não são faturadas da mesma maneira. O web_search a $5/1k chamadas é um novo item de linha para equipes que mudam de uma configuração de chamada de ferramenta que anteriormente não cobrava por chamada. Audite suas chamadas de ferramenta médias por sessão antes de projetar o custo total.

Violações das diretrizes de uso. Uma taxa de $0,05 se aplica a qualquer solicitação flagrada violando as diretrizes de uso antes da geração. Para a maioria das cargas de trabalho legítimas, isso nunca é acionado, mas para pipelines de moderação de conteúdo ou testes adversários, vale a pena notar.

Quem deve pagar pelo quê

Grok Gratuito: Funciona bem para indivíduos que usam o Grok como ferramenta de pesquisa, assistente de escrita ou para tirar dúvidas casuais. O conjunto de recursos multimodais é generoso a custo zero. Você atingirá os limites diários se usá-lo intensamente.

SuperGrok (~$30/mês): Vale a pena se você depende do modo multiagente para tarefas de pesquisa, atinge regularmente os limites diários do nível gratuito ou deseja o Grok Build para automações de código. A um valor fixo de $30, é comparável aos preços do Claude Pro e aos preços do ChatGPT em seus respectivos níveis Plus.

xAI API: A escolha certa para desenvolvedores que criam aplicativos. Os preços dos tokens são competitivos, a compatibilidade com o SDK da OpenAI significa baixa fricção na migração e a integração de busca no X é genuinamente única se você estiver construindo algo que precise de dados sociais em tempo real. Fique atento às taxas de ferramentas e armazenamento; é onde a conta realmente reside para cargas de trabalho baseadas em agentes.

Batch API: A escolha óbvia para qualquer carga de trabalho assíncrona - processamento de documentos, classificação em massa, avaliação offline. O desconto de 20-50% é significativo em volume.

Azure/Oracle/Google Cloud: Se sua infraestrutura já estiver em uma dessas nuvens e você quiser o Grok sem um relacionamento separado com o fornecedor, as rotas do marketplace na nuvem funcionam. Os preços variam de acordo com o provedor e vale a pena comparar com as taxas diretas da xAI antes de se comprometer. As páginas da lista de modelos OpenAI e de preços Qwen valem a leitura junto com esta para comparar o que diferentes provedores de API cobram por modelos de classe frontier no momento.

Experimente o eesel

Se você estiver avaliando APIs de IA para alimentar seus fluxos de trabalho de suporte ou conhecimento, o eesel merece uma olhada junto com os preços brutos dos modelos. O eesel implementa agentes de IA autônomos diretamente dentro de suas ferramentas existentes - Zendesk, Slack, Freshdesk, Shopify e mais de 100 outras - sem exigir que você mesmo conecte APIs de LLM, chamadas de ferramentas e faturamento de armazenamento. O preço é baseado em tarefas: $0,40 por tarefa regular (ticket, resposta no chat) com um crédito gratuito de $50 para começar. Não há taxa de plataforma no autoatendimento, nem custos por assento, e os agentes pausam ao atingir seu limite de gastos. Para equipes que desejam resolução por IA sem a contabilidade por token, o preço do eesel é uma comparação mais clara com o SuperGrok do que as taxas brutas da API.

Perguntas Frequentes

O modelo carro-chefe atual, grok-4.3, custa $1,25 por milhão de tokens de entrada e $2,50 por milhão de tokens de saída. Entradas em cache caem para $0,20 por milhão. O grok-build-0.1, focado em codificação, é um pouco mais barato, custando $1,00/$2,00 por milhão de tokens. Ambos os preços são de maio de 2026 e representam uma redução significativa em relação ao preço de lançamento do Grok 4, de $3/$15 por milhão em julho de 2025.
Ambos os planos incluem o chat Grok, geração de imagens, voz e busca em tempo real no X/web. O SuperGrok (aproximadamente $30/mês) adiciona limites diários mais altos, acesso prioritário durante horários de pico e o modo multiagente, onde agentes paralelos resolvem subproblemas simultaneamente e mesclam seu raciocínio em uma única resposta citada. O Grok Build Beta também está incluído no SuperGrok e no X Premium+. O plano gratuito tem limite de taxa, mas, fora isso, acessa os mesmos recursos principais.
Sim. A xAI Batch API reduz os custos de tokens em 20% a 50% em comparação com as taxas padrão em tempo real. A compensação é a latência da resposta: as solicitações em lote são processadas em até 24 horas, em vez de imediatamente. O desconto de lote aplica-se a modelos de texto e raciocínio; a geração de imagem e vídeo ainda é faturada pelas taxas padrão, independentemente do modo de lote.
Significativamente. O Grok 4 foi lançado em julho de 2025 a $3,00/1M de tokens de entrada e $15,00/1M de tokens de saída. A xAI introduziu posteriormente o Grok 4 Fast a $0,20/1M de entrada e $0,50/1M de saída antes de descontinuá-lo em maio de 2026. O grok-4.3 atual está em $1,25/$2,50 por milhão de tokens - uma redução de 58% em relação ao preço de lançamento, mas um aumento de 6x para usuários que dependiam dos modelos fast/budget antes de serem descontinuados. Você pode comparar essa trajetória com as alternativas à xAI para ver onde ela se posiciona hoje.
Sim. Os modelos xAI Grok estão disponíveis através do Microsoft Azure AI Foundry, Oracle Cloud Infrastructure Generative AI e Google Cloud Vertex Model Garden. Os preços na nuvem variam de acordo com o provedor e podem ser diferentes das taxas diretas da API da xAI. A própria xAI API é compatível com OpenAI, portanto, a migração dos preços da ChatGPT API ou Claude API geralmente requer mudanças mínimas no código.

Share this article

Kira

Article by

Kira

A Computer Science student deeply passionate in the fields of UI/UX Design and Web Development with a knack on writing. Fusing technical expertise with a creative flair, I'm driven to craft innovative and user-centric solutions, leveraging both coding proficiency and design sensibilities to create seamless, impactful experiences.

Related Posts

All posts →
Banner com a análise dos preços da Gamma 2026
AI tools

Preços da Gamma em 2026: cada plano, cada pegadinha e quanto custa de verdade

Uma análise completa dos preços da Gamma em 2026: cada plano, cada custo de crédito, a armadilha do reembolso de 3 dias e o que os usuários reais realmente pagam.

Rama Adi NugrahaRama Adi NugrahaJun 5, 2026
Guia de preços do HeyGen 2026 - detalhamento de planos e créditos
AI Tools

Preços do HeyGen (2026): planos, créditos e o que você realmente pagará

Os preços do HeyGen começam em $29/mês, mas a lógica dos créditos muda tudo. Veja quanto cada plano custa na prática ao considerar o uso do Avatar IV.

Stevia PutriStevia PutriJun 5, 2026
Ilustração editorial dos níveis de preço e custo de tokens do Leonardo.AI
AI Tools

Preços do Leonardo.AI: cada plano, token e custo oculto (2026)

Detalhamento dos preços do Leonardo.AI para 2026: cada plano, a lógica dos tokens, o que o "ilimitado" realmente exclui e os custos ocultos que pegam as equipes de surpresa.

Riellvriany IndriawanRiellvriany IndriawanJun 5, 2026
Preços da Luma AI 2026 - planos Luma Agents, Dream Machine e Ray 3
AI Tools

Preços da Luma AI (2026): Dream Machine, Luma Agents e o custo real por clipe

Os preços da Luma foram redefinidos para 2026. Veja quanto cada plano realmente custa ao considerar o consumo de créditos, a ausência de acúmulo e a diferença entre Plus e Pro.

Rama Adi NugrahaRama Adi NugrahaJun 5, 2026
Guia de preços do Midjourney 2026 - planos, horas de GPU e custos ocultos
AI Tools

Preços do Midjourney em 2026: Planos, horas de GPU e quanto custa de verdade

Os quatro planos do Midjourney variam de $10 a $120/mês - mas a parte confusa é que você está comprando tempo de computação de GPU, não imagens. Veja o que cada plano realmente oferece em 2026.

Stevia PutriStevia PutriJun 5, 2026
Imagem de destaque da visão geral dos planos de preços do Pika AI
AI Tools

Preços do Pika AI (2026): Planos, créditos e o que você realmente paga

O Pika AI começa em $0, mas a lógica dos créditos é complexa. Aqui estão todos os planos, o custo por vídeo e as pegadinhas antes de você assinar.

Stevia PutriStevia PutriJun 5, 2026
Fluxo de trabalho do terminal Claude Code com o logotipo da Anthropic em um fundo editorial off-white quente
AI Tools

Análise do Claude Code (2026): a ferramenta de codificação agentic da Anthropic, testada

Testamos o Claude Code em todas as superfícies e planos. Veja o que o plano Pro de $17/mês realmente entrega, quando o plano Max de $100/mês faz sentido e nossa opinião sincera sobre os limites de taxa.

Stevia PutriStevia PutriJun 4, 2026
Infográfico de visão geral dos preços do Qwen mostrando níveis de modelo e custos de API
AI Tools

Preços do Qwen em 2026: cada modelo, o que você realmente paga e onde vale a pena

Detalhamento completo dos preços da API Qwen para 2026: cada nível de modelo, custos do modo de pensamento, mudanças no nível gratuito e exemplos de custos reais vs Claude e GPT.

Stevia PutriStevia PutriJun 4, 2026

Pronto para contratar seu colega de IA?

Configure em minutos. Sem cartão de crédito necessário.

Comece grátis