
Resumen (TL;DR)
xAI cuenta con dos líneas de precios independientes que no se solapan mucho. El producto para el consumidor - Grok - es gratuito (con límites diarios) o cuesta $30/mes con SuperGrok, que añade el modo multiagente y límites más altos. La API factura por token sin un mínimo mensual.
El modelo insignia actual de la API, grok-4.3, cuesta $1.25 por millón de tokens de entrada y $2.50 por millón de tokens de salida, frente a los $3/$15 del lanzamiento de Grok 4 en julio de 2025. Esa es la cifra principal, pero la factura real depende en gran medida de si utilizas la búsqueda web ($5 por cada 1,000 llamadas), voz ($3/hora en tiempo real) o almacenamiento de archivos ($0.025/GiB/día). Cada uno de estos conceptos se mide por separado y se acumula más rápido que el coste del token por sí solo.
El nivel gratuito de la API (que otorgaba $150/mes en créditos) finalizó en mayo de 2025. Los nuevos desarrolladores pagan desde el primer día. Si estás comparando xAI con alternativas a xAI, los precios de los tokens parecen competitivos, pero los cargos por herramientas y almacenamiento cambian sustancialmente el panorama del coste total de propiedad.
Qué vende xAI realmente
xAI es la empresa de investigación en IA de Elon Musk, fundada en 2023 y conocida sobre todo por la familia de modelos Grok. La empresa gestiona más de 1 millón de llamadas a la API al día con una latencia inferior a 200 ms en su infraestructura Colossus, y las proyecciones de la comunidad sitúan sus ingresos independientes en 500 millones de dólares en 2025, creciendo hacia los 2,000 millones en 2026, aunque estas cifras son estimaciones informadas por la comunidad, no números auditados.
El producto tiene dos modalidades: un chatbot para el consumidor (Grok) y una API para desarrolladores. El precio de cada uno es completamente diferente, que es lo primero que suele confundir a la gente.
Planes para consumidores: Free y SuperGrok
El producto para el consumidor reside en grok.com y en iOS y Android. Tanto el nivel gratuito como el de pago incluyen las mismas funciones principales: chat de Grok, integración en tiempo real con la web y X/Twitter, generación de imágenes, generación de vídeo (hasta 15 segundos a 720p), conversaciones de voz y análisis de archivos. La lista es sorprendentemente larga para un nivel gratuito.
Lo que añade SuperGrok es margen y capacidad. Por aproximadamente $30/mes (también incluido con X Premium+), obtienes:
- Límites diarios más altos en todas las categorías de funciones.
- Acceso prioritario durante las horas punta cuando el nivel gratuito tiene colas.
- Modo multiagente: el mayor factor diferenciador. Varios agentes abordan subproblemas en paralelo, cada uno muestra su cadena de razonamiento y los resultados se fusionan en una única respuesta con citas.
- Grok Build Beta para automatizaciones de código y flujos de trabajo en modo plan.
El plan gratuito es lo suficientemente generoso para un uso ocasional. La cuestión es si llegas a los límites. Si eres un desarrollador que está probando los modelos, el nivel gratuito para consumidores se agota rápidamente y la API es casi siempre el mejor camino.

| Función | Free | SuperGrok (~$30/mes) |
|---|---|---|
| Chat | Sí | Sí |
| Búsqueda en la web + X en tiempo real | Sí | Sí |
| Generación de imágenes | Sí | Sí |
| Generación de vídeo (hasta 15s, 720p) | Sí | Sí |
| Conversaciones de voz | Sí | Sí |
| Análisis de archivos y PDF | Sí | Sí |
| Modo multiagente | No | Sí |
| Límites diarios más altos | No | Sí |
| Acceso prioritario | No | Sí |
| Grok Build Beta | No | Sí |
Precios de xAI API: el desglose completo
La xAI API se factura en cinco categorías distintas: texto/razonamiento, imágenes, vídeo, voz y herramientas. Cada una se mide por separado. Comprender el panorama completo es importante porque una carga de trabajo realista que combine respuestas de texto con búsqueda web y recuperación de archivos puede costar de dos a tres veces más de lo que sugiere el precio del token por sí solo.

Chat y razonamiento: grok-4.3 y grok-build-0.1
Los dos modelos de texto actuales son grok-4.3 (el buque insignia, con razonamiento) y grok-build-0.1 (el modelo de programación, lanzado el 29 de mayo de 2026).
| Modelo | Contexto | Entrada | Entrada en caché | Salida |
|---|---|---|---|---|
| grok-4.3 | 1M tokens | $1.25/1M | $0.20/1M | $2.50/1M |
| grok-4.20-multi-agent-0309 | 1M tokens | $1.25/1M | $0.20/1M | $2.50/1M |
| grok-4.20-0309-reasoning | 1M tokens | $1.25/1M | $0.20/1M | $2.50/1M |
| grok-4.20-0309-non-reasoning | 1M tokens | $1.25/1M | $0.20/1M | $2.50/1M |
| grok-build-0.1 | 256k tokens | $1.00/1M | $0.20/1M | $2.00/1M |
grok-4.3 admite un parámetro configurable reasoning_effort para que puedas aumentar o disminuir el razonamiento sin cambiar de modelo. Esto es importante para el control de costes: un desarrollador de la comunidad comentó en r/singularity que incluso con reasoning_effort configurado en low, el modelo podía pasar de 1,500 a 10,000 tokens de pensamiento de forma inesperada. Presupuesta con algo de margen.
grok-build-0.1 está entrenado específicamente para flujos de trabajo de programación agéntica y tiene una ventana de contexto de 256k, más corta que el millón del buque insignia pero aún sustancial. Actualmente se encuentra en acceso anticipado.

Algo que los documentos de la API mencionan claramente: las solicitudes que violan las directrices de uso de xAI se siguen cobrando. Si una llamada a la Responses API es detectada por una infracción antes de la generación, se facturan $0.05 por solicitud independientemente de todo lo demás. Es una cifra pequeña, pero vale la pena conocerla si ejecutas flujos de trabajo automatizados de gran volumen.
Batch API: el descuento del 20-50%
La xAI Batch API reduce los costes de los tokens entre un 20% y un 50% en los modelos de texto y razonamiento. La contrapartida: las respuestas llegan en un plazo de 24 horas en lugar de en tiempo real. En comparación con la Batch API de OpenAI, que ofrece un descuento plano del 50%, el rango variable del 20-50% de xAI merece ser probado en tu carga de trabajo específica; el descuento real depende de la carga.
Si ejecutas inferencia por lotes, clasificación o procesos de procesamiento de documentos donde la latencia no importa, esta es la forma más directa de reducir costes. La generación de imágenes y vídeo no cumple los requisitos para el descuento por lotes y se mantiene en las tarifas estándar.
Grok Imagine: imágenes y vídeo
La Imagine API se mide por el tamaño de salida y el nivel de calidad.
| Modelo | Descripción | Entrada | Salida |
|---|---|---|---|
| grok-imagine-image | Texto/imagen → imagen, estándar | $0.002/img | $0.02/img (1K o 2K) |
| grok-imagine-image-quality | Texto/imagen → imagen, alta calidad | $0.01/img | $0.05/img (1K), $0.07/img (2K) |
| grok-imagine-video | Texto/imagen/vídeo → vídeo | $0.01/seg + $0.002/img | $0.05/seg (480p), $0.07/seg (720p) |
| grok-imagine-video-1.5-preview | Imagen → vídeo (vista previa) | $0.01/img | $0.08/seg (480p), $0.14/seg (720p) |
Una imagen estándar de 1K a través del modelo básico Imagine cuesta $0.02. Un vídeo de 15 segundos a 720p a través del modelo 1.5 preview cuesta $2.10 en cargos de salida más la entrada. Estas son tarifas competitivas en comparación con Midjourney y servicios similares, pero se acumulan rápido en flujos de trabajo de producción donde se genera a escala.

Grok Voice API
La Voice API es donde los precios de xAI se vuelven genuinamente inusuales, y donde el producto destaca de verdad. Artificial Analysis nombró al Agente de Voz de Grok como el modelo de razonamiento de voz líder a principios de 2026, por delante de los modelos de audio nativos de Google y Amazon.
| Modo | Coste |
|---|---|
| Agente en tiempo real | $3.00/hora |
| Entrada de texto en tiempo real | $0.004/mensaje |
| Texto a voz (TTS) | $15.00/1M de caracteres |
| Voz a texto, REST | $0.10/hora |
| Voz a texto, streaming | $0.20/hora |
La tarifa de $3/hora en tiempo real es como la mayoría de las aplicaciones verán reflejado este concepto. A esa tarifa, 1,000 horas de conversaciones de voz cuestan $3,000; tenlo en cuenta antes de crear funciones que prioricen la voz. Compáralo con la Realtime API de OpenAI al finalizar tu elección de arquitectura.

Llamadas a herramientas: el mayor coste oculto
Aquí es donde las facturas reales de la API de xAI divergen drásticamente de la estimación basada solo en tokens. Las herramientas del lado del servidor se facturan por llamada, además de los costes de los tokens.
| Herramienta | Nombre en la API | Coste |
|---|---|---|
| Búsqueda web | web_search | $5.00/1k llamadas |
| Búsqueda en X | x_search | $5.00/1k llamadas |
| Ejecución de código | code_execution / code_interpreter | $5.00/1k llamadas |
| Archivos adjuntos | attachment_search | $10.00/1k llamadas |
| Búsqueda en colecciones (RAG) | collections_search / file_search | $2.50/1k llamadas |
| Comprensión de imágenes | view_image | Solo basado en tokens |
Si tu agente realiza una búsqueda web en cada turno, eso supone $5 por cada 1,000 solicitudes además de lo que cuesten los tokens. Una carga de trabajo de 10,000 solicitudes con la búsqueda web habilitada en cada turno añade $50 a la factura antes de cualquier cargo por tokens o almacenamiento. La comunidad lo señaló claramente: "Grok es magnitudes más barato y evita los límites de extracción de datos de la API de X"; la integración de búsqueda en X es realmente diferencial, pero no es gratuita.
Almacenamiento
Los archivos y las colecciones (RAG) se facturan por GiB al día.
| Recurso | Tarifa |
|---|---|
| Almacenamiento de archivos | $0.025/GiB/día |
| Almacenamiento de colecciones | $0.10/GiB/día |
| Descargas de archivos | $0.20/GiB |
| Descargas de colecciones | $0.20/GiB |
Mantener las colecciones (búsqueda vectorial) cuesta cuatro veces más que el almacenamiento de archivos sin procesar. Si estás construyendo un flujo de trabajo de RAG en xAI, vale la pena proyectar esto. 100 GiB de almacenamiento de colecciones cuestan $10/día o $300/mes solo en cargos de almacenamiento, antes de cualquier coste por consulta.
Historia de los precios: cómo hemos llegado hasta aquí
Vale la pena conocer la evolución de los precios de xAI porque ayuda a interpretar las cifras actuales.

Grok 4 se lanzó en julio de 2025 a $3.00/1M de entrada y $15.00/1M de salida, comparable a Claude Sonnet en ese momento, pero más caro que las alternativas básicas. Luego, xAI introdujo Grok 4 Fast a un precio drásticamente más bajo de $0.20/1M de entrada y $0.50/1M de salida, lo que hizo que la API fuera realmente competitiva para cargas de trabajo sensibles al precio.
"Grok-4-1-fast-reasoning cuesta $0.20 por la entrada. grok-4.3 cuesta $1.20. Solo uso Grok como procesador visual, así que el aumento de coste no me afectará tanto, pero aun así, esto parece una decisión económica tanto como una decisión de 'obligar a los usuarios a pasarse a la plataforma más reciente'".
-- u/slickriptide en r/MyBoyfriendIsAI
En mayo de 2026, xAI retiró ocho modelos, incluyendo Grok 3, Grok 4 Fast, grok-4-1-fast-reasoning y grok-code-fast-1. El efecto: los usuarios que habían construido sobre los modelos rápidos económicos tuvieron que migrar a grok-4.3, que cuesta 6 veces más por token de entrada. El precio actual de $1.25/$2.50 representa una reducción del 58% respecto al precio de lanzamiento original de Grok 4, pero un aumento brusco para cualquiera que dependiera de las alternativas de nivel rápido que ya no existen.
El otro cambio significativo: xAI puso fin a su "programa de intercambio de datos" en mayo de 2025, que había proporcionado $150/mes en créditos gratuitos de la API. Ya no existe un nivel de API gratuito para nuevos desarrolladores.
Costes ocultos a tener en cuenta en el presupuesto
Algunos aspectos que no aparecen de forma obvia en las tarifas de tokens principales:
Picos de tokens de razonamiento. grok-4.3 utiliza un parámetro de esfuerzo de razonamiento configurable, pero un esfuerzo "bajo" no garantiza recuentos bajos de tokens. Un desarrollador en r/singularity informó que el modelo saltó de un promedio de 1,500 tokens de pensamiento a 10,000 con el mismo prompt sin explicación. Si vas a establecer límites de coste, presupuesta al menos un margen de 3-4 veces sobre tu base esperada de tokens de razonamiento.
Ventanas de retirada de modelos. Ocho modelos fueron retirados con poco aviso en mayo de 2026. Si te anclas a un nombre de modelo con versión (por ejemplo, grok-4-0709) obtienes estabilidad hasta la fecha de retirada; si usas el alias (grok-4.3) migras automáticamente pero puedes encontrarte con cambios inesperados en las capacidades. Ninguna opción es obviamente más segura: una te da la certeza del fin, la otra te da continuidad hasta que deje de hacerlo.
Llamadas a herramientas en cada turno. La API es compatible con OpenAI, lo que facilita la migración, pero las herramientas de OpenAI no se facturan de la misma manera. web_search a $5 por cada 1,000 llamadas es un nuevo concepto para los equipos que cambian de una configuración de llamadas a herramientas que antes no cobraba por llamada. Audita tu promedio de llamadas a herramientas por sesión antes de proyectar el coste total.
Violaciones de las directrices de uso. Se aplica una tarifa de $0.05 a cualquier solicitud detectada violando las directrices de uso antes de la generación. Para la mayoría de las cargas de trabajo legítimas esto nunca se activa, pero para flujos de trabajo de moderación de contenido o pruebas adversarias, vale la pena tenerlo en cuenta.
Quién debería pagar por qué
Grok Free: Funciona bien para personas que usan Grok como herramienta de investigación, asistente de escritura o para resolver dudas casuales. El conjunto de funciones multimodales es generoso a coste cero. Alcanzarás los límites diarios si lo usas intensamente.
SuperGrok (~$30/mes): Merece la pena si dependes del modo multiagente para tareas de investigación, si alcanzas los límites diarios del nivel gratuito con regularidad o si quieres Grok Build para automatizaciones de código. Con una tarifa plana de $30 es comparable al precio de Claude Pro y al precio de ChatGPT en sus respectivos niveles Plus.
xAI API: La opción adecuada para desarrolladores que crean aplicaciones. Los precios de los tokens son competitivos, la compatibilidad con el SDK de OpenAI implica poca fricción en la migración, y la integración de búsqueda en X es genuinamente única si estás construyendo algo que necesite datos sociales en tiempo real. Vigila los cargos por herramientas y almacenamiento; ahí es donde realmente reside la factura para cargas de trabajo basadas en agentes.
Batch API: La elección obvia para cualquier carga de trabajo asíncrona: procesamiento de documentos, clasificación masiva, evaluación fuera de línea. El descuento del 20-50% es significativo cuando hay volumen.
Azure/Oracle/Google Cloud: Si tu infraestructura ya está en una de estas nubes y quieres Grok sin una relación separada con otro proveedor, las rutas de los marketplaces de la nube funcionan. Los precios varían según el proveedor y conviene compararlos con las tarifas directas de xAI antes de comprometerse. Vale la pena leer la lista de modelos de OpenAI y las páginas de precios de Qwen junto con esto para comparar lo que cobran diferentes proveedores de API por modelos de clase frontera en este momento.
Prueba eesel
Si estás evaluando las API de IA para potenciar tus flujos de trabajo de soporte o conocimiento, vale la pena echar un vistazo a eesel junto con los precios de los modelos en bruto. eesel despliega agentes de IA autónomos directamente dentro de tus herramientas existentes (Zendesk, Slack, Freshdesk, Shopify y más de 100 otras) sin requerir que conectes tú mismo las API de LLM, las llamadas a herramientas y la facturación de almacenamiento. Los precios se basan en tareas: $0.40 por tarea regular (ticket, respuesta de chat) con un crédito gratuito de $50 para empezar. No hay cuota de plataforma en el autoservicio, ni costes por asiento, y los agentes se detienen al alcanzar tu límite de gasto. Para los equipos que quieren resolución con IA sin la contabilidad por token, el precio de eesel es una comparación más limpia con SuperGrok que las tarifas de la API pura.
Preguntas frecuentes
Share this article

Article by
Kira
A Computer Science student deeply passionate in the fields of UI/UX Design and Web Development with a knack on writing. Fusing technical expertise with a creative flair, I'm driven to craft innovative and user-centric solutions, leveraging both coding proficiency and design sensibilities to create seamless, impactful experiences.







