Blog / Guides

Precios de Cohere AI en 2026: guía completa de costos reales

Escrito por

Alicia Kirana Utomo

Revisado por

Katelin Teen

Última edición June 9, 2026

Verificado por expertos

Ilustración de precios de Cohere AI con el logotipo de Cohere y un diseño de tarjeta de precios

TL;DR

Las tarifas principales de Cohere (obtenidas de hosts de terceros porque la propia página de precios de Cohere no las muestra en HTML simple): Command A y Command R+ (08-2024) están a $2,50 / $10,00 por 1M de tokens en OpenRouter. Command R (08-2024) es el favorito en relación calidad-precio a $0,15 / $0,60. Command R7B baja a $0,0375 / $0,15. Embed v4 aparece a ~$0,12 por 1M de tokens de entrada en AWS Bedrock. Rerank es por búsqueda: $0,0025 (Pro), $0,002 (Fast), $0,001 (v3.5).

El nivel dedicado Model Vault funciona a $4 a $10 por hora por instancia ($2.500 a $6.500/mes) según cohere.com/pricing. North (la plataforma de agentes) y Compass (búsqueda empresarial) no tienen precios publicados, ambos son "solicite una demo".

El problema: las tarifas que Cohere oculta son las que más querría comparar. Command A+, Command A Reasoning, Command A Translate y Command A Vision son todos "contactar ventas" en claves de producción. Y según los revisores de PeerSpot y los análisis posteriores de precios de desarrolladores, la factura real raramente es la tarifa por token. Es el equipo de desarrolladores, el trabajo de integración y (si está en Bedrock) el Throughput Aprovisionado.

Si es un equipo de soporte que sopesa Cohere frente a una alternativa lista para usar, la comparación por token es la unidad incorrecta. A continuación profundizamos en eso y en dónde Cohere genuinamente brilla.

Un primer vistazo a la página de precios

Antes de entrar en números, aquí está cohere.com/pricing. Tres pestañas (Workplace systems, Generative models, Advanced retrieval models), una tabla de Model Vault, un bloque de preguntas frecuentes con tarifas heredadas y un formulario de captación de leads.

Página de precios de Cohere con tres pestañas y un formulario de captación de leads, tomado de cohere.com

Si ha visitado la página recientemente, habrá notado algo curioso: las tablas de precios por token para los modelos generativos y de recuperación actuales no aparecen en el "ver código fuente" del HTML. Se renderizan del lado del cliente a través de Sanity CMS, lo que significa que las herramientas de scraping (y la mayoría de los rastreadores de LLM) solo obtienen las partes estáticas: la tabla de instancias dedicadas del Model Vault, los avisos heredados/Aya en las FAQ y las tarjetas empresariales de "hablar con ventas". Para una página de precios pública de un proveedor cuyo discurso es la transparencia, es una elección extraña. Hemos cruzado referencias con OpenRouter, AWS Bedrock, la propia documentación de Cohere y la instantánea de Wayback Machine para obtener el resto, y en eso se basa esta publicación.

Aquí está el resumen de precios de un vistazo:

Gráfico de barras de los precios de entrada de la API de Cohere por 1M de tokens para Command R7B, Command R, Embed v4, Command A+ y Command A o R+

Precios de la API de Cohere, modelo por modelo

El catálogo de Cohere se divide en tres categorías: generativa (la familia Command), recuperación (Embed y Rerank) y audio (Transcribe). La mayoría tienen una tarifa por token o por búsqueda; algunos no.

Generativa: la familia Command

Estos son los modelos de generación de texto de Cohere, servidos a través del endpoint de Chat. Las especificaciones completas (estado, modalidad, ventana de contexto, límite de salida) provienen del catálogo de modelos de Cohere. Las tarifas por token para el bloque heredado son literales de las FAQ de precios de Cohere; para la actualización R/R+ de agosto de 2024 y Command A, usamos OpenRouter.

Modelo	Estado	Contexto	Salida máx.	Entrada $/1M	Salida $/1M	Fuente
Command A+	Activo	128k	64k	Sin precio público	Sin precio público	Cohere pricing, producción = contactar ventas
Command A Reasoning	Activo	256k	32k	Sin precio público	Sin precio público	Cohere, contactar ventas
Command A Translate	Activo	8k	8k	Sin precio público	Sin precio público	Cohere, contactar ventas
Command A Vision	Activo	128k	8k	Sin precio público	Sin precio público	Cohere, contactar ventas
Command A	Activo	256k	8k	$2,50	$10,00	OpenRouter
Command R+ (08-2024)	Activo	128k	4k	$2,50	$10,00	Cohere FAQ
Command R (08-2024)	Activo	128k	4k	$0,15	$0,60	OpenRouter
Command R7B (12-2024)	Activo	128k	4k	$0,0375	$0,15	OpenRouter
Command (heredado)	Obsoleto 2025-09-15	4k	4k	$1,00	$2,00	Cohere FAQ
Command-light (heredado)	Obsoleto 2025-09-15	4k	4k	$0,30	$0,60	Cohere FAQ
Command R 03-2024	Obsoleto 2025-09-15	128k	4k	$0,50	$1,50	Cohere FAQ
Command R+ 04-2024	Obsoleto 2025-09-15	128k	4k	$3,00	$15,00	Cohere FAQ
Aya Expanse 8B	Activo	128k	4k	$0,50	$1,50	Cohere FAQ
Aya Expanse 32B	Activo	128k	4k	$0,50	$1,50	Cohere FAQ

Algunas cosas que vale la pena notar. Primero, el precio efectivo de Command R+ ha bajado: el lanzamiento de 04-2024 cotizaba a $3,00 / $15,00, la actualización de 08-2024 está a $2,50 / $10,00 y así se mantiene hoy. El hilo de lanzamiento original de Hacker News ancló R+ a la tarifa más alta y la comunidad cuestionó si el salto de parámetros lo justificaba; la reducción de precio unos meses después es la respuesta.

Segundo, Command A es básicamente un "R+ moderno en la misma tarifa". Los mismos $2,50 / $10,00, pero con un contexto de 256k, 150% más de rendimiento y mejor desempeño agéntico según la documentación. Si usaba R+ para trabajo general, A es el nuevo predeterminado.

Tercero, Command R7B es genuinamente económico. A $0,0375 entrada / $0,15 salida por 1M, puede ejecutar muchísima summarización, clasificación o enrutamiento por el precio de una sola solicitud de clase GPT.

Interfaz de Command generando una descripción de producto a partir de un PDF cargado, tomado de cohere.com

Recuperación: Embed y Rerank

Aquí es donde los precios de Cohere realmente se ganan su reputación. El stack de recuperación es de lo que trata la mayor parte del elogio de los desarrolladores en PeerSpot y los blogs de desarrollo, y las tarifas lo respaldan.

Modelo	Tipo	Contexto	Precio	Fuente
Embed v4	Embeddings (texto + imágenes + PDFs)	128k	$0,12 / 1M tokens de entrada	AWS Bedrock
Embed v3 English	Embeddings	512	$7,12/hora (solo Throughput Aprovisionado en Bedrock)	AWS Bedrock
Embed v3 Multilingual	Embeddings	512	$7,12/hora (solo Throughput Aprovisionado en Bedrock)	AWS Bedrock
Rerank 4 Pro	Rerank	32k	$0,0025 / búsqueda	OpenRouter
Rerank 4 Fast	Rerank	32k	$0,002 / búsqueda	OpenRouter
Rerank v3.5	Rerank	4k	$0,001 / búsqueda (OpenRouter), $2,00 por 1.000 consultas (Bedrock)	OpenRouter / AWS Bedrock

Dos definiciones que vale la pena precisar aquí:

Una "búsqueda" es una consulta más hasta 100 documentos, según las FAQ de precios de Cohere. Cualquier cosa que supere los 500 tokens se divide automáticamente en múltiples documentos y cada fragmento cuenta.
Embed v4 maneja PDFs de forma nativa. Eso es en realidad un detalle de precios significativo, porque la alternativa en otros proveedores es analizar los PDFs en fragmentos uno mismo e incrustar cada fragmento por separado.

Lo que recomendaríamos: Embed v4 + Rerank v3.5 + Command R es el "stack RAG económico y capaz" canónico en Cohere, y el costo total en una carga de trabajo de recuperación moderada resulta ser menor que el de un pipeline comparable de clase GPT + embeddings de OpenAI. Si apuesta más por la calidad, cambie a Rerank 4 Pro y Command A.

Barra lateral de documentación de desarrolladores de Cohere que muestra los modelos Command, Embed, Rerank y Aya, tomado de docs.cohere.com

Audio: Cohere Transcribe

Transcribe es el modelo de voz a texto de Cohere: cohere-transcribe-03-2026, 14 idiomas, archivo máximo de 25 MB. El precio por minuto está en la pestaña de precios en vivo y no está expuesto en el HTML estático, por lo que no podemos citarlo aquí sin inducir a error. La documentación de transcripción de audio confirma que las claves de prueba están limitadas a 5 solicitudes por minuto y el acceso a producción es a través de sales@cohere.com.

Lo que no está en la página de precios pública

Esta es la parte que vale la pena ser honesto sobre, porque es la diferencia entre Cohere y un proveedor como Anthropic u OpenAI donde cada modelo tiene una tarifa por token publicada.

Lo siguiente aparece en la página de precios en vivo de Cohere pero no se renderiza en HTML estático y tampoco lo exponen claramente los hosts de terceros:

Command A+, el modelo MoE insignia de Cohere, lanzado como código abierto el 19 de mayo de 2026. Comercializado para "infraestructura crítica soberana". Sin tarifa pública por token.
Command A Reasoning, Translate y Vision, todos "contactar ventas" en claves de producción según la documentación de límites de velocidad. Las claves de prueba tienen un límite de 20 solicitudes/min y 1.000 llamadas/mes.
Tarifas de ajuste fino (entrenamiento, hosting, servicio).
Precios por imagen para Command A Vision y las entradas de imagen de Command A+.
Descuentos de la API por lotes, listados pero sin tarifa explícita.
North-Mini-Code-1.0, aparece en las tablas de límites de velocidad; tarifa por token no expuesta.

Lo que esto significa para un comprador: en el momento en que desea comparar el actual modelo insignia de Cohere frente a GPT-5.x o Claude Sonnet en términos de $/1M de tokens, no puede hacerlo sin reservar una llamada de ventas. Si eso es un factor decisivo depende de su rol. Para un arquitecto empresarial que redacta una propuesta de adquisición, es un punto de fricción pero no un muro. Para un equipo pequeño que evalúa cinco proveedores de LLM en una tarde, es suficiente para bajar a Cohere en la lista.

Model Vault: implementaciones dedicadas, precios exactos

El Model Vault es la oferta de instancia dedicada de Cohere: reserva capacidad de cómputo que ejecuta solo sus modelos, sin tenencia compartida. Este también es el único bloque de la página de precios de Cohere donde los números en dólares reales están en el HTML, por lo que podemos citarlo directamente.

Modelo	Nivel de rendimiento	Tarifa por hora por instancia	Tarifa mensual por instancia
Embed 4	Small	$4,00	$2.500
Embed 4	Medium	$5,00	$3.250
Rerank 3.5	Medium	$5,00	$3.250
Rerank 4 Fast	Medium	$5,00	$3.250
Rerank 4 Pro	Medium	$5,00	$3.250
Rerank 4 Pro	Large	$10,00	$6.500

Algunos puntos a destacar:

La facturación puede ser por hora o por compromiso (mensual o anual). La tarifa mensual equivale a ~$8,33/hora a 30×24, por lo que la tarifa mensual comprometida es más económica que la tarifa por hora solo si su uso supera aproximadamente el 60 al 80% del mes.
Un punto de datos separado de Sanity CMS lista un precio del Model Vault vinculado a Compass de $3,75/hora por instancia, que no aparece en la tabla principal anterior. Vale la pena plantearlo en una conversación de ventas si Compass está en su plan.
No hay nivel Command bajo demanda en el Model Vault. Si desea rendimiento generativo dedicado, está en territorio de implementación personalizada.

Model Vault es la respuesta para un comprador específico: "Necesito un gasto mensual predecible en recuperación a escala y no quiero que mis cargas de trabajo compartan un pool multiinquilino." Un equipo RAG típico que ejecute, digamos, 500 trabajos de embed/hora y 5.000 consultas de rerank/minuto se inclinaría por un Rerank 4 Pro Medium ($3.250/mes) más un Embed 4 Medium ($3.250/mes), unos $6.500/mes en total, pagados como una partida fija en lugar de medidos por solicitud.

North y Compass: las plataformas empresariales

La primera pestaña de la página de precios de Cohere es Workplace systems, y es la parte más opaca de toda la historia de precios. Allí viven dos productos:

North, la plataforma de agentes de Cohere. Presentada en la página de inicio como "Tu lugar de trabajo de IA soberano". Se conecta con sus herramientas, permite a los usuarios ejecutar automatizaciones e incluye búsqueda inteligente.
Compass, el sistema de búsqueda y descubrimiento empresarial de Cohere, con conectores de datos preconstruidos, análisis de documentos e índice gestionado.

Ninguno tiene precio público. Ambos son "Contáctenos para precios empresariales personalizados" con un CTA "Solicitar una demo". El formulario de captación de leads en cohere.com/pricing muestra un menú desplegable de preferencia de implementación (AWS, Azure, GCP, OCI, IBM Cloud, Tencent Cloud, Alibaba Cloud, Private Deployment, Cohere Infrastructure (SaaS), Other), lo cual es una señal justa de cuánto tienden a personalizarse estos acuerdos.

Plataforma de agentes North que muestra la interfaz de exploración de Automations con las tarjetas Revenue Scope y Meeting Summarizer, tomado de cohere.com

Lo que esperaríamos, basándonos en conversaciones con compradores empresariales y acuerdos de referencia públicos (Fujitsu, Oracle, RBC, Dell, LG CNS, todos en la tira de logotipos de la página de inicio de Cohere): un ciclo de adquisición con múltiples partes interesadas, un mínimo de seis cifras en un compromiso del primer año, soporte dedicado de ingeniería de soluciones y una superficie de implementación personalizada. Si es una empresa Fortune 500 con un mandato de datos soberanos, eso es lo básico. Si es un equipo de soporte de 50 personas que solo quiere una IA que clasifique tickets, esto no es para usted.

Los revisores en PeerSpot señalan lo mismo: "Cohere ofrece precios empresariales para clientes de alto volumen, y debe contactar a su equipo de ventas para precios personalizados si procesa miles de millones de tokens mensualmente o necesita soporte dedicado, SLAs o implementaciones privadas."

Precios en nubes asociadas

Cohere se vende a través de todos los principales mercados de nube: AWS Bedrock, Amazon SageMaker, Microsoft Azure (AI Foundry), Oracle Cloud Infrastructure, Google Cloud, IBM Cloud, Tencent Cloud, Alibaba Cloud. Los precios en cada uno los fija el mercado, no Cohere, y no siempre son idénticos a cohere.com.

Lo más sorprendente es que AWS Bedrock se ha reducido. El catálogo actual bajo demanda de Cohere es solo Embed 4 y Rerank 3.5; Command R, R+ y A ya no están en la lista bajo demanda. La familia Command en Bedrock ahora es solo Throughput Aprovisionado, lo cual tiene una estructura de costos muy diferente:

AWS Bedrock: partidas de Cohere	Modelo de precios	Precio
Embed 4	Por 1M tokens de entrada	$0,12
Rerank 3.5	Por 1.000 consultas	$2,00
Cohere Command	Throughput Aprovisionado / hora (sin compromiso)	$49,50
Cohere Command	Throughput Aprovisionado / hora (compromiso 1 mes)	$39,60
Cohere Command	Throughput Aprovisionado / hora (compromiso 6 meses)	$23,77
Cohere Command-Light	Throughput Aprovisionado / hora (sin compromiso)	$8,56
Cohere Command-Light	Throughput Aprovisionado / hora (compromiso 1 mes)	$6,85
Embed 3 English	Throughput Aprovisionado / hora (sin compromiso)	$7,12
Embed 3 Multilingual	Throughput Aprovisionado / hora (sin compromiso)	$7,12

Esos $49,50/hora por unidad de modelo (sin compromiso) para Cohere Command equivalen a ~$29.462/mes por unidad. La cita de PeerSpot sobre "caro usar todos los servicios de Oracle" es la misma historia en otra pestaña: el recargo del mercado de nube es donde viven las sorpresas presupuestarias.

Azure AI Foundry vende Cohere-command-a, Cohere-rerank-v4.0-pro/fast y embed-v-4-0 directamente, pero las tarifas por token no están en la página de documentación. La documentación de modelos preentrenados de Oracle OCI lista todos los modelos Cohere que OCI aloja (Command A Reasoning, A Vision, A, R+, R, variantes de Embed v4 + v3, Rerank 4, Rerank 3.5), pero de nuevo las tarifas están en una página de precios separada.

La regla general: si es sensible al costo, ejecute Cohere en la propia plataforma de Cohere. Los mercados son convenientes si ya vive ahí, pero el recargo es real.

Prueba vs. producción: la letra pequeña

Algunos mecanismos que vale la pena conocer antes de registrarse, todos de la documentación oficial de límites de velocidad y las FAQ de precios:

Las claves de prueba son gratuitas, pero están limitadas a 1.000 llamadas API por mes y 20 solicitudes/min por modelo de chat. Están explícitamente prohibidas para uso en producción o comercial.
Las claves de producción son de pago por uso, con límites de velocidad más altos (500 solicitudes/min para Command A, R, R+, R7B).
Para variantes de modelos más recientes (Command A+, A Reasoning, A Translate, A Vision), las claves de producción se comportan como claves de prueba. Debe contactar a sales@cohere.com para acceso real a producción. Fácil de pasar por alto.
Ciclo de facturación: al final de cada mes calendario o cuando su saldo pendiente alcance $250, lo que ocurra primero.
Solo se le cobra por billed_units, no por el recuento de tokens subyacente. Cohere absorbe el costo de cualquier token de control añadido internamente. Su documentación incluye un ejemplo donde el recuento real de tokens es 7.596 / 645 pero billed_units es 6.772 / 248. Pequeño pero real.
Las cuentas comienzan como personales; debe configurar una organización si desea facturación compartida entre compañeros de equipo.

La restricción de prueba vs. producción en los modelos insignia es el punto de fricción. La mayoría de los proveedores de LLM le permiten acceder a GPT-5 o Claude Sonnet con una clave de autoservicio desde el primer día. Cohere no, y si está comparando modelos entre sí, esa asimetría puede silenciosamente orientar sus pruebas hacia el modelo que realmente puede ejecutar.

Ejemplos de costos prácticos

Pongámoslo concreto. Tres escenarios:

Escenario 1: Pipeline RAG pequeño (económico y sencillo)

Es un equipo de operaciones de 10 personas, construyendo un bot interno de "pregúntale a la wiki". ~5M tokens/día de indexación, ~50.000 consultas de recuperación/día, generación con Command R.

Partida	Volumen	Tarifa	Costo mensual
Embed v4 (texto)	5M tokens × 30 días = 150M	$0,12 / 1M	$18
Rerank v3.5	50.000 × 30 = 1,5M búsquedas	$0,001 / búsqueda	$1.500
Command R (entrada + salida)	200M entrada, 50M salida	$0,15 entrada / $0,60 salida	$60
Total			~$1.578/mes

Rerank es la partida dominante. Si puede reducir a rerank top-5 en lugar de top-100 por consulta, esa factura baja considerablemente.

Escenario 2: Automatización de soporte de tamaño mediano (el pitch típico)

Es un equipo de soporte, ~1.000 tickets/día, construyendo un bot de deflexión directamente sobre Cohere. Ticket promedio = 3.000 tokens de entrada (historial + contexto de KB) + 500 tokens de salida.

Partida	Volumen	Tarifa	Costo mensual
Command A (entrada)	1.000 × 3.000 × 30 = 90M	$2,50 / 1M	$225
Command A (salida)	1.000 × 500 × 30 = 15M	$10,00 / 1M	$150
Embed + Rerank (recuperación KB)	como Escenario 1, escalado	mixto	~$200
Total API			~$575/mes
Tiempo de desarrollador para construir/mantener	~0,25 a 0,5 FTE	$10 a $20k/mes cargado	$10 a $20k/mes

Los $575 en tokens son la partida más pequeña de la factura. El costo real es el ingeniero que escribe los prompts, la orquestación, los reintentos, el arnés de evaluación y la rotación de guardia cuando el bot escala incorrectamente. Lo que lleva a…

Escenario 3: Enterprise dedicado (Model Vault)

Es una empresa que ejecuta RAG sobre un corpus de 5 millones de documentos, con volumen de recuperación predecible.

Partida	Nivel	Costo mensual
Embed 4 Medium	Dedicado	$3.250
Rerank 4 Pro Medium	Dedicado	$3.250
Command A (por token)	API	variable
Base de recuperación dedicada		$6.500/mes

Agregue un contrato de North o Compass encima y estará en el rango de seis cifras durante un año. Eso es lo que apuntan los acuerdos de referencia de Fujitsu y Oracle.

Ilustración de iceberg titulada "Lo que esconde el precio de etiqueta" con las tarifas de la API por token sobre el agua y el equipo de desarrolladores, servidores e infraestructura, trabajo de integración y mantenimiento continuo debajo

Lo que los usuarios realmente dicen sobre la factura

Obtuvimos voces reales de profesionales de PeerSpot y el hilo de lanzamiento de Command R+ en Hacker News. La división es consistente y vale la pena conocerla:

"Cohere tiene un nivel gratuito… puedes usar la API en modo de desarrollo. Pero si vas a producción, tendrás que pagar… puede ser costoso." CollinsOmondi, Mobile Developer, hilo de precios de PeerSpot

"En comparación con los modelos disponibles en el mercado, los precios, el costo de configuración y la licencia de Cohere son mejores." Shivam Singh, Senior Solution Architect, hilo de precios de PeerSpot

"He usado Embed English v3.0 de Cohere para tareas RAG y lo encontré más rápido, más económico y más reactivo que las alternativas." Resumen de revisores de PeerSpot

"Mi experiencia con los precios, el costo de configuración y la licencia es que es costoso usar todos los servicios de Oracle." Senior Data Scientist, hilo de precios de PeerSpot

Y del hilo de lanzamiento de R+ en Hacker News (que tenía un tono mucho más agudo):

"[Command-R] terminó lobotomizado cuando el agente dependía de sus resultados." irthomasthomas, hilo de Hacker News

Lo que extraeríamos de esto:

La historia de Embed y Rerank es uniformemente positiva. "Más rápido, más económico, más reactivo" aparece una y otra vez en contextos de recuperación. Esta es la historia de precios más fuerte de Cohere, y no se cuenta lo suficientemente fuerte en la página de marketing.
Command R es donde viven los fans de la relación precio-rendimiento. $0,15 / $0,60 para un modelo de 35B parámetros y 128k de contexto es genuinamente bueno.
Command R+ recibe críticas. El hilo de HN ancló R+ en un paso de precio 6x sobre R, y la comunidad quería saber por qué. La respuesta de Simon Willison se redujo a "es un modelo de 104B, estás pagando por el recuento de parámetros, no por un nuevo nivel de capacidad", que es honesto, pero no una buena respuesta para compradores que priorizan la calidad de salida.
El verdadero "shock de precio" no es la tarifa por token, es el TCO. Varios análisis de profesionales hacen el mismo punto: "Necesita un equipo de desarrolladores para construir la app, científicos de datos para ajustar los modelos y un equipo de TI para gestionar todo."

Ese último punto vale la pena detenerse a pensar.

Dónde encaja Cohere y dónde no

Los precios no son realmente la pregunta. El encaje sí. Los precios de Cohere están diseñados para un perfil específico de comprador, y si no es ese comprador, la pregunta de si la tarifa por token es "buena" o "cara" pierde el punto.

Diagrama de flujo de decisión titulado "Elegir un proveedor de LLM" con una bifurcación soberana+datos privados que lleva a Cohere encaja (Piloto empresarial, Implementación personalizada, Stack de recuperación RAG) o Buscar otra opción (Producto plug-and-play, SaaS para equipo de soporte, Comprador de autoservicio)

Cohere es una buena opción si es una empresa con:

Un mandato de soberanía de datos (servicios financieros, sector público, salud, defensa, telecomunicaciones).
Un equipo de ingeniería existente que puede integrarse a nivel de API: escribir los prompts, construir la orquestación, ejecutar las evaluaciones.
Una carga de trabajo principal que sea RAG o intensiva en recuperación. El stack Embed + Rerank + Command R es genuinamente una ventaja en relación precio-rendimiento, especialmente en contenido multilingüe (49 idiomas en Command, consulte la página de inicio).
Un requisito de múltiples nubes o en las instalaciones. La historia de implementación de Cohere (VPC, on-prem, Model Vault, nubes asociadas) está diseñada para esto.

Cohere es la opción incorrecta si es:

Un equipo pequeño que quiere algo funcionando desde el primer día, no después de tres meses de trabajo de integración.
Un equipo de soporte, operaciones o contenido donde la unidad de valor es "ticket gestionado" o "publicación publicada", no "token procesado".
Sensible al costo de forma autogestionada. Tener las tarifas insignia detrás de una llamada de ventas significa que no puede ejecutar la comparación que desea.
Buscando agentes de IA plug-and-play dentro de helpdesks como Zendesk, Freshdesk o Gorgias.

Para ese segundo perfil, que es la mayor parte de lo que vemos en conversaciones reales con compradores, la pregunta no es "¿Es Cohere más barato que OpenAI por token?". Es "¿Puedo obtener el valor de la IA sin pagar por el equipo de integración?". Y eso tiene una forma diferente de precios.

Pruebe eesel

Si llegó hasta aquí y es un equipo de soporte, operaciones o contenido que sopesa Cohere frente a una alternativa lista para usar, aquí está la propuesta honesta.

eesel le ofrece agentes de IA que viven dentro de las herramientas que ya usa: Zendesk, Freshdesk, Gorgias, Slack, Gmail, Shopify y un centenar más. Sin prompts que desarrollar, sin orquestación que construir, sin llamada de ventas para claves de producción. Conecta su helpdesk, instruye al agente en lenguaje sencillo como lo haría con un nuevo empleado, y comienza a gestionar tickets.

Los precios también tienen una forma diferente: $0,40 por ticket como tarea regular, sin tarifa de plataforma, sin tarifas por asiento, sin mínimo mensual. Un equipo de 1.000 tickets/mes paga $400. Un equipo de 100 tickets/mes paga $40. Obtiene un crédito gratuito de $50 (más 2 generaciones de blog gratuitas) antes de que se requiera una tarjeta. Precios completos aquí.

Descripción general del panel de helpdesk de eesel AI

No somos el mismo producto que Cohere: Cohere vende modelos; eesel vende compañeros de equipo de IA que funcionan sobre los modelos. Si su trabajo es implementar infraestructura para el stack de IA soberano de una empresa Fortune 500, Cohere es la opción correcta. Si su trabajo es desviar tickets de nivel 1 la semana que viene, pruebe eesel: el proceso de incorporación dura unos minutos y la matemática por ticket es más fácil de defender en una reunión de presupuesto que una partida de Throughput Aprovisionado.

Preguntas frecuentes

¿Cuánto cuesta Cohere AI por 1M de tokens?

Depende del modelo. A través de hosts de terceros, Command A y Command R+ (08-2024) aparecen con $2,50 entrada / $10,00 salida por 1M de tokens, Command R (08-2024) a $0,15 / $0,60 y Command R7B a $0,0375 / $0,15. Cohere oculta las tarifas por token para Command A+, Command A Reasoning, Translate y Vision detrás de sales@cohere.com. Para un caso de uso de soporte listo para usar donde el precio por token de Cohere AI no es la unidad correcta, consulte los precios por ticket de eesel.

¿Existe un nivel gratuito para Cohere AI?

Sí. Las claves de API de prueba de Cohere son gratuitas y tienen un límite de 1.000 llamadas por mes, según la documentación oficial de límites de velocidad. Tienen límite de velocidad y no están permitidas explícitamente para producción. Una vez que cambia a una clave de producción, se le factura al final de cada mes calendario o cuando su saldo alcance $250, lo que ocurra primero.

¿Cuáles son los precios de Cohere para Embed y Rerank?

Embed v4 está en torno a $0,12 por 1M de tokens de entrada en AWS Bedrock. Los precios de Rerank son por búsqueda: Rerank 4 Pro a $0,0025 cada uno, Rerank 4 Fast a $0,002 y Rerank v3.5 a $0,001 (o $2,00 por 1.000 consultas en Bedrock). Una "búsqueda" es una consulta más hasta 100 documentos. Para un análisis más detallado del lado de recuperación, consulte nuestra reseña de Cohere AI.

¿Cuánto cuesta el Model Vault?

Model Vault es la opción de instancia dedicada de Cohere. La tabla publicada va desde $4,00/hora ($2.500/mes) para una instancia Embed 4 Small hasta $10,00/hora ($6.500/mes) para una instancia Rerank 4 Pro Large. Puede pagar por hora o comprometerse mensualmente. Si está sopesando esto frente a una IA con precio por ticket, nuestra guía de alternativas a Cohere AI desglosa la matemática por ticket.

¿Cuánto cuestan las plataformas empresariales de Cohere?

La plataforma de agentes North de Cohere y el sistema de búsqueda Compass son ambos "solicite una demo" sin precios publicados. Espere un ciclo de ventas con múltiples partes interesadas. Si desea agentes de IA de nivel empresarial que pueda implementar el mismo día a un precio por ticket, la plataforma eesel está diseñada para eso.

¿Es Cohere AI más barato que OpenAI o Anthropic?

Depende del modelo y la carga de trabajo. Command R a $0,15 / $0,60 por 1M es genuinamente económico y competitivo con los modelos pequeños de clase GPT, razón por la cual el stack de recuperación (Embed + Rerank + Command R) tiende a salir adelante en RAG. Command R+ y Command A a $2,50 / $10,00 están dentro del rango de los modelos medianos de OpenAI y Anthropic, pero los revisores los califican consistentemente por debajo de la frontera; consulte nuestra comparación de la API de OpenAI vs Anthropic para contexto.

¿Qué costos ocultos tiene Cohere AI?

El precio de lista es la partida más pequeña. Los revisores en PeerSpot y los compradores de AWS Bedrock señalan consistentemente que la factura real son los desarrolladores, el trabajo de integración, el mantenimiento continuo y (en Bedrock) el Throughput Aprovisionado, donde Cohere Command cuesta $49,50/hora por unidad de modelo, unos $29k/mes. Esa es la brecha entre el precio de etiqueta y el costo total de propiedad.

¿Para quién están diseñados los precios de Cohere?

Empresas que necesitan soberanía de datos, implementación privada e integración personalizada: servicios financieros, sector público, salud, telecomunicaciones. Si es un equipo de soporte, operaciones o contenido más pequeño que simplemente quiere algo que funcione desde el primer día, una descripción general de Cohere probablemente terminará con usted eligiendo un SaaS que haga la integración por usted. Pruebe eesel si eso le suena.

Contrata a tu companero de IA

Configuracion en minutos. Sin tarjeta de credito.

Prueba gratis Agendar demo

Share this article

Article by

Alicia Kirana Utomo

Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.