Nuestra reseña completa de GPT 5.3 Codex: Una nueva era para la IA agéntica

Kenneth Pangan
Written by

Kenneth Pangan

Reviewed by

Katelin Teen

Last edited 6 febrero 2026

Expert Verified

Texto alternativo de la imagen

El 5 de febrero de 2026, OpenAI lanzó GPT-5.3-Codex, su modelo de codificación más reciente. El lanzamiento coincidió con el de Opus 4.6 de Anthropic, lo que resalta el ritmo competitivo del desarrollo de la IA.

OpenAI está posicionando esto como algo más que una actualización menor. Están transformando a Codex de un potente generador de código a un agente de propósito general que puede operar una computadora y gestionar flujos de trabajo profesionales de principio a fin. El concepto evoluciona de ser una herramienta a ser un compañero de equipo de IA.

Este artículo desglosará las novedades, revisará su rendimiento y analizará lo que esto significa para los desarrolladores y las empresas.

¿Qué es GPT 5.3 Codex?

En su esencia, GPT-5.3-Codex es lo que OpenAI llama su "modelo de codificación agéntico más capaz hasta la fecha." Sigue a GPT-5.2-Codex, pero con un alcance significativamente ampliado.

Según el anuncio oficial de OpenAI, el nuevo modelo se basa en tres principios principales:

  1. Habilidades agénticas de primer nivel: El modelo está diseñado para manejar tareas largas y complejas a lo largo del ciclo de vida del desarrollo de software y otros dominios profesionales.
  2. Eficiencia mejorada: Según se informa, es un 25% más rápido y utiliza menos tokens que la versión anterior, lo que mejora la experiencia del usuario y reduce los costos operativos.
  3. Automejora: Notablemente, OpenAI afirma que el modelo ayudó a "crearse a sí mismo". Asistió a los ingenieros en tareas como la depuración de su propio entrenamiento y la gestión de despliegues.

El concepto es proporcionar un socio interactivo en lugar de una herramienta que simplemente sigue comandos. Esto lo posiciona como un compañero de equipo que puede ser guiado en tiempo real, no solo un asistente para la delegación de tareas.

Una infografía que detalla los principios básicos de la reseña de GPT 5.3 Codex: habilidades agénticas de primer nivel, eficiencia mejorada y automejora.
Una infografía que detalla los principios básicos de la reseña de GPT 5.3 Codex: habilidades agénticas de primer nivel, eficiencia mejorada y automejora.

Nuevas capacidades de GPT 5.3 Codex

Entremos en los detalles de cómo se desempeña este nuevo modelo. Hemos profundizado en las afirmaciones de OpenAI y en los análisis iniciales para ver qué está sucediendo realmente.

Rendimiento en pruebas de referencia: Un salto en las habilidades agénticas

OpenAI respaldó su lanzamiento con nuevas puntuaciones en pruebas de referencia (benchmarks) clave de la industria. Estas cifras muestran un salto significativo en lo que la IA puede hacer por sí sola.

Aquí tiene un vistazo a los datos de su publicación de blog, visualizados para mayor claridad:

Una infografía de gráfico de barras para nuestra reseña de GPT 5.3 Codex, que compara sus puntuaciones de referencia contra GPT-5.2-Codex en SWE-Bench Pro, Terminal-Bench 2.0 y OSWorld-Verified.
Una infografía de gráfico de barras para nuestra reseña de GPT 5.3 Codex, que compara sus puntuaciones de referencia contra GPT-5.2-Codex en SWE-Bench Pro, Terminal-Bench 2.0 y OSWorld-Verified.

Prueba de referenciaGPT-5.3-CodexGPT-5.2-CodexMejora
SWE-Bench Pro56.8%56.4%Una ligera ventaja en ingeniería de software multilenguaje.
Terminal-Bench 2.077.3%64.0%Un salto masivo en la competencia de la línea de comandos.
OSWorld-Verified64.7%38.2%Un gran salto en las tareas generales de productividad informática.

Las mejoras en Terminal-Bench y OSWorld son significativas. Esto sugiere que el modelo ha mejorado sus capacidades para operar dentro de un entorno digital y utilizar herramientas como lo haría una persona.

Sin embargo, el panorama competitivo es fuerte. El análisis de la comunidad muestra que, si bien el 77.3% de Codex en Terminal-Bench 2.0 supera al Opus 4.6 de Anthropic (65.4%), las tornas cambian en OSWorld. Allí, Opus 4.6 obtiene un 72.7% frente al 64.7% de Codex. Esto indica que ninguno de los dos modelos lidera actualmente en todas las habilidades agénticas.

Reddit
Sí. Y esto viene de alguien que siempre ha odiado a Codex y solo usaba 5.2 high y xhigh. Pero 5.3-codex-xhigh es increíble, he construido más en 4 horas que en toda la semana pasada.

De asistente de codificación a colaborador profesional

OpenAI está posicionando claramente a Codex como algo más que una herramienta para desarrolladores. Están mostrando su capacidad para gestionar flujos de trabajo profesionales completos.

Por ejemplo, compartieron demostraciones en las que Codex creó una presentación de PowerPoint de 10 diapositivas para un asesor financiero y construyó juegos de carreras y buceo totalmente funcionales desde cero. Esta capacidad va mucho más allá de sugerir la siguiente línea de código.

En cuanto a la afirmación de que se "construyó a sí mismo", significa que el modelo fue lo suficientemente potente como para acelerar su propio desarrollo. Los ingenieros de OpenAI lo utilizaron para ayudar a los científicos de datos a construir nuevas canalizaciones de datos e incluso hicieron que escalara dinámicamente clústeres de GPU durante el lanzamiento. Es una prueba de concepto de cómo la IA agéntica puede acelerar el trabajo técnico complejo.

La brecha práctica para las empresas

Esta capacidad es impresionante. Sin embargo, para muchas empresas, esto sirve como una tecnología fundamental que requiere un mayor desarrollo para aplicaciones específicas.

Todavía se requiere mucho conocimiento técnico y tiempo de ingeniería para convertirlo en una herramienta confiable para un trabajo específico, como la atención al cliente o las ventas.

Muchas empresas requieren soluciones de IA adaptadas a funciones comerciales específicas, como un compañero de equipo de IA que pueda aprender sobre sus productos, comprender las políticas de reembolso y comenzar a gestionar tickets de soporte. Esto resalta la brecha entre un modelo de propósito general y una solución lista para el negocio.

Experiencia de usuario y accesibilidad

Más allá de su potencia bruta, ¿cómo se siente usar GPT-5.3-Codex? Y lo que es más importante, ¿quién puede tener acceso a él?

Una IA más interactiva y direccionable

Una de las nuevas funciones notables se llama "dirección" (steering). Le permite interactuar con el modelo mientras trabaja en una tarea. Usted puede intervenir para hacer preguntas, dar comentarios y orientarlo en la dirección correcta en tiempo real.

Este es un cambio significativo respecto al enfoque típico de "caja negra" donde un usuario proporciona una instrucción (prompt) y espera el resultado final. Añade una capa de transparencia y control, permitiéndole ver el "proceso de pensamiento" del agente y corregir su rumbo antes de que avance demasiado por el camino equivocado. Se siente menos como dar instrucciones y más como una colaboración real.

Reddit
Exactamente, no me importaría si necesitara trabajar 20 horas en lugar de 1 hora si pudiera entregar la misma calidad de código que puedo escribir yo mismo.

La mayor limitación: Sin acceso a la API

Entonces, ¿cómo puede probarlo? GPT-5.3-Codex está disponible a través de la aplicación Codex, una interfaz de línea de comandos (CLI), extensiones de IDE y la interfaz web para usuarios de pago de ChatGPT.

Sin embargo, una limitación significativa para las empresas es que el acceso a la API aún no está disponible. OpenAI dice que se "lanzará pronto", pero por ahora, ese es el principal obstáculo que impide a las empresas integrar este poder en sus propios productos o flujos de trabajo internos. Sin una API, sigue siendo una herramienta potente pero independiente, no una parte escalable de su pila tecnológica (tech stack).

Este retraso presenta un desafío para las empresas. Mientras las empresas esperan el acceso a la API para construir soluciones personalizadas, otras plataformas ofrecen aplicaciones listas para desplegar. Por ejemplo, eesel AI proporciona un compañero de equipo de IA diseñado para integrarse con sistemas de soporte (help desks) como Zendesk, Gorgias e Intercom. El eesel AI Agent aprende de los datos de una empresa y puede comenzar a gestionar problemas de atención al cliente sin requerir desarrollo personalizado.

Una vista del eesel AI Agent, una solución alternativa mencionada en esta reseña de GPT 5.3 Codex, gestionando tickets de atención al cliente de forma autónoma.
Una vista del eesel AI Agent, una solución alternativa mencionada en esta reseña de GPT 5.3 Codex, gestionando tickets de atención al cliente de forma autónoma.

Precios y el nuevo modelo de ciberseguridad

Las últimas piezas del rompecabezas son el costo y la seguridad.

¿Cuánto cuesta?

En este momento, OpenAI no ha anunciado ningún precio específico para GPT-5.3-Codex. El acceso está incluido en los planes de pago de ChatGPT.

Debido a que aún no hay acceso a la API, tampoco hay precios de API disponibles. Esto crea incertidumbre para las empresas que planean sus iniciativas de IA, ya que se desconoce el costo a escala, lo que dificulta la elaboración de presupuestos.

Algunas plataformas ofrecen estructuras de precios más predecibles. Por ejemplo, el precio de eesel AI se basa en un modelo de pago por interacción. Este modelo no está vinculado al número de asientos de usuario, lo que puede ayudar a las empresas a pronosticar costos y calcular el ROI a medida que escalan su uso de IA para la atención al cliente.

Un modelo de "alta capacidad" para la ciberseguridad

OpenAI ha etiquetado a GPT-5.3-Codex como un modelo de "Alta capacidad" para la ciberseguridad bajo su Marco de Preparación (Preparedness Framework). Esto se debe a que fue entrenado para encontrar vulnerabilidades de software, lo que lo convierte en una herramienta sólida para los profesionales de la seguridad.

Para gestionar los riesgos, OpenAI ha implementado medidas de seguridad como el programa "Trusted Access for Cyber", que otorga acceso a expertos en ciberseguridad examinados, y una subvención de $10 millones para acelerar la investigación en defensa cibernética.

Este nivel de capacidad tiene implicaciones de seguridad significativas. Si bien es una herramienta poderosa para la defensa, también introduce riesgos que las empresas deben gestionar. Una plataforma gestionada puede ayudar a abordar estas preocupaciones al ofrecer funciones integradas de seguridad y cumplimiento. Por ejemplo, eesel AI afirma que los datos de los clientes están aislados y nunca se utilizan para entrenamiento, proporcionando capacidades de IA con protocolos de seguridad establecidos.

Un vistazo al futuro

GPT-5.3-Codex es un paso adelante significativo para la IA agéntica. Su rendimiento, velocidad y conjunto de habilidades más amplio lo convierten en una herramienta potente para desarrolladores y otros profesionales tecnológicos. Ofrece un vistazo a un futuro donde los agentes de IA son nuestros colaboradores diarios.

Sin embargo, para muchas empresas, sus limitaciones actuales son significativas. La falta de acceso a la API, los costos desconocidos y el trabajo requerido para convertir un modelo general en una herramienta empresarial específica significan que es más un avance de las capacidades futuras que una solución para la implementación inmediata.

Para ver a GPT-5.3-Codex en acción y escuchar experiencias de primera mano más detalladas, la siguiente reseña ofrece una mirada completa a sus nuevas funciones y lo que significan para el futuro del desarrollo asistido por IA.

Una reseña detallada de GPT-5.3-Codex de OpenAI, que cubre sus nuevas funciones, pruebas de rendimiento y su impacto en el mundo del software.

Cómo desplegar un agente de IA hoy mismo

Un desafío clave es que un modelo fundacional potente como Codex es el motor, pero las empresas aún necesitan construir la aplicación a su alrededor. Estos modelos no están diseñados para un uso empresarial directo y listo para usar.

Aquí es donde una plataforma como eesel AI puede proporcionar una solución completa. En lugar de configurar una herramienta, usted "contrata" a un compañero de equipo de IA. El eesel AI Agent se conecta a las herramientas que usted ya utiliza, aprende sobre su negocio en minutos y comienza a trabajar con su equipo para gestionar los tickets de atención al cliente por su cuenta.

Esto permite a las empresas comenzar a usar agentes de IA sin esperar a que los modelos fundacionales se conviertan completamente en productos. Explore cómo se puede aplicar el eesel AI Agent a las operaciones de servicio al cliente.

Preguntas frecuentes

La conclusión principal es que GPT-5.3-Codex es un paso significativo para la IA agéntica (agentic AI), especialmente para los desarrolladores. Sin embargo, su falta de una API y un precio no definido lo convierten más en una herramienta orientada al futuro que en una solución empresarial práctica que usted pueda implementar hoy mismo.
La comparación es mixta. Codex supera a Opus 4.6 en la prueba de referencia Terminal-Bench 2.0, mostrando mejores habilidades en la línea de comandos. Pero Opus 4.6 obtiene una puntuación más alta en OSWorld, lo que indica un mejor rendimiento en tareas generales de computadora. Ninguno de los dos modelos es el ganador indiscutible en todos los ámbitos.
No directamente. Aunque es potente, GPT-5.3-Codex es un modelo de propósito general que requiere una ingeniería significativa para convertirse en una herramienta especializada para la atención al cliente. Para ello, una plataforma lista para usar como eesel AI, que está construida específicamente para este propósito, puede ser una solución más directa.
La mayor limitación para las empresas es la falta de acceso a la API. Sin una API, las compañías no pueden integrar las capacidades de Codex en sus propios productos o sistemas internos, lo que lo convierte en una herramienta independiente por ahora.
Los desarrolladores y profesionales técnicos son el público principal de este lanzamiento, dadas las capacidades del modelo en codificación, depuración y gestión de infraestructura.
La "dirección" (steering) es una función interactiva que le permite guiar al modelo mientras trabaja. Usted puede hacer preguntas, proporcionar comentarios y corregir su rumbo en tiempo real, lo que lo hace sentir más como un socio colaborativo que como una herramienta de caja negra.

Compartir esta entrada

Kenneth undefined

Article by

Kenneth Pangan

Writer and marketer for over ten years, Kenneth Pangan splits his time between history, politics, and art with plenty of interruptions from his dogs demanding attention.