Claude Mythos: La IA «demasiado poderosa» que está cambiando el statu quo en 2026

Stevia Putri
Escrito por

Stevia Putri

Última edición April 20, 2026

Verificado por expertos
Imagen de banner para Claude Mythos: La IA «demasiado poderosa» que está cambiando el statu quo en 2026

En el vertiginoso mundo de la inteligencia artificial, es raro que un modelo sea tan capaz que sus propios creadores teman lanzarlo. Sin embargo, a principios de 2026, eso es exactamente lo que ocurre con Claude Mythos.

La historia de Claude Mythos no comenzó con una presentación llamativa, sino con una filtración accidental de datos en marzo de 2026. Un error humano en el sistema de gestión de contenidos de Anthropic expuso brevemente borradores de entradas de blog y tarjetas de sistema de una familia de modelos no lanzada. La filtración reveló dos nombres: "Mythos" y "Capybara". En cuestión de horas, la comunidad de IA estaba en llamas y, para cuando Anthropic confirmó la existencia del modelo, las acciones de ciberseguridad ya habían comenzado a desplomarse.

El panel de control del escritor de blogs de eesel AI, una herramienta de creación de contenido impulsada por IA para marketing en redes sociales.
El panel de control del escritor de blogs de eesel AI, una herramienta de creación de contenido impulsada por IA para marketing en redes sociales.

Anthropic no rehuyó el revuelo. Describieron a Mythos como un "cambio radical" en el rendimiento de la IA: un modelo tan potente en su capacidad para identificar y explotar vulnerabilidades de software que un lanzamiento general supondría un "riesgo sin precedentes" para la infraestructura digital global.

En este análisis profundo, exploraremos qué hace diferente a Claude Mythos, cómo se compara con el ya impresionante Claude Opus 4.6 y por qué el Project Glasswing es el experimento restringido más importante en la historia de la IA.

Los puntos de referencia: Claude Mythos vs. Opus 4.6

Para entender el "cambio radical" del que habla Anthropic, hay que mirar las cifras. Claude Opus 4.6 ya era el estándar de oro para muchos desarrolladores, pero Mythos ha elevado el techo más de lo que nadie esperaba.

Programación: Una nueva era para la ingeniería autónoma

El salto más sorprendente se produce en la programación. En el SWE-bench Verified, que pone a prueba la capacidad de un modelo para resolver problemas reales de GitHub en bases de código de producción, Mythos alcanzó una puntuación de aproximadamente el 87%. Como contexto, Opus 4.6 se sitúa en el rango del 70 al 75%.

Un salto de 15 puntos porcentuales en SWE-bench no es solo una mejor puntuación; es un cambio cualitativo. Significa la diferencia entre una IA que sugiere fragmentos de código y una IA que puede gestionar de forma autónoma una base de código compleja y desordenada con una mínima intervención humana.

Razonamiento y lógica

Los puntos de referencia de lógica son igualmente impresionantes. En el USAMO 2026 (American Invitational Mathematics Examination), Mythos obtuvo un asombroso 97,6%, en comparación con el 66,2% de Opus 4.6. Esto sugiere que el modelo ha "resuelto" eficazmente el razonamiento matemático a nivel de competición, una hazaña que requiere una lógica deductiva de cadena larga sin los errores acumulativos que afectan a los modelos más pequeños.

Punto de referenciaClaude MythosClaude Opus 4.6
USAMO 202697,6%66,2%
SWE-bench Verified~87%72-73%
CharXiv (con herramientas)93,2%84,7%
OSWorld79,6%72,7%
MMMLU92,7%91,1%

Fuente: Tarjeta de sistema de vista previa de Anthropic Claude Mythos

Claude Mythos representa un salto de rendimiento significativo sobre la familia Opus tanto en programación como en razonamiento lógico complejo.
Claude Mythos representa un salto de rendimiento significativo sobre la familia Opus tanto en programación como en razonamiento lógico complejo.

Como dijo un usuario en Reddit en /r/singularity: "El salto de Opus 4.6 a Mythos se siente como el salto de GPT-3 a GPT-4. Es la primera vez que veo a una IA mirar una base de código heredada de hace 20 años y encontrar una vulnerabilidad que los auditores humanos pasaron por alto durante dos décadas".


Project Glasswing: El centinela restringido

Con capacidades tan altas, el riesgo de "doble uso" se convierte en una preocupación principal. Un modelo que es "sorprendentemente capaz en tareas de seguridad informática" es un sueño para los defensores y una pesadilla para todos los demás si cae en las manos equivocadas.

Una captura de pantalla de la página de inicio de Anthropic.
Una captura de pantalla de la página de inicio de Anthropic.

Es por esto que Anthropic lanzó el Project Glasswing. En lugar de una API pública o una interfaz al estilo ChatGPT, Mythos solo está disponible actualmente a través de una vista previa de investigación restringida. El acceso está limitado a unos 40 "socios industriales críticos" y organizaciones responsables de la infraestructura de software más esencial del mundo.

Los socios de Glasswing

La lista de socios incluye a los pesos pesados del mundo tecnológico:

  • Gigantes de la nube: Amazon Web Services (AWS), Google Cloud y Microsoft.
  • Hardware y chips: Nvidia y Broadcom.
  • Fabricantes de dispositivos: Apple.
  • Firmas de ciberseguridad: Crowdstrike.
  • Gobierno e investigación: El UK AI Safety Institute (AISI) y Gray Swan.
Una captura de pantalla de la página de inicio de Crowdstrike.
Una captura de pantalla de la página de inicio de Crowdstrike.

El objetivo es sencillo: dar ventaja a los defensores. Al permitir que estas organizaciones ejecuten Mythos contra sus propios sistemas, pueden encontrar y parchear miles de vulnerabilidades de alta gravedad antes de que un modelo futuro, menos alineado, haga que esas mismas capacidades estén ampliamente disponibles para actores malintencionados.

Expectativa vs. Realidad

No todo el mundo está convencido por la narrativa de "demasiado poderoso para ser lanzado". El reconocido investigador de seguridad Bruce Schneier ha cuestionado si esto es "principalmente marketing", un elaborado discurso de ventas diseñado para hacer que Mythos parezca más revolucionario de lo que es.

Sin embargo, Ciaran Martin, exjefe del Centro Nacional de Ciberseguridad del Reino Unido, señala que la pura velocidad del modelo es lo que ha sacudido a la gente. "La mayoría de los hackers no necesitan herramientas de IA súper avanzadas para vulnerar sistemas", dijo, "pero Mythos puede hacerlo a una escala y velocidad que nunca antes habíamos visto".


El futuro de los compañeros de IA: Más allá de la expectativa

En eesel AI, siempre hemos creído que el verdadero poder de la IA no está en un cuadro de chat, sino en compañeros de IA autónomos que viven donde tú trabajas. Claude Mythos representa la siguiente evolución de esta visión.

Si un modelo es tan bueno en el razonamiento de alto riesgo y múltiples pasos requerido para la ciberseguridad, imagina lo que puede hacer por tus operaciones comerciales. Ya estamos viendo cómo estos modelos de "cambio radical" están transformando los flujos de trabajo:

  1. Tareas agénticas complejas: Mythos puede seguir instrucciones a través de miles de archivos sin perder el hilo. Esto lo convierte en el motor perfecto para la automatización del flujo de trabajo de Claude Code, donde la IA necesita entender el "porqué" detrás de un cambio, no solo el "qué".
  2. Conocimiento unificado: Con una ventana de contexto de 1M, un compañero de IA impulsado por un modelo de nivel Mythos puede mantener toda la historia de tu empresa en su memoria activa. Se acabó el "no tengo esa información": la IA conoce tus documentos, tu historial de Slack y tus tickets de Jira como si fuera un veterano de 10 años en el equipo.
  3. Soporte basado en el razonamiento: Para el servicio al cliente, esto significa un agente de IA que puede manejar escalaciones técnicas que antes requerían un ingeniero senior.

A medida que avanzamos hacia 2026, la pregunta para las empresas no es "¿Deberíamos usar IA?", sino "¿Es nuestra IA lo suficientemente capaz como para ser un verdadero compañero?". Modelos como Mythos están demostrando que la respuesta es cada vez más un "Sí".

Para aquellos que buscan mantenerse en la frontera sin el dolor de cabeza de la infraestructura, es esencial explorar alternativas a Claude Opus 4.6 y prepararse para el despliegue de modelos de próxima generación. Incluso puedes ver cómo estamos usando herramientas de colaboración de Claude AI para cerrar la brecha entre estos potentes modelos y tus aplicaciones diarias.


Preguntas frecuentes

Su extrema competencia en ciberseguridad significa que puede encontrar errores más rápido que los humanos, lo cual supone un riesgo importante si es explotado por actores malintencionados.
El acceso está actualmente limitado a través del Project Glasswing en Amazon Bedrock para organizaciones de infraestructura crítica.
Mythos lidera en puntos de referencia específicos de ciberseguridad y matemáticas competitivas, mientras que GPT-5.4 Codex sigue siendo un fuerte rival en programación de propósito general.

Share this article

Stevia Putri

Article by

Stevia Putri

Stevia Putri is a marketing generalist at eesel AI, where she helps turn powerful AI tools into stories that resonate. She’s driven by curiosity, clarity, and the human side of technology.

Listo para contratar tu companero de IA?

Configuracion en minutos. Sin tarjeta de credito requerida.

Comienza gratis