Anthropic Lanza Claude Mythos 5, el Modelo de IA con Capacidades de Ciberseguridad que Solo Unos Pocos Podrán Usar

En Resumen

  • Anthropic lanzó Claude Mythos 5, modelo de acceso restringido para organizaciones de ciberseguridad aprobadas, e infraestructura crítica.
  • Claude Fable 5, versión pública, superó todos los benchmarks anteriores con 78% en ExploitBench y 88% en Terminal-Bench.
  • Solicitudes sensibles en Fable 5 son filtradas por Claude Opus 4.8, salvaguarda que se activa en menos del 5% de las sesiones.

El martes, Anthropic anunció el lanzamiento oficial de Claude Mythos 5, un modelo de IA de acceso restringido que, según la empresa, posee capacidades de ciberseguridad sin precedentes, junto a Claude Fable 5, una versión diseñada para uso público más amplio.

En una publicación en su blog, Anthropic señaló que Mythos 5 estará disponible inicialmente solo para organizaciones de ciberseguridad aprobadas, operadores de infraestructura crítica, socios gubernamentales e investigadores seleccionados en ciencias de la vida. La empresa afirma que los modelos de IA de la clase Mythos “han alcanzado un umbral en el que representan riesgos significativos”.

“En abril, iniciamos el Proyecto Glasswing, lanzando el primer modelo de la clase Mythos (Claude Mythos Preview) a un grupo reducido de defensores cibernéticos y proveedores de infraestructura de software crítico”, escribió Anthropic. “Al hacerlo, manifestamos que esperábamos eventualmente poner las capacidades de nivel Mythos a disposición de todos nuestros usuarios, siempre que hubiéramos desarrollado nuevas salvaguardas lo suficientemente sólidas como para prevenir de forma confiable su uso indebido”.

El lanzamiento llega tras meses de preocupación por la capacidad de Mythos para identificar vulnerabilidades de software y llevar a cabo operaciones complejas de ciberseguridad, luego de que información sobre la IA se filtrara en línea en marzo. A principios de este año, el Instituto de Seguridad de IA del Reino Unido reportó que una versión preliminar se convirtió en el primer modelo de IA en completar un ejercicio de intrusión a una red corporativa de 32 pasos sin asistencia humana. En abril, Mozilla informó que una versión preliminar de Mythos descubrió más de 271 vulnerabilidades en el navegador Firefox.

Hasta ahora, Anthropic había restringido el acceso a Mythos a través de su programa Project Glasswing mientras los investigadores evaluaban los riesgos. En una publicación de seguimiento en X, Anthropic indicó que continuará ampliando el acceso a Mythos “a través de un programa de acceso de confianza más amplio”, para trabajos de ciberseguridad e investigación biomédica.

El lanzamiento de Mythos también llega en un momento en que las tensiones entre Anthropic y la administración del presidente Donald Trump parecen estar disminuyendo, luego de una disputa pública sobre el uso de Claude para operaciones militares.

“En consulta con el gobierno de Estados Unidos, planeamos ampliar de manera gradual el acceso a Claude Mythos 5, continuando con la incorporación periódica de nuevos socios, además de impulsar un programa de acceso de confianza que permita a las organizaciones de ciberseguridad aplicar de una manera más sistemática”, escribió Anthropic, añadiendo que los usuarios de Mythos Preview podrán actualizar a Mythos 5.

A principios de este mes, medios de comunicación informaron que Anthropic había incorporado ingenieros en la Agencia de Seguridad Nacional (NSA) para ayudar a desplegar su modelo de IA Mythos en operaciones de ciberseguridad, supuestamente dirigidas a China e Irán.

Junto a Mythos 5, Anthropic lanzó Claude Fable 5, un modelo de IA de la clase Mythos que utiliza el mismo diseño central de Mythos 5, pero con salvaguardas adicionales para el público en general.

“Las capacidades de Fable 5 superan a las de cualquier modelo que hayamos puesto a disposición del público”, afirmó Anthropic. “Es el más avanzado en casi todos los benchmarks de capacidad de IA evaluados, mostrando un rendimiento excepcional en ingeniería de software, trabajo del conocimiento, visión, investigación científica y muchas otras áreas”.

Según Anthropic, Mythos 5 y Fable 5 alcanzaron las puntuaciones más altas en varios benchmarks de ingeniería de software, ciberseguridad, biología y razonamiento. La empresa reportó un 78% en ExploitBench, que mide el descubrimiento y la explotación de vulnerabilidades, y un 88% en el benchmark de programación Terminal-Bench. Anthropic señaló que los resultados demuestran que los modelos pueden manejar tareas más largas y complejas que los sistemas Claude anteriores.

Si bien Anthropic indicó que Fable 5 se desempeña especialmente bien en tareas largas y complejas, para prevenir su uso indebido, las solicitudes relacionadas con ciberseguridad, biología, química o replicación de modelos de IA son procesadas por Claude Opus 4.8, una salvaguarda que, según la empresa, se activa en menos del 5% de las sesiones.

“Lanzar un modelo con estas capacidades conlleva riesgos”, escribió Anthropic. “Sin salvaguardas, las capacidades de Fable 5 en áreas como la ciberseguridad podrían ser utilizadas de forma indebida para causar daños graves”.

El lanzamiento llega en un momento en que los desarrolladores de IA enfrentan preguntas crecientes sobre cómo lanzar sistemas cada vez más capaces. Anthropic ha argumentado que Mythos podría ayudar a los defensores a encontrar y corregir vulnerabilidades antes de que los atacantes las exploten. Al mismo tiempo, los críticos, entre ellos el CEO de OpenAI, Sam Altman, han acusado a la empresa de utilizar “marketing basado en el miedo” para vender sus modelos de IA.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.



Crédito: Enlace fuente

Related Articles

Responses

Your email address will not be published. Required fields are marked *