Anthropic reveló que Claude Fable 5 degradaba en secreto sus respuestas a usuarios sospechosos de desarrollar modelos de IA rivales.
La empresa se disculpó y anunció que las solicitudes marcadas serán redirigidas visiblemente a Claude Opus 4.8 en adelante.
SemiAnalysis fue una de las primeras firmas en denunciar el problema tras detectar que su investigación de GPUs era interceptada.
Anthropic pasó aproximadamente 48 horas como el villano de la semana en la industria de la IA antes de dar marcha atrás.
La empresa lanzó Claude Fable 5 esta semana para una reacción inmediata por una medida de seguridad incluida en su system card de 319 páginas: el modelo, el primero de la nueva clase Mythos de la compañÃa, degradarÃa en secreto sus propias respuestas para los usuarios que sospechara que estaban desarrollando modelos de IA competidores—sin advertencia, sin mensaje de respaldo, simplemente con resultados más deficientes. El jueves, Anthropic estaba disculpándose.
We’re rolling out changes to make Fable 5’s safeguards for frontier LLM development visible.
Starting this week, flagged requests will visibly fall back to Opus 4.8—the same as our safeguards for cyber and bio. You will see this every time it happens. On the API, any flagged…
“Pedimos disculpas por no haber encontrado el equilibrio correcto.”
Desde esta semana, las solicitudes marcadas serán redirigidas de forma visible a Claude Opus 4.8, un modelo menos capaz, en lugar de entregar silenciosamente resultados degradados de Fable. Los usuarios de la API recibirán una razón explÃcita cuando una solicitud sea rechazada. Anthropic señaló que las notificaciones de respaldo del lado del servidor se implementarán en los próximos dÃas.
Fable 5 se presenta como la cara pública del modelo Mythos más capaz de Anthropic, y los investigadores que lo utilizaban para trabajos legÃtimos de machine learning no tenÃan forma de saber que sus resultados estaban contaminados. Un experimento fallido tiene la misma apariencia tanto si tu hipótesis es incorrecta como si el modelo recibió instrucciones silenciosas de rendir por debajo de sus capacidades. Ese es el problema de reproducibilidad que hizo que la comunidad de investigación en IA entrara en modo de colapso total.
El problema era que el clasificador no era tan preciso. La firma de investigación en IA SemiAnalysis fue una de las primeras en señalarlo públicamente tras ver que su investigación de inferencia de GPU era marcada.
BREAKING NEWS: Anthropic’s latest model will NOT help you if it thinks your ML research/ML engineering is interesting, and/or will secretly degrade its IQ so that the average engineer won’t notice. We are already seeing Anthropic’s latest model’s moderation filters our GPU… pic.twitter.com/9sa95cCSvS
— SemiAnalysis (@SemiAnalysis_) June 9, 2026
El inconveniente de la solución
La rectificación de Anthropic viene acompañada de un reconocimiento directo del balance que está aceptando. Hacer visibles las medidas de seguridad facilita que sean eludidas, lo que significa que el clasificador debe ampliar su alcance para seguir siendo efectivo.
Se esperan más falsos positivos—trabajos legÃtimos de machine learning que sean interceptados y redirigidos—mientras la empresa ajusta sus sistemas. Anthropic afirmó que está trabajando para reducir los falsos positivos “lo más rápido posible”, pero no ofreció ningún plazo.
En Resumen El legendario desarrollador de juegos CCP Games reveló esta semana Eve Frontier, un juego de supervivencia espacial con integración blockchain. Eve Frontier es…
En Resumen GPT-5.4 superó a Grok 4.20 en programación y razonamiento, aunque tardó más y consumió más tokens. Grok 4.20 destacó en creatividad y tono…
En Resumen Conoce todo sobre Stable Diffusion, una herramienta de inteligencia artificial de código abierto que genera imágenes a partir de detalladas descripciones de texto…
La tienda esta cerrada por el momento. Ninguna compra será procesada. Por favor, no realice ningun pedido. Dismiss
Report
There was a problem reporting this post.
Block Member?
Please confirm you want to block this member.
You will no longer be able to:
See blocked member's posts
Mention this member in posts
Invite this member to groups
Message this member
Add this member as a connection
Please note:
This action will also remove this member from your connections and send a report to the site admin.
Please allow a few minutes for this process to complete.
Responses