Search Here

Claude Fable 5: el modelo Mythos de Anthropic llega al público

Home / Claude Fable 5: el modelo Mythos de...

Claude Fable 5: el modelo Mythos de Anthropic llega al público Claude Fable 5: el modelo Mythos de Anthropic llega al público Claude Fable 5: el modelo Mythos de Anthropic llega al público

Claude Fable 5: el modelo Mythos de Anthropic llega al público

Spread the love

¿Qué haces cuando construyes una inteligencia artificial tan capaz que te da miedo lanzarla? Anthropic encontró su respuesta: le pones un freno de mano. El 9 de junio, la compañía lanzó Claude Fable 5, la primera versión disponible al público de su familia de modelos Mythos, la misma que en abril fue considerada demasiado peligrosa para un lanzamiento general.

Para entender la noticia hay que retroceder a abril de 2026, cuando Anthropic reveló Claude Mythos Preview: un modelo que, sin haber sido diseñado para ciberseguridad, demostró una capacidad inquietante para encontrar miles de vulnerabilidades en todos los sistemas operativos y navegadores principales del mundo. La empresa decidió no lanzarlo al público y limitó su acceso a un grupo selecto de organizaciones a través de Project Glasswing, una iniciativa defensiva junto a AWS, Apple, Google, Microsoft, Cisco, JPMorgan Chase y otros gigantes.

Fable 5 es la respuesta a la pregunta que quedó flotando desde entonces: ¿cómo llevar esa capacidad al público sin regalar un arma?

El truco: si preguntas algo riesgoso, responde otro modelo

La solución de Anthropic es ingeniosa. Fable 5 incluye una capa de salvaguardas que detecta consultas de alto riesgo en áreas como ciberseguridad, biología, química e intentos de destilar las capacidades del modelo hacia otros sistemas. Cuando eso ocurre, la consulta se redirige automáticamente a Claude Opus 4.8, el siguiente modelo más capaz de la empresa, pero sin las capacidades peligrosas de la clase Mythos.

Según Anthropic, estas salvaguardas están calibradas de forma conservadora: a veces atraparán solicitudes inofensivas, pero se activan en promedio en menos del 5% de las sesiones. La empresa reconoce el costo: investigadores legítimos de seguridad o biología pueden verse frenados, y promete reducir los falsos positivos con el tiempo.

El modelo más capaz que Anthropic ha lanzado jamás

Fuera de las áreas restringidas, Fable 5 es, según la propia empresa, superior a cualquier modelo que haya puesto a disposición general: estado del arte en casi todos los benchmarks, con desempeño excepcional en ingeniería de software, trabajo de conocimiento, visión e investigación científica. Un patrón llama la atención: cuanto más larga y compleja la tarea, mayor la ventaja de Fable 5 sobre sus predecesores.

En algunos benchmarks, Fable 5 superó por más de 10% a Claude Opus 4.8, el modelo que Anthropic había presentado apenas a finales de mayo. Casos tempranos reportados incluyen a Stripe, que afirma que el modelo comprimió meses de trabajo de ingeniería en días.

1.000 horas intentando romperlo

Antes del lanzamiento, Anthropic sometió las salvaguardas a una batería de pruebas de estrés: un bug bounty externo acumuló más de 1.000 horas de intentos de jailbreak sin que nadie encontrara una vulneración universal. Equipos independientes de red-teaming tampoco lo lograron. La empresa admite que podrían existir ataques novedosos aún no descubiertos, y por eso impone una retención de datos de 30 días en todo el tráfico de modelos Mythos-class, incluso para empresas que tenían acuerdos de retención cero.

Mythos 5: la versión sin frenos, solo para aprobados

Junto a Fable 5, Anthropic lanzó Claude Mythos 5: el mismo modelo subyacente, pero con las salvaguardas levantadas en algunas áreas. Su acceso queda restringido a ciberdefensores e infraestructura crítica a través de Project Glasswing, en colaboración con el gobierno de Estados Unidos. Anthropic afirma que tiene las capacidades de ciberseguridad más fuertes de cualquier modelo en el mundo, y planea expandir el acceso mediante un programa de confianza.

Disponibilidad y precios

  • Fable 5 está disponible desde el 9 de junio en los planes Pro, Max, Team y Enterprise.
  • Incluido sin costo adicional hasta el 22 de junio de 2026; después podrían requerirse créditos de uso según capacidad.
  • En la API: $10 por millón de tokens de entrada y $50 por millón de salida, menos de la mitad de lo que costaba Mythos Preview.
  • Mythos 5: solo organizaciones aprobadas (Project Glasswing y investigadores seleccionados).

El contexto que no se puede ignorar

El lanzamiento llega en una semana cargada de simbolismo: Anthropic presentó su solicitud confidencial de salida a bolsa el 1 de junio con una valoración de $965.000 millones, y días antes pidió públicamente a los grandes laboratorios mundiales establecer un ‘freno coordinado’ al desarrollo de IA de frontera, advirtiendo sobre la posibilidad de que los sistemas alcancen la auto-mejora recursiva.

La paradoja es evidente y vale la pena nombrarla: la misma empresa que pide pausar el desarrollo lanza su modelo más potente de la historia mientras se prepara para cotizar en Wall Street. La respuesta de Anthropic a esa tensión es precisamente el diseño de Fable 5: no se trata de no avanzar, dicen, sino de avanzar con frenos puestos. Si el enfoque funciona, podría convertirse en el manual de cómo la industria lanza modelos peligrosos de aquí en adelante.

Leave A Comment