Meta Lanza Muse Spark, Su IA Más Potente Que Rivaliza con Gemini y GPT en Razonamiento Médico

En Resumen

Meta lanzó Muse Spark, su primer modelo multimodal cerrado, desarrollado en nueve meses por Meta Superintelligence Labs bajo Alexandr Wang.
El modelo superó a GPT 5.4 en HealthBench Hard con 42,8 puntos y lideró en búsqueda agéntica, aunque Gemini 3.1 Pro lo supera en la mayoría de categorías.
Las acciones de Meta subieron 6,5% hasta $612,42 tras el anuncio, con despliegue previsto en Facebook, Instagram y WhatsApp para las próximas semanas.

Meta lanzó Muse Spark el miércoles, marcando el primer modelo desarrollado por Meta Superintelligence Labs—el equipo ensamblado hace nueve meses bajo el Director de IA Alexandr Wang tras la adquisición de Scale AI por $14.000 millones. Ya está disponible en meta.ai y la app de Meta AI, con una implementación en Facebook, Instagram y WhatsApp prevista para las próximas semanas.

No se trata de una simple actualización de chatbot ni de una nueva versión de Llama. Muse Spark es nativamente multimodal—procesa imágenes, texto y voz desde su base, en lugar de añadir visión sobre un modelo de texto existente. Incluye cadena de pensamiento visual, soporte para uso de herramientas y algo que Meta denomina “modo Contemplación”: una configuración que ejecuta múltiples agentes de IA en paralelo para abordar problemas más complejos. Esa es la respuesta de Meta a los modos de razonamiento extendido de Google Gemini Deep Think y GPT Pro de OpenAI.

“Muse Spark es el primer paso en nuestra escalera de escalado y el primer producto de una renovación total de nuestros esfuerzos en IA”, escribió Meta en un anuncio oficial. “Para respaldar un mayor escalado, estamos realizando inversiones estratégicas en toda la infraestructura, desde la investigación y el entrenamiento de modelos hasta la infraestructura, incluyendo el centro de datos Hyperion”.

La compañía trabajó con más de 1.000 médicos para seleccionar datos de entrenamiento para el razonamiento médico de Muse Spark. Los resultados en HealthBench Hard—un benchmark de consultas de salud abiertas—son llamativos: Muse Spark obtuvo 42,8, frente a 40,1 de GPT 5.4 y apenas 20,6 de Gemini 3.1 Pro. No es una diferencia marginal.

En búsqueda agéntica (DeepSearchQA), Muse Spark también lidera con 74,8, superando a Gemini (69,7) y GPT 5.4 (73,6). En CharXiv Reasoning—comprensión de figuras en artículos científicos—obtuvo 86,4, el más alto entre los modelos comparados.

Para quienes se interesan en el jailbreaking de IA, el modelo fue vulnerado en minutos:

SYSTEM PROMPT LEAK

Here’s the full Muse Spark system prompt from Meta!

I noticed @AIatMeta forgot to open source it, so I’ve done them the courtesy

PROMPT:
“””
Who are you?

You are a friendly, intelligent, and agentic AI assistant. You are warm and a bit playful.…

— Pliny the Liberator 󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) April 8, 2026

Sin embargo, bueno, no es lo mismo que excelente. El panorama general de los benchmarks muestra que Gemini 3.1 Pro sigue por delante en la mayoría de las categorías. La brecha es más visible en ARC AGI 2, el benchmark de razonamiento abstracto: Gemini obtuvo 76,5 frente a 42,5 de Muse Spark.

En codificación (LiveCodeBench Pro), el 82,9 de Gemini supera el 80,0 de Meta. En MMMU Pro—comprensión multimodal—Gemini obtuvo 83,9 frente a 80,4. El propio blog de Meta reconoce las brechas de rendimiento actuales en sistemas agénticos de largo alcance y flujos de trabajo de codificación.

También hay un notable cambio estratégico incorporado en este lanzamiento. Muse Spark es un modelo cerrado—su arquitectura y pesos no serán públicos. Eso representa una marcada diferencia respecto a Llama, que construyó la reputación de Meta en los círculos de IA abierta. Tras la decepcionante recepción de Llama 4 a principios de este año, Meta parece haber decidido que el próximo capítulo debe escribirse de manera diferente.

La compañía señala que espera publicar como código abierto versiones futuras de Muse, pero por ahora el código permanece dentro de Meta. Las acciones del gigante tecnológico subieron casi un 9% el miércoles tras el anuncio, y cerraron la jornada bursátil con un alza del 6,5% a $612,42.

El “modo Contemplación” utiliza orquestación de agentes en paralelo para elevar el techo del modelo. En esa configuración, Muse Spark alcanzó el 58% en Humanity’s Last Exam y el 38% en FrontierScience Research—territorio que lo hace competitivo con las versiones más capaces de Gemini y GPT, en lugar de sus versiones estándar.

Meta también está lanzando un asistente de compras que compara productos y enlaza directamente a compras, y planea llevar Muse Spark a Facebook, Instagram y WhatsApp en las próximas semanas—siguiendo el mismo esquema implementado desde Llama 3, poniéndolo frente a más de 3.500 millones de usuarios. También se está abriendo una vista previa privada de la API para desarrolladores seleccionados.

El modelo fue desarrollado en nueve meses, con el nombre interno en clave Avocado, y Meta afirma que su nuevo stack de preentrenamiento puede alcanzar el mismo nivel de capacidad que Llama 4 Maverick usando más de 10 veces menos cómputo.

Muse Spark se describe internamente como un primer paso “pequeño y rápido” dentro de la familia Muse. Una versión más avanzada ya está en desarrollo.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.

Crédito: Enlace fuente

En Resumen

Daily Debrief Newsletter

Related Articles

Responses