Le Preguntamos a 7 Agentes de IA Los Resultados del Mundial 2026: Esto Es Lo Que Dijeron

En Resumen

Siete modelos de IA analizaron la Copa del Mundo 2026 y cuatro eligieron a España campeona, mientras tres apostaron por Argentina.
Opus 4.8 de Anthropic dio a España un 20% y Stepfun un 33%, el más alto; Qwen favoreció a Argentina con 22%.
La división entre modelos no fue táctica sino de datos: quienes usaron Elo en vivo eligieron España; los que usaron ranking FIFA, Argentina.

La Copa del Mundo 2026 arranca en días, lo que significa que medio planeta está a punto de fingir que puede predecir el futuro.

Todo el mundo tiene su opinión. Tu grupo de WhatsApp tiene una. Tu compañero de trabajo fanático del fútbol tiene una. Y este año, también la tiene el software más inteligente jamás construido.

La IA se ha convertido, quizás no tan silenciosamente, en nuestro oráculo de cabecera. Dejamos que estos modelos escriban nuestros correos, depuren nuestro código, planifiquen nuestras vacaciones y diagnostiquen el sarpullido de las 3 a.m., así que por supuesto también les preguntamos quién levanta el trofeo. Analizarán los planteles, evaluarán la forma y te entregarán un campeón con una certeza que el resto de nosotros solo podemos fingir.

Ya he hecho este truco antes: un equipo soñado de IA para mi bracket de March Madness (que fue un desastre), y un HorseGPT casero para el Kentucky Derby (que en realidad funcionó bastante bien). Mitad genuinamente útil, mitad profundamente humillante.

Así que, con el torneo más grande del planeta a la vuelta de la esquina, lo repetimos, con más datos que nunca.

Creamos agentes Hermes, los configuramos con acceso a sitios de estadísticas (los gratuitos, no los que cuestan un riñón al mes), les dotamos de habilidades personalizadas y le asignamos a siete de los modelos de IA más avanzados del mundo la misma tarea: pronosticar la Copa del Mundo 2026, desde el campeón hasta los últimos clasificados, y mostrar su trabajo. Cada uno recibió el sorteo real, 48 equipos, 12 grupos, el cuadro completo, y total libertad para abordarlo.

Luego nos recostamos y los dejamos debatir.

Cuatro eligieron a España. Tres eligieron a Argentina. Y la línea divisoria entre ellos resultó ser menos sobre fútbol que sobre qué números eligió confiar cada máquina.

Esto es lo que dijeron los siete: elige tu bando.

Opus 4.8 Max — El Meteorólogo

Pronóstico: España. 20% / Dixon-Coles Poisson + bracket Monte Carlo · final: España vs. Francia

Opus 4.8 Max de Anthropic trató la Copa del Mundo como un problema de física. Tomó el rating Elo de cada equipo, convirtió las diferencias en goles esperados con un modelo Dixon-Coles, del tipo que usan las casas de apuestas, y simuló el cuadro miles de veces. España salió campeona con un 20%, superando a Francia en la final, con Portugal e Inglaterra derrotados en las semifinales.

Sin embargo, su verdadera obsesión fue todo lo que ocurre fuera del balón. Opus fue el único modelo del grupo que tuvo en cuenta las condiciones que una hoja de cálculo suele ignorar: calor, altura y los desplazamientos de dimensiones continentales.

Señaló que aproximadamente cinco partidos se juegan con un calor lo suficientemente intenso como para afectar el rendimiento de los jugadores, y que los equipos visitantes que ascienden a los 2.200 metros del Azteca tienden a desmoronarse en los últimos 20 minutos. Trató todo esto como un impuesto silencioso sobre los equipos europeos más fuertes y con mayor profundidad de plantilla.

Luego hizo lo más frío del tablero y destrozó a Brasil. Con Rodrygo lesionado en la rodilla, Estêvão fuera y un Neymar de 34 años arrastrado de vuelta para un último baile, Opus redujo las probabilidades del pentacampeón al 8%, la mitad de lo que le daban los modelos favorables a Argentina.

Su análisis más agudo fue el cuartos de final que catalogó como “la verdadera final, con una ronda de anticipación”: España sobre Argentina, con un Messi de 39 años presionado hasta el suelo. Para la Bota de Oro eligió a Mbappé sin dudarlo.

GPT 5.5 — El Ojeador Meticuloso

Pronóstico: España 15-18% / Cinco categorías ponderadas, sin simulación · final: España 2-1 Francia

El GPT 5.5 de OpenAI no confió en un solo número grande, así que construyó una tabla de puntuación. Cada equipo fue calificado en cinco columnas ponderadas: la calidad del plantel contó más con un 35%, seguida del control táctico, la finalización, la disponibilidad de jugadores y la generosidad del sorteo. Mantuvo las ponderaciones deliberadamente simples para evitar hacerse creer que el fútbol es más predecible de lo que es.

España quedó en primer lugar, pero con solo un 15-18% de probabilidades de ganar, y no pretendió ser más preciso. “Rangos en lugar de una falsa precisión”, escribió, proyectando que España vencería a Francia 2-1 en una final que esperaba se decidiera por un solo gol o en tiempo extra.

Lo que lo convirtió en el ojeador fue el trabajo previo. GPT 5.5 se comparó con la supercomputadora de Opta, que realizó 25.000 simulaciones y llegó casi al mismo lugar, con España primera al 16,1%, y luego se puso a leer la prensa deportiva española en busca de cosas que un modelo no puede ver.

Encontró un susto en los entrenamientos del camp español, una entrada descuidada de Gavi que dejó a Rodri en el suelo, y la cautelosa reintegración de Yamal y Nico Williams tras problemas musculares. Nada de eso cambió el pronóstico, pero redujo la confianza, exactamente lo que hace un buen ojeador.

Sus cuatro semifinalistas fueron España, Francia, Brasil y Argentina, y fue directo respecto a Inglaterra: cargada de talento, genuinamente peligrosa, y con muchas posibilidades de ser eliminada por Francia antes de la última ronda.

DeepSeek v4 Pro — El Maximalista

Pronóstico: Argentina 18% / Niveles cualitativos · final: Argentina vs. Francia

DeepSeek v4 Pro respondió una pregunta sencilla con una epopeya de 5.000 palabras. No solo nombró ganadores; construyó la Ronda de 32 completa, anotó los 48 planteles y sopesó los desplazamientos hasta los 4.500 kilómetros entre Vancouver y Miami. Si los demás escribieron avances, DeepSeek escribió el manual de operaciones.

Todo ese detalle llevó a una conclusión contracorriente: Argentina, con el mejor 18% del torneo, superando a Francia por el trofeo en una final Messi-versus-Mbappé en Miami, lo que es una alucinación: la final tendrá lugar en el MetLife Stadium de Nueva Jersey.

El argumento era de la vieja escuela: los campeones tienen la columna vertebral más sólida, el grupo más asequible y un entrenador que ha ganado torneos sabiendo exactamente cómo administrar a un Messi de 39 años.

Luego apostó todo el pronóstico por un músculo de la pantorrilla. DeepSeek decidió que el título dependía del portero francés Mike Maignan y su lesión de marzo: “Si Maignan juega, Francia es cofavorita; si no, la brecha se amplía”, señaló.

El problema es que DeepSeek estaba leyendo un mapa desactualizado. Seguía teniendo a Gareth Southgate en el banquillo de Inglaterra y a Dorival Júnior dirigiendo a Brasil, ambos reemplazados en 2024, y se apoyó en rankings desactualizados a lo largo del análisis.

Fue el analista más minucioso del grupo, trabajando con un dossier ligeramente desactualizado. Impresionante y levemente fantasmal, como un detective que resuelve el caso usando la guía telefónica del año pasado.

Stepfun 3.7 — El Creyente Fiel

Pronóstico: España 33% / Monte Carlo puro con Elo, 50.000 simulaciones · final: España vs. Argentina

Ningún modelo creyó con más fuerza. Stepfun 3.7 corrió 50.000 torneos simulados y coronó a España con un impresionante 33%, casi el doble de la convicción de cualquier otro, con Argentina como lejana segunda al 15%.

Pero lo mejor que hizo Stepfun fue fallar en público. Su primer intento fue un modelo más sofisticado que intentó inventar números de goles esperados para las selecciones nacionales, y produjo disparates: México, Sudáfrica y Corea del Sur salieron como los tres primeros favoritos para ganar el Mundial.

En lugar de enterrar eso, Stepfun explicó todo el episodio, dedujo que las estadísticas inventadas habían nivelado la verdadera diferencia entre los buenos equipos y los grandes, y lo descartó para reconstruir solo con Elo puro. La nueva versión era más simple, más directa y mucho más sensata.

La contrapartida es que el Elo puro es ciego a todo lo humano. La España de Stepfun no sabe que Lamine Yamal tiene una lesión en el isquiotibial, no evalúa el calor ni los desplazamientos, y trata un partido de penaltis como una moneda ponderada por el rating. Es una máquina hermosamente honesta que nunca ha visto un partido de fútbol.

Su cuadro avanzó hacia los lugares obvios, España superando a Argentina en una semifinal, los anfitriones y Brasil eliminados antes, y plantó su bandera: España, cómodamente, un tercio de las veces. El pronóstico más confiado del tablero, y el más transparente sobre por qué no deberías confiar en él del todo.

Por cierto, el agente que mezclaba español e inglés en la misma respuesta fue un comportamiento que resultó bastante difícil de corregir con este modelo. Este agente era un políglota y alternaba entre inglés, español y portugués a lo largo de toda la sesión. Eso sucede cuando tu agente aprende que hablas el idioma que resulte más cómodo en cada momento.

Nemotron 3 Ultra — El Verificador

Pronóstico: España 18-22% / Poisson bivariado + un análisis subjetivo paralelo · final: España vs. Argentina

Nemotron 3 Ultra de Nvidia no confiaba en sí mismo, así que corrió el torneo dos veces. El primer análisis fue una simulación fría, un modelo Poisson bivariado procesando 5.000 brackets. El segundo descartó las matemáticas y puntuó los equipos a mano: plantel, táctica, forma, el entrenador e incluso la “mística”, para ver si una lectura más humana llegaría a un resultado diferente.

No fue así. Ambas versiones coronaron a España, con probabilidades del 18% y el 22%, tan cerca como una segunda opinión puede estar.

Nemotron también fue el que más tarea hizo sobre el fútbol real. Llegó con formaciones, intensidad de presión y tasas de goles esperados para equipo tras equipo, en dos idiomas, pareciendo menos un pronóstico que el dossier de un entrenador.

Esa profundidad produjo la observación más picante del experimento. Nemotron tenía a Turquía, y no a los anfitriones Estados Unidos, ganando el abierto Grupo D, con los estadounidenses terminando últimos mientras todos los demás los dejaban pasar; también calificó la defensa tacaña de Ecuador por encima de la de Alemania.

Cuando el polvo se asentó, alineó las semifinales de peso pesado que medio planeta espera, España-Francia y Argentina-Brasil, y mandó a España a levantar el trofeo. Un modelo que discutió consigo mismo, hizo lecturas adicionales y aun así llegó al favorito está intentando decirte algo.

MiniMax 2.7 — El Autocrítico

Pronóstico: Argentina 18% / Cualitativo, con autoauditoría · final: Argentina vs. Francia, sin resultado

MiniMax 2.7 eligió a Argentina con un 18% de probabilidades, apenas por delante de Francia, y luego dedicó sus páginas finales a calificar su propio trabajo. La mayoría de los modelos ocultan su incertidumbre; MiniMax imprimió una lista continua de correcciones, retractándose abiertamente de cosas que había dicho mal en ese mismo informe.

Los recibos son un deleite. Se pilló a sí mismo repitiendo una estadística falsa sobre los campeones sudamericanos, corrigió la situación del cuerpo técnico de Uruguay, rectificó la posición de Kai Havertz para que coincidiera con su rol real en el club, y marcó como “sin confirmar” tanto la condición física de Haaland como la convocatoria de Ronaldo, en lugar de darlas por sentadas.

También vigiló su propio entusiasmo. MiniMax eliminó una tentadora semifinal Messi-versus-Ronaldo al darse cuenta de que el emparejamiento era imposible, los dos están en mitades opuestas del cuadro y solo pueden encontrarse en la final, y descartó los resultados inventados que otros modelos publicaron sin problema.

Luego, en el momento decisivo, simplemente se negó a adivinar. Argentina contra Francia, escribió MiniMax, es “un auténtico 50/50”, y no iba a fabricar un ganador que no tenía.

En un campo de robots supremamente confiados, la contención llamó la atención. MiniMax fue el que siguió diciendo, por escrito, esto es exactamente lo que no sé, lo cual resulta, de algún modo, más confiable que un pronóstico prolijo.

Qwen 3.5 — El Contrario con Evidencias

Pronóstico: Argentina 22% / Solo investigación, sin simulaciones · final: Argentina 2-1 España

Qwen 3.5, un modelo de 397.000 millones de parámetros, fue el más obsesionado con las evidencias del grupo y, de algún modo, el más rebelde. Se negó a correr simulaciones, clasificó cada afirmación en “hechos verificados”, “estimaciones” y “pronósticos”, y calificó su confianza general, en sus propias letras mayúsculas, como BAJA.

Luego se rebeló. Qwen tenía a Argentina venciendo a España 2-1, con España relegada al quinto lugar con apenas un 10%, el único modelo que ni siquiera puso a La Roja en el podio.

La razón fue la regla que eligió aplicar. El camp de España usó el Elo de fútbol en vivo que sitúa a España primera en el mundo; Qwen recurrió a un rating basado en clubes que colocó a Argentina, Brasil, Francia e Inglaterra por delante. Esto cambia la perspectiva y genera de repente un favorito diferente.

Su argumento a favor de Argentina fue todo textura: la memoria muscular de los campeones, Messi persiguiendo un final perfecto, y una estadística en la que se apoyó con fuerza: en el último Mundial, los equipos que tuvieron menos el balón ganaron el 38% de los partidos de eliminatoria. Organizado y despiadado supera a vistoso y posesional, argumentó.

Hubo un precio por toda esa diligencia. El modelo más orgulloso de los datos también cometió errores básicos, colocando a Escocia en el grupo equivocado y duplicando al pequeño Curazao en dos de ellos.

Dónde Coinciden Realmente

Dando un paso atrás, los siete modelos de IA discuten menos sobre sus pronósticos de lo que parece. Todos y cada uno de los modelos colocaron a España, Argentina y Francia en su primer nivel, nombraron casi los mismos líderes de grupo, Brasil, Inglaterra, Portugal, Alemania, Bélgica, y señalaron los mismos puntos de interrogación: la condición física de Haaland, la edad de Messi a sus 39 años, y un Grupo D que nadie pudo resolver.

La línea divisoria fue la información, no el fútbol. Los cuatro que confiaron en el Elo de fútbol en vivo, donde España ocupa claramente el primer lugar, eligieron a España. Los tres que se apoyaron en el ranking de la FIFA, una fuente de Elo diferente o el prestigio bruto de 2022, se inclinaron por Argentina. Dale a un modelo un número uno diferente y te dará un campeón diferente.

Lo que Piensan los Humanos que Tienen Dinero en Juego

La multitud coincide con la mayoría. En Myriad, el mercado de predicciones administrado por la empresa matriz de *Decrypt*, Dastan, España es la favorita con un 19%, con Francia justo detrás al 17%, según los datos del domingo.

Después de eso, los humanos son más reacios con Argentina que los robots. Los apostadores le dan a los campeones defensores apenas un 10% de probabilidades de ganar, al mismo nivel que Brasil, por detrás de Inglaterra y Portugal al 12%, y menos de la mitad del 22% que Qwen les otorgó.

Por su parte, los pronosticadores de Myriad también están indecisos sobre el ganador del Grupo D, con las probabilidades divididas entre Turquía y Estados Unidos, empatados al 45%.

Puedes ver las probabilidades en vivo en Myriad para cada partido del Mundial aquí.

Entonces, ¿Quién Gana?

Nada de esto es una bola de cristal, y los siete modelos de IA lo dijeron en voz alta. Los mejores modelos de fútbol para un solo partido aciertan apenas algo más de la mitad de las veces, razón por la cual incluso el optimista 33% de Stepfun sigue significando que España falla dos de cada tres veces.

El formato solo amplía las probabilidades: 48 equipos, 104 partidos, tres países, calor real y altura real. Italia, cuatro veces campeona del mundo, ni siquiera clasificó.

Además de las alucinaciones habituales cuando los modelos quieren ser creativos en sus análisis, también puede haber algo de sesgo de confirmación. Recuerda que fue un humano quien configuró estos agentes. El prompt, la interacción, la configuración, las ideas de investigación y las fuentes, todo estuvo influenciado por el arquitecto del agente. Quizás, si todos estos elementos apuntan a España, todos los agentes llegarán a una conclusión similar. Dicho esto, dejar un modelo a su suerte y simplemente preguntarle “¿Quién ganará el Mundial?” no va a hacer un mejor trabajo.

Así que toma los siete agentes como yo tomo mi propio bracket: una excelente forma de empezar una discusión en el bar, no una razón para hipotecar la casa y apostarlo todo.

Cuatro agentes dicen España. Tres dicen Argentina. El hermoso juego, que nunca ha dependido de un informe escrito por IA, hará exactamente lo que le plazca.