$IAs avanzadas como Grok, Gemini y Claude fracasan al apostar en fútbol, perdiendo dinero al no saber lidiar con el caos del mundo real$

IAs avanzadas como Grok, Gemini y Claude fracasan al apostar en fútbol, perdiendo dinero al no saber lidiar con el caos del mundo real

Por Víctor Méndez el 13/04/2026

Aunque sean plataformas que tienen muchos detractores y las casas de apuestas han ganado popularidad y validación mundial, siendo parte de, por ejemplo, ligas profesionales de deportes masivos como el fútbol. Y dentro de aquello, mientras las grandes empresas tecnológicas nos presentan a la inteligencia artificial como una herramienta casi omnipotente capaz de resolver cualquier problema complejo, un estudio reciente ha demostrado que, cuando se trata de predecir resultados de este deporte, incluso los modelos más avanzados se quedan cortos frente a su imprevisibilidad. Esta investigación, llevada a cabo por la empresa emergente General Reasoning bajo el nombre de “KellyBench”, revela que hay una distancia enorme entre escribir un código de programación y enfrentarse a situaciones del mundo real que cambian constantemente, dejando claro que la tecnología todavía tiene mucho que aprender.

Y es que luego de darles a las diferentes IA datos históricos y un presupuesto de 100.000 libras para gestionar apuestas y riesgos en partidos de la Premier League, todo resultó en un fracaso generalizado donde casi todos perdieron dinero o terminaron en la quiebra absoluta, lo que sugiere que los exámenes actuales a los que se somete a la inteligencia artificial son demasiado simples y no reflejan la verdadera complejidad de la vida cotidiana ni la capacidad de adaptación necesaria para tener éxito en tareas que no son puramente matemáticas o lógicas.

Más noticias de PC

Un experimento que desnudó las debilidades de los gigantes tecnológicos

Para entender qué tan listas son realmente estas máquinas, los investigadores de Londres crearon un entorno virtual que replicaba exactamente lo sucedido en la última temporada de la liga inglesa, proporcionando a los algoritmos estadísticas detalladas sobre cada equipo y jugador pero sin permitirles conectarse a internet para conocer los resultados de antemano, indica un reporte del medio Ars Technica donde compartieron los resultados. A cada una de estas “mentes digitales” se le asignó la tarea de actuar como un apostador profesional que debía maximizar sus ganancias y cuidar su capital a lo largo del tiempo, enfrentándose al reto de ajustar sus estrategias a medida que avanzaban las jornadas y aparecían lesiones o cambios de rendimiento en los deportistas.

Lo que se buscaba no era solo ver si podían adivinar un marcador, sino observar cómo gestionaban el riesgo financiero en un entorno de alta presión donde las variables cambian cada semana, lo cual es muy distinto a las pruebas típicas de laboratorio donde las respuestas suelen ser blancas o negras. Y como adelantamos, los resultados individuales dejaron muy mal parados a algunos de los nombres más famosos de Silicon Valley, empezando por Grok, la apuesta de Elon Musk, que no solo falló en sus predicciones sino que terminó en la bancarrota total en uno de sus intentos y ni siquiera pudo completar las otras pruebas asignadas. Por su parte, el modelo Gemini de Google mostró una inconsistencia preocupante, ya que aunque en una ocasión logró generar un beneficio del 34%, en otra de sus oportunidades perdió absolutamente todo el dinero.

El único que logró mantener cierta compostura fue Claude, desarrollado por la empresa Anthropic, que aunque también perdió dinero de forma generalizada con una caída promedio del 11%, estuvo muy cerca de no tener pérdidas en uno de sus intentos, posicionándose como el menos ineficiente dentro de un grupo que, en palabras de los autores del estudio, rindió sistemáticamente peor que cualquier ser humano con conocimientos básicos de apuestas.

El caos del mundo real frente a la comodidad de los laboratorios

Este tropezón de la inteligencia artificial ofrece un respiro a muchos profesionales que temen ser reemplazados pronto, apunta Ars Technica, ya que confirma que todavía existe una brecha enorme entre procesar datos y comprender la complejidad del comportamiento humano y el azar. Ross Taylor, jefe de la empresa que realizó el estudio y exinvestigador de Meta, explica que gran parte del entusiasmo actual se basa en tareas de programación que son importantes pero que ocurren en entornos muy controlados y estáticos.

Y es que para cerrar, según su visión, cuando sacas a la IA de esos escenarios y la lanzas a resolver problemas que requieren una mirada a largo plazo y una adaptación constante al caos, el rendimiento cae en picado, lo que demuestra que los exámenes que se usan hoy para decir que la IA es “inteligente” están incompletos y no nos dicen la verdad sobre cómo funcionarán estas herramientas en nuestra vida diaria o en el mercado financiero real.

Fuente

Anthropic frenó el lanzamiento de su nueva IA tras descubrir que se salió de control durante las pruebas: logró conectarse a internet por su cuenta→ OpenAI pausa indefinidamente su centro de datos de IA Stargate en Reino Unido por altos costos de energía y dudas legales sobre derechos de autor→

IAs avanzadas como Grok, Gemini y Claude fracasan al apostar en fútbol, perdiendo dinero al no saber lidiar con el caos del mundo real

Un experimento que desnudó las debilidades de los gigantes tecnológicos

El caos del mundo real frente a la comodidad de los laboratorios

Imperdibles de la semana

Empleados de Epic confirman que los usuarios entran a la Epic Games Store solo por los juegos gratis y después se vuelven a Steam: la tienda lleva 8 años sin despegar

Desarrollador indie que vive en un pueblo de 1.000 personas descubre que 250.000 jugadores de Steam compraron su roguelike: “No me cabe en la cabeza”

Precio de la memoria DDR4 baja un 5% por primera vez en casi un año: los acaparadores sueltan stock, pero los acuerdos entre fabricantes siguen subiendo

Valve trabaja en mejorar el rendimiento de juegos en GPUs con poca VRAM para dar un respiro a los jugadores con tarjetas gráficas antiguas o de gama baja

Contenido recomendado

Pequeño desarrollador indie muestra el impacto real de la nueva función de Steam de precios regionales: sus ventas crecieron en países donde no vendía

Graveyard Keeper, el simulador de cementerio medieval con 93% de reseñas positivas, está gratis en Steam, PlayStation y Xbox por tiempo limitado

La versión pirata de Resident Evil Requiem corre mejor, más fluida y usa mucha menos RAM y VRAM que la original tras romper la protección Denuvo por primera vez