Las tarjetas gráficas más potentes de Nvidia, la GeForce RTX 5090 y la RTX Pro 6000, enfrentan un error crítico que las deja completamente inutilizables en máquinas virtuales, obligando a reinicios forzados. Ante la falta de solución, la plataforma CloudRift ofrece una recompensa de $1,000 a quien logre identificar el problema o ayudar a solucionarlo.
El mundo del hardware de alto rendimiento no está exento de fallos graves que pueden afectar incluso a los equipos más costosos. Esto es exactamente lo que ha ocurrido en las últimas semanas, cuando las poderosas GPU de Nvidia, la GeForce RTX 5090 y la RTX Pro 6000, comenzaron a generar preocupación debido a un bug que las deja completamente inoperativas en entornos virtualizados
El problema ha sido documentado por desarrolladores y empresas que dependen de estos modelos para cargas de trabajo masivas, en especial en aplicaciones de inteligencia artificial. A pesar de que Nvidia ya reconoció el fallo, aún no ha lanzado un parche oficial que solucione la situación.
Más de GPU
El error que deja inservibles a las RTX 5090 y Pro 6000
La primera alerta provino de CloudRift, una plataforma de cómputo en la nube especializada en ofrecer GPU a desarrolladores de inteligencia artificial. Según sus reportes, después de algunos días de uso en máquinas virtuales, las tarjetas gráficas se vuelven completamente inoperativas y la única forma de recuperarlas es reiniciando todo el nodo.
El error aparece específicamente al usar el controlador VFIO durante un reinicio a nivel de función (Function Level Reset o FLR). En lugar de reactivarse, la GPU entra en un estado de “soft lock”, atrapando tanto al host como al cliente en un punto muerto que interrumpe todo el flujo de trabajo.
“En algunos de nuestros nodos con GPUs RTX 5090 y RTX Pro 6000, las tarjetas ocasionalmente se vuelven completamente inservibles, usualmente después de unos días de uso o en momentos aleatorios al iniciar o apagar el sistema. Una vez ocurre, la GPU no puede reasignarse. La única salida es reiniciar por completo el nodo”, explicó CloudRift.

Una preocupación que se extiende más allá de CloudRift
Aunque CloudRift fue el primero en documentar el error de manera pública, otros usuarios comenzaron a compartir experiencias similares. En los foros de Proxmox, un administrador de sistemas describió bloqueos idénticos al cerrar clientes de Windows, lo que despertó la atención de la comunidad técnica y de medios especializados como Wccftech.
Nvidia, al recibir los reportes, confirmó que ya logró reproducir el fallo en condiciones controladas. Sin embargo, la compañía aún no ha ofrecido una solución definitiva ni una fecha estimada para el lanzamiento de un parche que elimine la vulnerabilidad.

La recompensa de $1,000 y una oportunidad laboral inesperada
Para acelerar el proceso y encontrar alternativas mientras Nvidia trabaja en un fix oficial, CloudRift lanzó una iniciativa poco común: una recompensa de $1,000 para quien logre identificar el origen del bug o proponga una solución efectiva. La compañía aclaró que incluso aquellos que solo aporten pasos de reproducción o información relevante podrán recibir un pago.
Además, CloudRift señaló que esta colaboración podría convertirse en una oportunidad profesional. La empresa anunció que está en búsqueda de un ingeniero de sistemas y está dispuesta a entrevistar a cualquier persona que contribuya significativamente en la resolución del problema.
Mientras tanto, el error aún no tiene una solución definitiva y sigue minando la confianza de las empresas que invierten en las GPU más caras del mercado.
Usuario de RTX 5090 revela cómo su GPU de $2.000 dólares literalmente explotó, doblando incluso el disipador→ Compra una RTX 5090 “nueva” en Amazon y al llegar descubre que la tarjeta gráfica no tiene GPU: “Es como un auto sin motor”→
