“Casi quemo mi casa 2 veces”: PewDiePie entrena su propia IA y supera a ChatGPT en un benchmark

Uno de los youtubers más grandes y populares del mundo puso a prueba su sistema de inteligencia artificial

Por Ulises Contreras el 01/03/2026

Felix Kjellberg, mejor conocido en Internet como PewDiePie, se propuso a entrenar de forma independiente un modelo de codificación de inteligencia artificial, incluso sin tener experiencia en programación e ingeniería. El youtuber utilizó el sistema de código abierto Qwen 2.5 32B, y en el benchmark de Aider Polyglot superó a ChatGPT de OpenAI.

La inteligencia artificial se coloca en el pináculo de la evolución tecnológica, o al menos eso es lo que nos hacen creer las grandes corporaciones que invierten millones de dólares en sus infraestructuras. A pesar de tener toda en su contra, un popular youtuber quiso comprobar si es capaz de superar a las mayores empresas de IA del mundo.

Nos referimos a Felix Kjellberg, mejor conocido en redes sociales como PewDiePie. Después de convertirse en el youtuber con más suscriptores del mundo, se mudó a Japón junto a su familia y se alejó del Internet para perseguir otras metas. Además de dominar el arte del dibujo, mostró interés en temas técnicos como Linux y la IA.

Más de Inteligencia artificial

PewDiePie se propone a entrenar su modelo de IA

El influencer de Suecia no fundó alguna starup de inteligencia artificial ni desea crear una carrera en ese ámbito, pero quiso descubrir si es capaz de entrenar su propio modelo de programación para superar a ChatGPT en una benchmark reconocido. A pesar de no tener conocimiento en programación ni aprendizaje automático, su experimento arrojó resultados sólidos.

PewDiePie señala que diseñar su propio modelo de IA desde 0 requeriría una inversión de “millones y millones de dólares en infraestructura”, así que decidió utilizar un sistema de código abierto llamado Qwen 2.5 32B, que se especializa en el código.

El objetivo del youtuber era entrenar su modelo para superar el desempeño de la aplicación de OpenAI en Aider Polyglot, una reconocida prueba de rendimiento avanzada que está diseñada específicamente para evaluar qué tan bien funcionan los grandes LLMs para escribir y editar código en 6 lenguajes de programación distintos.

En su video de YouTube, Felix Kjellberg señaló que cuenta con un setup casero compuesto por una serie de tarjetas gráficas RTX 4090 modificadas, construida por él mismo para alcanzar un voltaje reducido de 175 vatios en lugar de los 450 vatios habituales para evitar apagones de energía.

Para entrenar un modelo de IA se requieren cantidades colosales de datos, así que, para tal propósito, PewDiePie usó The Stack, un conjunto de datos de 60 terabytes publicado para entrenamiento. También recogió conjuntos de datos públicos, realizó minería en la plataforma GitHub y empleó tácticas de generación de datos sintéticos.

Un experimento que dio resultados muy impresionantes

Para la generación sintética de datos, el youtuber utilizó la API DeepSeek, que describe como “prácticamente gratuita”. Este sistema desempeñó un papel fundamental en este proyecto gracias a su código abierto. La empresa china también describe su metodóloga a través de documentos de investigación, lo que fue de gran ayuda.

Este ejercicio estuvo lejos de ser un paseo por el parque, pues PewDiePie enfrentó toda clase de problemas durante el desarrollo. El youtuber explica que su modelo empeoró por culpa de datos defectuosos, además de que por mucho tiempo entrenó la versión general de Qwen en lugar del modelo específico para programación.

Quizás lo más curioso es que, durante las pruebas, experimentó problemas de hardware. En su video, el youtuber explica que una GPU falló y empezó a sobrecalentarse, además de que un cable mostró signos de quemadura porque no estaba preparado para soportar más de 2000 vatios. “Casi incendio mi casa 2 veces”, bromeó”.

A pesar de estos contratiempos, el experimentó arrojó resultados interesantes. Tras meses de trabajo y entrenamiento, el modelo casero de Felix Kjellberg alcanzó un desempeño de 25% en la prueba inicial, una cifra que subió a 36.4% tras corregir un error del benchmark que impedía que C++ y JavaScript se evaluaran correctamente.

Después de realizar un proceso de entrenamiento adicional, PewDiePie logró que su modelo de IA basado en Qwen 2.5 32B consiga 39.1% en la prueba de Aider Polyglot. Contra todo pronóstico logró superar ampliamente a ChatGPT, que alcanza un desempeño de 18.2%. También estuvo por encima de los sistemas de Meta y DeepSeek.

Aunque estos resultados son impresionantes por sí solos, el youtuber deja claro que la versión Qwen 3 ya alcanza 40% sin la necesidad de realizar ajustes personalizados, además de que Aider Polyglot es solo un benchmark; sistemas como SWE-bench no se utilizaron para este análisis. A pesar de estos matices, el experimento fue un éxito.

Fuente

Pusieron a ChatGPT, Claude y Gemini a jugar simulaciones de guerra y eligieron usar armas nucleares en el 95% de los casos→ Las tecnológicas gastarán $700 mil millones en IA en 2026, pero Goldman Sachs dice que el impacto en la economía de EE.UU. es “básicamente cero”→

“Casi quemo mi casa 2 veces”: PewDiePie entrena su propia IA y supera a ChatGPT en un benchmark

PewDiePie se propone a entrenar su modelo de IA

Un experimento que dio resultados muy impresionantes

Imperdibles de la semana

Software gratuito desactiva los programas innecesarios de Windows 11 y optimiza el PC, reduciendo el uso de la RAM y mucho más

Creador de OpenClaw predice que el 80% de las aplicaciones actuales desaparecerán en el futuro: “Solo sobrevivirán las aplicaciones con sensores únicos o conexiones especiales a hardware

Estudio de Microsoft revela que los chatbots de IA se vuelven menos confiables mientras más tiempo hablas con ellos: la falta de confiabilidad sube un 112%

Actualización de Windows 11 corrige error que provocaba problemas al jugar en PC: los pantallazos azules se producían desde 2023

Contenido recomendado

Software gratuito desactiva los programas innecesarios de Windows 11 y optimiza el PC, reduciendo el uso de la RAM y mucho más

Creador de OpenClaw predice que el 80% de las aplicaciones actuales desaparecerán en el futuro: “Solo sobrevivirán las aplicaciones con sensores únicos o conexiones especiales a hardware

Estudio de Microsoft revela que los chatbots de IA se vuelven menos confiables mientras más tiempo hablas con ellos: la falta de confiabilidad sube un 112%