Qué hay detrás de DeepSeek, el modelo de IA chino que hace temblar los mercados

El 20 de enero, DeepSeek, un laboratorio chino de investigación en IA relativamente desconocido, publicó un modelo de código abierto que ha dado mucho que hablar en Silicon Valley. De hecho, es tanto el ruido que ha generado que hasta Nvidia experimentó una caída en la bolsa de más del 10%, producto de la irrupción del nuevo modelo.
Según un documento elaborado por la empresa, DeepSeek-R1 supera a los principales modelos del sector, como OpenAI o1, en varias pruebas matemáticas y de razonamiento. De hecho, en muchos de los parámetros importantes (capacidad, costo, apertura), DeepSeek se está imponiendo a las gigantes occidentales de la IA.
El éxito de DeepSeek apunta a un resultado imprevisto de la guerra fría tecnológica entre Estados Unidos y China. Los controles de exportación estadounidenses han restringido drásticamente la capacidad de las empresas tecnológicas chinas para competir en IA al estilo occidental, es decir, aumentando infinitamente su capacidad mediante la compra de más chips y la formación durante más tiempo. Como resultado, la mayoría de las empresas chinas se han centrado en aplicaciones derivadas en lugar de construir sus propios modelos. Pero con su último lanzamiento, DeepSeek demuestra que hay otra forma de ganar: renovando la estructura fundacional de los modelos de IA y utilizando los limitados recursos de forma más eficiente.
«A diferencia de muchas empresas chinas de IA que dependen en gran medida del acceso a hardware avanzado, DeepSeek se ha centrado en maximizar la optimización de recursos basada en software«, explica Marina Zhang, profesora asociada de la Universidad Tecnológica de Sídney, que estudia las innovaciones chinas. «DeepSeek ha adoptado métodos de código abierto, poniendo en común la experiencia colectiva y fomentando la innovación colaborativa. Este enfoque no solamente mitiga las limitaciones de recursos, sino que también acelera el desarrollo de tecnologías de vanguardia, diferenciando a DeepSeek de competidores más aislados.»
¿Quién está detrás de esta empresa de IA? ¿Y por qué de repente lanzan un modelo líder en la industria y lo regalan? WIRED ha hablado con expertos de la industria china de la inteligencia artificial y ha leído entrevistas detalladas con el fundador de DeepSeek, Liang Wenfeng, para reconstruir la historia del meteórico ascenso de la empresa. DeepSeek no respondió a varias preguntas enviadas por WIRED.
Un fondo de cobertura estrella en China
Incluso dentro del sector chino de la inteligencia artificial, DeepSeek es una empresa poco convencional. Comenzó como Fire-Flyer, una rama de investigación de aprendizaje profundo de High-Flyer, uno de los fondos de cobertura cuantitativos con mejores resultados de China. Fundado en 2015, el fondo de cobertura saltó rápidamente a la fama en China, convirtiéndose en el primer fondo de cobertura cuantitativo en recaudar más de 100 mil millones de RMB (alrededor de 15 mil millones de dólares). (Desde 2021, la cifra se ha reducido a alrededor de 8,000 millones de dólares, aunque High-Flyer sigue siendo uno de los fondos de cobertura quant más importantes del país).
Durante años, High-Flyer había estado almacenando GPU y construyendo supercomputadoras Fire-Flyer para analizar datos financieros. Entonces, en 2023, Liang, que tiene un máster en informática, decidió invertir los recursos del fondo en una nueva empresa llamada DeepSeek que construiría sus propios modelos de vanguardia y, con suerte, desarrollaría inteligencia general artificial. Era como si Jane Street hubiera decidido convertirse en una empresa de inteligencia artificial y gastar su dinero en investigación científica.
Una visión audaz. Pero, de algún modo, funcionó. «DeepSeek representa una nueva generación de empresas tecnológicas chinas que dan prioridad a los avances tecnológicos a largo plazo frente a la comercialización rápida», afirma Zhang.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://es.wired.com/articulos/que-hay-detras-de-deepseek-el-modelo-de-ia-chino-que-hace-temblar-los-mercados