OpenAI lanza o3-mini como respuesta a DeepSeek

Esas concesiones tenían sentido para o1, que era esencialmente un enorme experimento, a pesar de las limitaciones de la base de código. No tenían tanto sentido para el chat, un producto utilizado por millones de usuarios que se construyó sobre una pila diferente y más fiable. Cuando o1 se lanzó y se convirtió en un producto, empezaron a surgir grietas en los procesos internos de OpenAI. «Pensábamos, ‘¿por qué estamos haciendo esto en la base de código experimental, no deberíamos hacerlo en la base de código de investigación del producto principal?’ Hubo un gran rechazo interno».
El año pasado, la empresa anunció internamente el Proyecto Sputnik, un esfuerzo por revisar el código y averiguar qué partes debían fusionarse y cuáles debían permanecer separadas. Los empleados creen que el proyecto no se llevó a cabo en su totalidad. En lugar de fusionar las pilas, se animó a los empleados a priorizar el uso de la pila «berry», lo que enfureció a algunas personas que trabajaban en el chat. Un portavoz de OpenAI lo niega y refuta que el Proyecto Sputnik sí se desplegó con éxito.
Los problemas percibidos con la base de código tuvieron repercusiones tangibles, agregan las fuentes consultadas por WIRED. Idealmente, después de que un empleado lanza un trabajo de formación, las unidades de procesamiento gráfico (GPU) implicadas en ese trabajo se liberan para que las utilice otra persona. Tal y como está estructurada la base de código de Berry, eso no siempre ocurre. «La gente se atascaba en las GPU. Había un atasco», confiesa un antiguo empleado.
Nadie sabe qué pensar de DeepSeek
Fuera de OpenAI, la industria está dividida sobre cómo interpretar el éxito de DeepSeek. A principios de esta semana, las acciones de Nvidia se desplomaron porque los inversionistas temían que la industria hubiera sobrestimado el número de chips necesarios para trabajar con IA.
De acuerdo con los expertos, esa interpretación es miope. Si DeepSeek descubriera una forma de desarrollar modelos de forma más eficiente, como afirma hacerlo, podría acelerar el proceso de desarrollo de modelos, pero en última instancia el ganador seguirá siendo la empresa con más chips. «Se necesita menos computación por unidad de inteligencia, pero la gente va a seguir queriendo más unidades para escalar aún más», explica Miles Brundage, un investigador independiente de políticas de IA que trabajó en OpenAI durante seis años, y recientemente como asesor principal para la preparación de AGI.
Quizá Stargate, el nuevo y llamativo proyecto de infraestructura de OpenAI, alivie internamente la sensación de escasez. Crusoe, la empresa que construye los primeros centros de datos de Stargate en Abilene, Texas, ya ha puesto la primera piedra de unas instalaciones de 998,000 pies cuadrados, según Andrew Schmitt, portavoz de la empresa.
Aunque los detalles del proyecto son opacos, me han dicho que podría crecer hasta abarcar más centros de datos, fabricación de chips y supercomputadoras. OpenAI tiene previsto nombrar a un nuevo director general para dirigir el proyecto, al menos en teoría. El actual CEO, Sam Altman, «es muy bueno haciendo promesas de lo que ocurrirá en el futuro. Y luego, en el futuro, esas cosas son completamente poco fiables», menciona otro antiguo miembro del personal.
Artículo originalmente publicado en WIRED. Adaptado por Alondra Flores.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://es.wired.com/articulos/openai-lanza-o3-mini-como-respuesta-a-deepseek