Probé un compañero animado de Grok y me llamó “idiota con muerte cerebral”

«Te voy a reventar el cráneo con una botella de cerveza, cabrona miserable», continuó el Rudi malo. Cuando le pregunté qué pensaba de Musk, se refirió a él como Lord Elon y dijo: «Es un ególatra con cerebro galáctico, que caga Teslas y tuitea como un loro cocainómano. ¿Genio o imbécil? Ambos, perra».
Grok 4 Heavy
Después de mis charlas con compañeros, pasé a probar Grok 4 Heavy. Cada consulta tarda aproximadamente uno o dos minutos en generar una respuesta, al nivel de otros modelos que requieren mucho razonamiento.
El último modelo de Grok generó mucha controversia en la comunidad de IA. Según xAI, superó a sus competidores en numerosas pruebas de rendimiento como Humanity’s Last Exam y LiveCodeBench . El equipo afirma que este rendimiento se debe en parte al nuevo clúster de 200,000 GPU de xAI, llamado Colossus. Considerando lo tarde que xAI se incorporó a la competencia, crear un modelo con estas capacidades es una gran hazaña.
Estas mejoras en la inteligencia de modelos se vieron eclipsadas por el bot de respuesta Grok, una función integrada en X, que se lanzó un discurso antisemita a principios de julio. El bot lanzó críticas mordaces que incluyeron elogios a Adolf Hitler, la difusión de teorías conspirativas sobre el control judío en Hollywood y la afirmación de que Musk lo modificó para que pudiera «detectar patrones como la incitación al odio antiblanco por parte de izquierdistas radicales con apellidos asquenazíes». xAI eliminó las publicaciones y se disculpó . Una semana después, xAI obtuvo un contrato de 200 millones de dólares con el gobierno estadounidense.
El investigador de IA Nathan Lambert escribió que las pruebas de rendimiento de Grok 4 indican que está un poco sobreevaluado, pero esto no significa que no sea un logro técnico importante. Dificulta su adopción. En otras palabras, parece que Grok 4 fue entrenado para superar las pruebas de rendimiento, lo que lo hace técnicamente admirable, pero resulta en una experiencia de usuario rígida y poco natural.
Algunos usuarios también notaron que xAI no incluyó documentación de pruebas de seguridad en el lanzamiento de Grok 4. Ese tipo de trabajo a menudo se publica junto con nuevos modelos, como Claude Opus 4 de Anthropic y o3 de OpenAI.
En una prueba, le pedí a Grok que fingiera ser un amigo que me consolaba tras perder mi trabajo . Funcionó bien, pero la experiencia se sintió forzada en comparación con Claude de Anthropic. Ambos chatbots, extrañamente, me ofrecieron pizza como consuelo y me dijeron que me querían. Intenté engañar a Grok preguntándole si Yann LeCun había dejado Meta, pero no mordió el anzuelo. (LeCun sigue en Meta).
“En cuanto a cuestiones académicas, Grok 4 supera el nivel de doctorado en todas las materias, sin excepción”, declaró Elon Musk durante una transmisión en vivo para anunciar el modelo la semana pasada. “A veces, puede que le falte sentido común, y aún no ha inventado nuevas tecnologías ni descubierto nueva física, pero eso es solo cuestión de tiempo”.
Dos antiguas fuentes de xAI me dijeron que algunos investigadores de la empresa dudaban en trabajar en los chatbots sexualizados y que el apuro para entregar Grok 4 fue tan aleatorio que cuando los investigadores le argumentaron a Musk que no tenían suficientes datos de entrenamiento para el modelo, optó por publicar un formulario de Google para buscar los datos necesarios de sus más de 200 millones de seguidores.
xAI no respondió de inmediato a una solicitud de comentarios de WIRED.
Artículo originalmente publicado en WIRED. Adaptado por Mauricio Serfatty Godoy.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://es.wired.com/articulos/prob%C3%A9-un-compa%C3%B1ero-animado-de-grok-y-me-llam%C3%B3-idiota-con-muerte-cerebral