Tecnología

El generador de imágenes de ChatGPT ahora es más potente (pero aún no es perfecto)

OpenAI lanzó un nuevo modelo de IA para la generación de imágenes, denominado ChatGPT Images 2.0. Este modelo puede generar más de una imagen a partir de una sola petición, como un cuaderno de estudio completo, así como texto de salida en distintos idiomas, que incluyen inglés, japonés, coreano, chino, hindi y español. Esta versión está disponible en todo el mundo para los usuarios de ChatGPT y Codex, con una versión más potente disponible para los suscriptores de pago.

Cuando una gigante de IA lanza un nuevo modelo de imagen, puede reavivar el interés e impulsar su uso, especialmente si los usuarios de redes sociales adoptan una tendencia que se presta a convertirse en meme, transformando imágenes de sí mismos. El año pasado, el lanzamiento del modelo Nano Banana de Google fue un momento clave para la empresa, sobre todo cuando los usuarios comenzaron a publicar figuras hiperrealistas de sí mismos en línea. A principios de este año, ChatGPT Images causó sensación en las redes sociales cuando los usuarios compartieron caricaturas generadas por IA.

Imagen generada por OpenAI.

OpenAI

¿Cuál es la diferencia?

Dado que el nuevo modelo puede aprovechar las capacidades de «razonamiento» de ChatGPT, Images 2.0 puede buscar información reciente online y generar más de una imagen a la vez. En esencia, el bot puede utilizar pasos adicionales para generar generaciones más completas a partir de una única consulta. Images 2.0 también tiene una fecha límite de conocimiento más reciente: diciembre de 2025.

Esto también significa que los resultados del nuevo modelo son más granulares. WIRED generó una infografía con la previsión meteorológica de San Francisco, así como actividades que vale la pena realizar. La imagen generada por ChatGPT incluye detalles meteorológicos precisos para el día lluvioso, junto con dibujos de aspecto preciso del Ferry Building, el Castro Theater, las Painted Ladies Houses y la Transamerica Pyramid.

Además, ChatGPT Images 2.0 es más personalizable para los usuarios que deseen relaciones de aspecto únicas para las salidas de imágenes. El nuevo modelo puede generar imágenes que van de 3:1 de ancho a 1:3 de alto, y los usuarios pueden ajustar el tamaño de la imagen como parte de su solicitud a la herramienta de IA.

Esta fotografía ilustrativa, tomada con un objetivo macro, muestra el logotipo de la empresa OpenAI reflejado en un ojo humano en un estudio de París el 6 de junio de 2023.

Los anuncios en el nivel gratuito de ChatGPT ya se están extendiendo por todo EE UU y pronto llegarán a Latinoamérica. Le hice 500 preguntas al bot de OpenAI para ver cómo eran estos anuncios y cómo se relacionaban con mis mensajes.

Cómo nos fue con Images 2.0

Pasé un par de horas generando imágenes, y el resultado me impresionó. Las capacidades de representación de texto son excelentes. Hasta hace poco, las imágenes con texto generadas con cualquiera de los principales modelos solían incluir numerosos caracteres malformados o palabras con letras extra. ChatGPT tenía problemas para etiquetar imágenes con precisión dos años antes, por lo que los resultados más limpios y complejos de Images 2.0 son un signo de mejora continua. Google también se ha centrado en mejorar los resultados de imágenes con texto en sus últimas versiones de Nano Banana.

Imagen realizada por Reece Rogers a partir de Images 2.0.

Imagen realizada por Reece Rogers a partir de ChatGPT Images 2.0.

Reece Rogers vía ChatGPT Images 2.0

DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://es.wired.com/articulos/el-generador-de-imagenes-de-chatgpt-ahora-es-mas-potente-pero-aun-no-es-perfecto

Publicaciones relacionadas

Botón volver arriba