Google estaría preparando el Nano Banana de la música para integrarlo en Gemini

Gemini podría sumar próximamente la capacidad de crear piezas musicales a partir de indicaciones de texto. Un nuevo reporte sugiere que Google planea integrar a su chatbot una función con características similares a Nano Banana, su generador de imágenes basado en inteligencia artificial (IA), pero orientada a la producción de distintos tipos de contenidos de audio.
A mediados del año pasado, Google presentó Nano Banana como una herramienta que permite a personas sin conocimientos de diseño o edición generar o modificar imágenes mediante instrucciones escritas en lenguaje natural. Meses después, la compañía lanzó la versión Pro del sistema, que incorpora capacidades de razonamiento avanzado y la posibilidad de extraer información de la web en tiempo real, lo que permite trabajar con datos actualizados durante los procesos de edición y creación visual. De acuerdo con Google, estas funciones la convierten en una opción idónea para “visualizar cualquier idea y diseñar todo tipo de proyectos, desde prototipos hasta la representación de datos como infografías, así como transformar notas manuscritas en diagramas”.
Tras analizar los cambios en el APK de la versión 17.2.51.sa.arm64 de la aplicación de Gemini para Android, el portal especializado Android Authority identificó fragmentos de código que apuntan a que Google podría trasladar las capacidades de Nano Banana a una herramienta enfocada en la edición y generación de audio.
De manera puntual, el informe destaca la aparición de la referencia “MUSIC_GENERATION_AS_TOOL” dentro de la lista de funciones programadas para Gemini. El reporte también señala que, en el apartado My Stuff —que permite clasificar los contenidos generados por el chatbot según su formato—, se añadió una nueva categoría dedicada específicamente a materiales musicales.
Actualmente, los usuarios pueden crear contenidos de audio de forma indirecta a través de Gemini mediante Veo, el modelo de IA de la compañía capaz de generar video a partir de instrucciones de texto. A través del asistente inteligente, los desarrolladores también tienen acceso a Lyra, un algoritmo diseñado para facilitar la creación de aplicaciones de edición y generación sonora. Sin embargo, la app de Gemini no cuenta hasta ahora con una función nativa y específica orientada a la composición musical.
Aunque no se dispone de información oficial sobre los detalles técnicos de esta posible herramienta, el reporte indica que es probable que su uso esté sujeto a ciertas limitaciones, posiblemente vinculadas al nivel de suscripción de los usuarios.
La incorporación de una función nativa para generar música en Gemini podría otorgarle a Google una ventaja competitiva relevante dentro del mercado. Si bien ChatGPT es capaz de diseñar conceptos sonoros y componer música a nivel creativo, el chatbot de OpenAI aún no ofrece la posibilidad de generar archivos de audio reproducibles o descargables de manera directa.
Por otro lado, Adobe presentó recientemente Generate Soundtrack, una función que permite crear bandas sonoras originales con calidad de estudio adaptadas a los videos en los que se integran. No obstante, esta herramienta todavía se encuentra en fase beta.
Aunque Google podría adelantarse a varios de sus competidores en este segmento y entrar en competencia directa con plataformas como Suno, Udio y AIVA, el lanzamiento de una función nativa de producción musical en Gemini también podría reavivar las preocupaciones en torno a los derechos de autor y las críticas sobre el papel que la IA está desempeñando dentro de la industria musical.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://es.wired.com/articulos/google-estaria-preparando-el-nano-banana-de-la-musica-para-gemini




