Google Gemini 2.5: la IA de imágenes recibe una actualización revolucionaria

Zeff, Maxwell. “Google Gemini’s AI Image Model Gets a ‘Bananas’ Upgrade.” TechCrunch, 26 de agosto de 2025. https://techcrunch.com/2025/08/26/google-geminis-ai-image-model-gets-a-bananas-upgrade/

Gemini 2.5 Flash Image, proporciona a los usuarios un control más preciso sobre la edición de fotos mediante solicitudes en lenguaje natural, superando limitaciones comunes en herramientas rivales

La principal ventaja de esta mejora es su capacidad para realizar ediciones más precisas en imágenes, manteniendo la coherencia de rostros, animales y otros detalles, algo que otras herramientas suelen dificultar. Por ejemplo, al solicitar el cambio de color de una camisa en una foto, Gemini 2.5 Flash Image puede realizar la modificación sin distorsionar el rostro o el fondo.

Esta herramienta ya ha generado interés en plataformas como LMArena, donde usuarios la evaluaron bajo el seudónimo «nano-banana». Google ha confirmado que esta es la capacidad nativa de imágenes dentro de su modelo insignia Gemini 2.5 Flash. La compañía afirma que el modelo es de vanguardia en varios puntos de referencia.

La actualización está disponible desde el 26 de agosto para todos los usuarios de la aplicación Gemini, así como para desarrolladores a través de la API de Gemini, Google AI Studio y las plataformas Vertex AI. Nicole Brichtova, líder de producto en modelos de generación visual de Google DeepMind, destacó que esta actualización mejora la calidad visual y la capacidad del modelo para seguir instrucciones, permitiendo ediciones más fluidas y resultados utilizables para diversos fines.

Con esta mejora, Google busca competir con herramientas populares de generación de imágenes, como las de OpenAI, y atraer a usuarios de ChatGPT, que actualmente cuenta con más de 700 millones de usuarios semanales. En comparación, Gemini tenía 450 millones de usuarios mensuales, lo que sugiere una menor tasa de usuarios semanales.