Archivo de la etiqueta: Imagenes

Google Gemini 2.5: la IA de imágenes recibe una actualización revolucionaria

Zeff, Maxwell. “Google Gemini’s AI Image Model Gets a ‘Bananas’ Upgrade.” TechCrunch, 26 de agosto de 2025. https://techcrunch.com/2025/08/26/google-geminis-ai-image-model-gets-a-bananas-upgrade/

Gemini 2.5 Flash Image, proporciona a los usuarios un control más preciso sobre la edición de fotos mediante solicitudes en lenguaje natural, superando limitaciones comunes en herramientas rivales

La principal ventaja de esta mejora es su capacidad para realizar ediciones más precisas en imágenes, manteniendo la coherencia de rostros, animales y otros detalles, algo que otras herramientas suelen dificultar. Por ejemplo, al solicitar el cambio de color de una camisa en una foto, Gemini 2.5 Flash Image puede realizar la modificación sin distorsionar el rostro o el fondo.

Esta herramienta ya ha generado interés en plataformas como LMArena, donde usuarios la evaluaron bajo el seudónimo «nano-banana». Google ha confirmado que esta es la capacidad nativa de imágenes dentro de su modelo insignia Gemini 2.5 Flash. La compañía afirma que el modelo es de vanguardia en varios puntos de referencia.

La actualización está disponible desde el 26 de agosto para todos los usuarios de la aplicación Gemini, así como para desarrolladores a través de la API de Gemini, Google AI Studio y las plataformas Vertex AI. Nicole Brichtova, líder de producto en modelos de generación visual de Google DeepMind, destacó que esta actualización mejora la calidad visual y la capacidad del modelo para seguir instrucciones, permitiendo ediciones más fluidas y resultados utilizables para diversos fines.

Con esta mejora, Google busca competir con herramientas populares de generación de imágenes, como las de OpenAI, y atraer a usuarios de ChatGPT, que actualmente cuenta con más de 700 millones de usuarios semanales. En comparación, Gemini tenía 450 millones de usuarios mensuales, lo que sugiere una menor tasa de usuarios semanales.

La revolución de la generación de imágenes con IA: tecnología que transforma la creación visual

Karr, Douglas. “The Revolution of AI Image Generation: Understanding the Technology Reshaping Visual Creation.” MarTech Zone, December 3, 2024. https://martech.zone/ai-image-generation-explanation-prompts-examples/

En los últimos años, la creación visual ha sido revolucionada por la inteligencia artificial (IA), que se ha consolidado como una herramienta poderosa para artistas. Lo que comenzó como proyectos experimentales ahora permite a plataformas avanzadas generar imágenes de alta calidad a partir de simples descripciones textuales. Esta democratización ha abierto nuevas posibilidades para la creatividad visual.

Esta tecnología combina ciencia computacional, arte y creatividad humana. Se basa principalmente en modelos de difusión, redes neuronales avanzadas entrenadas con millones de imágenes. Durante el entrenamiento, los modelos aprenden a descomponer imágenes claras en ruido aleatorio, entendiendo así las relaciones entre el ruido y los elementos visuales. Luego, generan nuevas imágenes al revés: partiendo del ruido, refinan los detalles hasta formar imágenes coherentes, guiados por descripciones textuales.

Principales plataformas de generación de imágenes con IA:

Midjourney: Destacada por su estética artística e imaginativa.
DALL-E: De OpenAI, ofrece versatilidad y capacidad para interpretar solicitudes complejas, ideal para usos comerciales.
Stable Diffusion: Plataforma de código abierto que permite personalización y uso local, favorita entre usuarios técnicos.

El arte de crear prompts

El éxito en la generación de imágenes radica en diseñar prompts efectivos. A diferencia del texto, los prompts visuales requieren precisión y detalle. Los ajustes en el lenguaje pueden producir resultados radicalmente diferentes, ya que cada generación es un proceso nuevo. Conceptos como la composición, la iluminación, el estilo artístico y las especificaciones técnicas son claves para obtener imágenes consistentes y de calidad.

Ejemplo de prompt y evolución paso a paso sería describir una «claro del bosque mágico de noche» e ir añadiendo detalles como iluminación, perspectiva, texturas, paleta de colores y estilo artístico. Esto permite al sistema interpretar mejor la intención del creador.

Futuro y consideraciones éticas

La generación de imágenes con IA plantea desafíos éticos, como el impacto en artistas humanos, derechos de autor y atribución artística. A medida que la tecnología avanza, es crucial establecer marcos responsables para su uso. En el futuro, se espera un control más fino de las imágenes, una comprensión mejorada de las escenas complejas y más herramientas para integrar esta tecnología en procesos creativos.

La generación de imágenes con IA no busca reemplazar la creatividad humana, sino ampliarla. Su evolución seguirá transformando cómo creamos, experimentamos y entendemos el arte visual.

Las mejores generadores de imágenes de IA gratuitos en 2024

Cawley, Conor. «Best Free AI Image Generators (with Screenshots)». Tech.Co (blog), 14 de mayo de 2024. https://tech.co/news/best-free-ai-image-generators.

El mejor generador de imágenes de IA adecuado es aquel que puede crear la imagen que necesitas en el momento, ya sea fotorealista o arte abstracto completo. Desafortunadamente, el chatbot de IA favorito de todos, ChatGPT, no te permite crear imágenes de forma gratuita. Sin embargo, hay muchos otros generadores de imágenes de IA gratuitos disponibles, tanto de firmas tecnológicas reputadas como de sitios web aleatorios, para que puedas encontrar una plataforma que te proporcione toda la funcionalidad que necesitas para obtener la toma correcta.

ImageFX de Google https://aitestkitchen.withgoogle.com/tools/image-fx

Si tienes una cuenta de Gmail, puedes acceder a ImageFX de Google con unos pocos clics. Sólo tienes que iniciar sesión, aceptar algunos términos y condiciones, y tendrás acceso a un potente generador de imágenes de IA de Google. Las imágenes son impresionantes, y el generador se ciñe a las indicaciones de la IA, al menos en la mayoría de las imágenes generadas.

Y lo que es mejor, dispones de algunas herramientas adicionales para mejorar tus imágenes. ImageFX de Google te sugiere adjetivos para mejorar la imagen y te ofrece otras sugerencias de sustantivos en función de tu sugerencia inicial. Incluso está el clásico botón «Me siento con suerte» de la Búsqueda de Google, que generará una sugerencia aleatoria seguida de la imagen generada que la acompaña.

Creador de imágenes de Microsoft Designer https://copilot.microsoft.com/images/create

Dado el dominio de Microsoft en el mercado de la IA en los últimos años gracias a su asociación con OpenAI, la compañía tiene obviamente su propio generador de imágenes de IA gratuito, y funciona de forma similar a la plataforma de Google. Sólo necesitas una cuenta de Microsoft para empezar, y podrás utilizar esta plataforma de forma gratuita.

Vale la pena señalar que esta plataforma puede ser un poco lenta, y si superas tus 15 «Boosts» por semana, puede ser aún más lenta. Aun así, te ofrece algunas funciones interesantes, como una barra lateral de Recientes que lleva la cuenta de todo lo que has creado, así como una pestaña de Explorar ideas que puede mostrarte otras creaciones de los usuarios.

Adobe Firefly https://www.adobe.com/es/products/firefly.html

Adobe Firefly es una herramienta excelente para los creadores que desean un control más detallado de lo que la IA crea para ellos. Podrás realizar ediciones más tangibles en las imágenes, como la relación de aspecto, la intensidad visual, el color, el tono, la iluminación e incluso el ángulo de la cámara. También puedes añadir imágenes a referencias y añadir palabras y gráficos sobre el contenido generado, para cosas como carteles y otros materiales de marketing.

Lo más importante, sin embargo, es que cuando descargas una imagen desde Firefly, se reitera la importancia de la transparencia en la IA, adjuntando metadatos y otros indicadores en la imagen de que ha sido generada por IA. Además, nos ha parecido uno de los mejores generadores de imágenes de IA en términos de realismo, por lo que estas advertencias son muy necesarias.

DreamStudio de stability.ai https://beta.dreamstudio.ai/generate

Otro sólido generador de imágenes AI que no requiere nada más que un login para empezar, DreamStudio ofrece una plataforma similar a Adobe Firefly, con un montón de opciones de personalización para conseguir exactamente lo que quieres. De hecho, incluso puedes obtener variaciones de una imagen generada, cambiando pequeños detalles pero manteniendo lo básico intacto, si encuentras algo que te gusta pero no es exactamente lo que quieres.

Además de eso, DreamStudio ofrece un campo de mensaje negativo, que le permite incluir lo que le gustaría que el generador de imágenes evite al responder a su otro mensaje. Una vez más, esto le permite concretar exactamente lo que quiere con esta plataforma.

Craiyon https://www.craiyon.com/

¿Quieres ser un poco más artístico con la generación de imágenes AI? Te recomendamos que eches un vistazo a la ingeniosa plataforma Craiyon, que te permite elegir entre las opciones Arte, Foto o Dibujo. Estos modelos generan opciones muy artísticas que te servirán de inspiración para tu trabajo.

Sin embargo, Craiyon tiene algunos inconvenientes. Por un lado, tiene dificultades con las opciones de realismo fotográfico, y sufre claramente de errores comunes de imagen de IA para personas, manos y otros detalles. Además, la versión gratuita sólo ofrece imágenes más pequeñas y está plagada de anuncios, por lo que su interfaz no es muy limpia. Aún así, desde un punto de vista artístico, Craiyon crea algunos retratos, paisajes y todo lo demás decididamente interesantes.

El impacto de las imágenes y videos generados por IA en la investigación científica: ¿Beneficio o Perjuicio?

Wong, Carissa. «AI-Generated Images and Video Are Here: How Could They Shape Research?» Nature, 7 de marzo de 2024. https://doi.org/10.1038/d41586-024-00659-8.

Así como muchos investigadores están utilizando ChatGPT para transformar el proceso de escritura científica, otros están utilizando generadores de imágenes de IA como Midjourney, Stable Diffusion y DALL-E para reducir el tiempo y el esfuerzo necesarios para producir diagramas e ilustraciones. Sin embargo, los investigadores advierten que estas herramientas de IA podrían impulsar un aumento en los datos falsos y las imágenes científicas inexactas. Nature examina cómo los investigadores están utilizando estas herramientas y lo que su creciente popularidad podría significar para la ciencia.

¿Cómo funcionan las herramientas de texto a imagen? Muchas herramientas de IA de texto a imagen, como Midjourney y DALL-E, se basan en algoritmos de aprendizaje automático llamados modelos de difusión que están entrenados para reconocer los vínculos entre millones de imágenes extraídas de Internet y descripciones de texto de esas imágenes. Estos modelos han avanzado en los últimos años gracias a mejoras en hardware y la disponibilidad de grandes conjuntos de datos para el entrenamiento. Después del entrenamiento, los modelos de difusión pueden utilizar indicaciones de texto para generar nuevas imágenes.

¿Para qué los están utilizando los investigadores? Algunos investigadores ya están utilizando imágenes generadas por IA para ilustrar métodos en artículos científicos. Otros los están utilizando para promocionar artículos en publicaciones en redes sociales o para mejorar las diapositivas de presentaciones. «Están utilizando herramientas como DALL-E 3 para generar imágenes llamativas que enmarcan conceptos de investigación», dice el investigador de IA Juan Rodríguez de ServiceNow Research en Montreal, Canadá. «Di una charla el jueves pasado sobre mi trabajo y utilicé DALL-E 3 para generar imágenes atractivas para mantener la atención de las personas», dice.

También están aumentando las herramientas de texto a video, pero parecen ser menos utilizadas por investigadores que no están desarrollando o estudiando activamente estas herramientas, dice Rodríguez. Sin embargo, esto podría cambiar pronto. El mes pasado, OpenAI, creador de ChatGPT en San Francisco, California, lanzó videoclips generados por una herramienta de texto a video llamada Sora. «Con los experimentos que vimos con Sora, parece que su método es mucho más robusto para obtener resultados rápidamente», dice Rodríguez. «Estamos en una etapa temprana en términos de texto a video, pero supongo que este año descubriremos cómo se desarrolla esto», agrega.

¿Cuáles son los beneficios de utilizar estas herramientas? Las herramientas de IA generativas pueden reducir el tiempo necesario para producir imágenes o figuras para artículos, carteles de conferencias o presentaciones. Convencionalmente, los investigadores utilizan una variedad de herramientas no de IA, como PowerPoint, BioRender e Inkscape. «Si realmente sabes cómo usar estas herramientas, puedes hacer figuras realmente impresionantes, pero lleva tiempo», dice Rodríguez.

Las herramientas de IA también pueden mejorar la calidad de las imágenes para los investigadores que encuentran difícil traducir conceptos científicos en ayudas visuales, dice Rodríguez. Con la IA generativa, los investigadores aún crean la idea principal de la imagen, pero pueden usar la IA para refinarla, dice.

¿Cuáles son los riesgos? Actualmente, las herramientas de IA pueden producir obras de arte convincentes y algunas ilustraciones, pero aún no pueden generar figuras científicas complejas con anotaciones de texto. «No obtienen el texto correcto: a veces el texto es demasiado pequeño, mucho más grande o está girado», dice Rodríguez. El tipo de problemas que pueden surgir quedó claro en un artículo publicado en Frontiers in Cell and Developmental Biology a mediados de febrero, en el que los investigadores utilizaron Midjourney para representar los órganos reproductores de una rata. El resultado, que pasó la revisión por pares, fue una caricatura de un roedor con genitales enormes y anotados con garabatos.

Existe también la posibilidad de que estas herramientas faciliten la producción de datos u observaciones falsas por parte de estafadores científicos, ya que no hay un método robusto para detectar tales imágenes y videos generados por IA. Rodriguez expresa preocupación por el potencial impacto de «una inundación de datos falsos y sintéticamente generados».

Algunos campos han mostrado una fuerte resistencia a la inclusión de imágenes generadas por IA en publicaciones científicas. Una encuesta realizada por el paleoartista Henry Sharpe reveló que solo uno de cada cuatro paleontólogos profesionales estaba a favor de permitir la inclusión de imágenes generadas por IA en publicaciones científicas. Se argumenta que estas imágenes pueden inducir a error tanto a científicos como al público, ya que simplemente copian elementos existentes sin la capacidad de interpretar textos científicos. Además, los procesos iterativos de reconstrucción de formas de vida antiguas, realizados en consulta con paleontólogos, revelan características anatómicas plausibles que se pierden al usar IA.

En cuanto a las políticas de las revistas científicas, Springer Nature ha prohibido el uso de imágenes, videos e ilustraciones generados por IA en la mayoría de los artículos que no tratan específicamente sobre IA. Journals de la familia Science no permiten el uso de texto, figuras o imágenes generadas por IA sin el permiso explícito de los editores, a menos que el artículo se centre en IA o aprendizaje automático. Por otro lado, PLOS ONE permite el uso de herramientas de IA, pero los investigadores deben declarar la herramienta utilizada, cómo la utilizaron y cómo verificaron la calidad del contenido generado.

Openverse, la biblioteca con más de 600 millones de fotos, imágenes y archivos de audio libre y abierto de dominio publico

openverse.org

¿Buscas la imagen perfecta para ilustrar tu post? ¿Una melodía pegadiza para animar un vídeo? No busque más: Openverse, la inmensa biblioteca de fotos, imágenes y audio de archivo libre y abierto aportados al dominio público por personas de todo el mundo, está ahora disponible en su nuevo dominio: openverse.org.

Encontrar y utilizar obras libres y gratuitas nunca ha sido tan fácil: Sólo tienes que visitar Openverse, introducir algunas palabras clave y elegir tu imagen o música favorita entre los resultados. También puedes filtrar por tipo de contenido, fuentes, relación de aspecto, tamaño, estados de licencia abierta y dominio público, y mucho más, como la búsqueda de las palabras clave «arte» y «universo» que utilizamos para encontrar la imagen de este post.

Openverse se creó aquí en CC como «CC Search», trasladándose a la comunidad WordPress en 2021, y ha seguido prosperando en su nuevo alojamiento, catalogando ahora más de 600 millones de imágenes y pistas de audio, con nuevas colecciones de obras abiertas que se añaden continuamente, como la reciente incorporación de más de 15 millones de imágenes de iNaturalist, el proyecto que permite a los científicos ciudadanos y a los investigadores documentar y comprender la biodiversidad mundial.

Guía para principiantes sobre imágenes responsivas

A Beginner’s Guide to Responsive Images in HTML.

Texto completo

Una imagen responsiva es una imagen que se adapta a las características de los distintos dispositivos. Cuando se hacen bien, las imágenes responsivas pueden mejorar el rendimiento y la experiencia del usuario de un sitio. Se pueden abordar las imágenes responsivas desde dos ángulos: sirviendo la misma imagen con diferentes tamaños o sirviendo diferentes imágenes según las características de la pantalla.

Cuando los ingenieros de software crearon la web, no tuvieron en cuenta cómo manejarían los navegadores las imágenes responsivas. Al fin y al cabo, los usuarios sólo accedían a la web desde ordenadores de sobremesa o portátiles. Sin embargo, esa no es la situación que se da hoy en día.

Según Statista, más del 90% de la población mundial de Internet se conecta a través de su teléfono móvil. La mayoría de las páginas web de Internet contienen imágenes y éstas son una de las métricas utilizadas para medir el rendimiento de la web. Para mejorar el rendimiento, hay que optimizar las imágenes haciéndolas responsivas.

	La IA en la revisión… en La IA en la revisión por …
	Google Ngram Viewer,… en Google Books Ngram Viewer: per…
	La persistente influ… en Declaración de San Francisco s…
	Estrategias innovado… en Comparación de gestores de ref…
	¿Quieres autopublica… en El 49% de los libros editados…

Universo Abierto

Blog de la biblioteca de Traducción y Documentación de la Universidad de Salamanca