
DALL-E
DALL-E es un modelo generativo desarrollado por OpenAI que se basa en la arquitectura GPT (Generative Pre-trained Transformer). La particularidad de DALL-E es su capacidad para generar imágenes a partir de descripciones textuales. Fue presentado por OpenAI en enero de 2021.
A diferencia de otros modelos generativos que trabajan con texto, como GPT-3, DALL-E está diseñado específicamente para generar imágenes realistas a partir de descripciones textuales. Puede crear imágenes completamente nuevas y originales que se ajustan a las descripciones dadas como entrada. Por ejemplo, si se le proporciona un texto que dice «un elefante rosa con alas», DALL-E intentará generar una imagen que coincida con esa descripción. La herramienta es de pago, y se necesitan comprar créditos
DALL-E se entrena en grandes conjuntos de datos que contienen imágenes y sus descripciones correspondientes. Luego, se puede utilizar para generar imágenes nuevas a partir de descripciones textuales que no formaron parte de los datos de entrenamiento.
La función de edición de DALL·E ya permite realizar cambios dentro de una imagen generada o cargada, una capacidad conocida como «Inpainting». Ahora, con «Outpainting», los usuarios pueden ampliar la imagen original, creando imágenes a gran escala en cualquier relación de aspecto. «Outpainting» tiene en cuenta los elementos visuales existentes en la imagen, incluyendo sombras, reflejos y texturas, para mantener el contexto de la imagen original.
Este enfoque tiene aplicaciones en la generación de contenido visual, diseño gráfico, y en general, en cualquier situación en la que se desee convertir descripciones textuales en imágenes de manera automatizada y creativa.