
Black Forest Labs, una startup emergente de inteligencia artificial, ha lanzado su modelo de texto a imagen, FLUX 1, que ya supera a competidores como Midjourney 6.0, DALL-E 3 HD y Stable Diffusion 3-Ultra. FLUX 1 destaca en detalles de imagen, complejidad de escenas y adherencia a las indicaciones, según el sistema de clasificación Elo. El modelo ofrece opciones de proporciones y estilos similares a las de otros generadores de imágenes actuales.
El equipo de Black Forest Labs incluye ingenieros que anteriormente trabajaron en Stability AI, la empresa detrás de Stable Diffusion. Stability AI enfrentó problemas recientemente debido a acusaciones de mala gestión contra su CEO, Emad Mostaque, quien renunció. La startup ha recibido respaldo de figuras destacadas de la industria de la IA, incluyendo al CEO de Y Combinator, Garry Tan, y Timo Aila, investigador principal en Nvidia, además de obtener una ronda de financiamiento inicial de 31 millones de dólares liderada por Andreessen Horowitz.
FLUX 1 se diferencia por el uso de técnicas experimentales de entrenamiento, como embeddings posicionales rotativos y un transformador de difusión paralelo. Estas técnicas permiten al modelo analizar múltiples partes de una secuencia simultáneamente, acelerando el proceso de generación de imágenes coherentes a partir de ruido visual.
Black Forest Labs planea lanzar pronto un modelo de texto a video de última generación, lo que podría representar un desafío para otras empresas de IA enfocadas en video, como OpenAI, HeyGen y Runway. Mientras tanto, FLUX 1 ya está disponible en plataformas en la nube como Fal y Replicate.