#19 FLUX: Das neue Bildmodell von Black Forest Labs schlägt Midjourney
Black Forest Labs, gegründet von Ex-Stability AI Forschern, veröffentlicht FLUX – und die AI-Bildgenerierung hat einen neuen König. Wir testen alle Varianten, vergleichen mit Midjourney und DALL-E 3, und analysieren die Technik dahinter.
Zusammenfassung
Die Macher von Stable Diffusion sind zurück – mit FLUX. Das neue Modell von Black Forest Labs setzt neue Maßstäbe in Bildqualität, Prompt-Treue und Textrendering. Wir haben alle drei Varianten getestet und erklären, warum FLUX die Bildgenerierung neu definiert.
Themen & Highlights
- 00:00 Intro: Wer ist Black Forest Labs?
- 08:00 FLUX Modelle: Schnell, Dev und Pro erklärt.
- 20:00 Live-Test: FLUX vs Midjourney vs DALL-E 3.
- 38:00 Text in Bildern: Endlich funktioniert es!
- 45:00 Praktische Nutzung: APIs, Replicate, ComfyUI.
Deep Dive: FLUX, Black Forest Labs & die neue Ära der Bildgenerierung
Als Stable Diffusion 2021 erschien, veränderte es alles. Jetzt haben die Köpfe dahinter – Robin Rombach und sein Team – ein neues Unternehmen gegründet und FLUX veröffentlicht. Das Ergebnis übertrifft alle Erwartungen.
Black Forest Labs: Die Stable Diffusion Macher
Die Gründer von Black Forest Labs haben bei Stability AI Stable Diffusion entwickelt. Nach dem Chaos bei Stability (CEO-Rücktritt, Finanzprobleme) haben sie neu angefangen:
- • Robin Rombach: Lead Author von Stable Diffusion
- • Sitz: Freiburg, Deutschland
- • Funding: $31 Millionen Series Seed
- • Mission: State-of-the-Art generative AI, nachhaltig finanziert
Die FLUX Familie
FLUX kommt in drei Varianten:
FLUX.1 [schnell]
Optimiert für Geschwindigkeit. 4 Steps, Apache 2.0 Lizenz (komplett offen).
Perfekt für schnelle Iterationen und lokales Hosting.
FLUX.1 [dev]
Der Sweet Spot. Nicht-kommerzielle Lizenz, aber Gewichte offen. Bessere Qualität
als [schnell], gut für Experimente und Forschung.
FLUX.1 [pro]
Das Flaggschiff. Nur via API, beste Qualität, für kommerzielle Nutzung.
Schlägt Midjourney in den meisten Benchmarks.
"FLUX ist das erste Modell, das Text in Bildern zuverlässig rendert. Schilder, Logos, Beschriftungen – alles korrekt. Das war jahrelang das größte Problem aller Bildmodelle."
Der Live-Vergleich
Wir haben identische Prompts durch FLUX Pro, Midjourney v6 und DALL-E 3 gejagt:
Fotorealismus:
FLUX Pro > Midjourney > DALL-E 3. FLUX erreicht eine Detailtreue, die fast
unheimlich ist. Hauttexturen, Lichtreflexionen, Stofffalten – alles perfekt.
Prompt-Treue:
FLUX Pro > DALL-E 3 > Midjourney. FLUX folgt komplexen Anweisungen präzise.
"Eine Person mit blauem Hemd, roter Krawatte, grüner Hose" – alles korrekt.
Text-Rendering:
FLUX Pro >> alle anderen. Der klare Gewinner. Midjourney und DALL-E kämpfen
immer noch mit Text.
Künstlerische Stile:
Midjourney > FLUX > DALL-E 3. Hier bleibt Midjourney stark – der "Midjourney Look"
ist einfach ästhetisch ansprechend.
Hände:
FLUX Pro > Midjourney v6 > DALL-E 3. Ja, FLUX kann Hände. Nicht perfekt, aber
deutlich besser als alles andere.
Die Technik dahinter
Was macht FLUX anders?
- • Flow Matching: Neue Trainingsmethode, effizienter als Diffusion
- • Rectified Flows: Geradere Pfade im latenten Raum
- • 12B Parameter: Größer als SD, kleiner als DALL-E 3
- • T5-XXL Text Encoder: Besseres Sprachverständnis
- • Rotary Positional Embeddings: Bessere Textpositionierung
Wie man FLUX nutzt
Mehrere Optionen:
- • Replicate: Einfachste API, Pay-per-Image
- • fal.ai: Schnell und günstig
- • Together AI: Enterprise-ready
- • ComfyUI: Lokal mit [schnell] oder [dev]
- • Hugging Face: Modell-Downloads für Self-Hosting
Für [schnell] und [dev] reicht eine RTX 4090 mit 24GB VRAM. [pro] nur via API.
Use Cases für Unternehmen
Wo wir FLUX bei Bananapie einsetzen:
- • Marketing: Social Media Assets, Blog-Header
- • Produktvisualisierung: Mockups für Kunden-Pitches
- • UI-Design: Placeholder-Images, Icons, Illustrationen
- • Branding: Schnelle Logo-Konzepte
Das Text-Rendering macht FLUX besonders nützlich für Marketing-Assets, wo Beschriftungen wichtig sind.
Was kommt als Nächstes?
Black Forest Labs hat angekündigt:
- • Video-Modell: In Entwicklung
- • Fine-Tuning: Bald möglich
- • Inpainting/Outpainting: Kommt
- • ControlNet-Support: Community arbeitet dran
Fazit
FLUX ist ein Wendepunkt. Zum ersten Mal schlägt ein Modell Midjourney in den meisten objektiven Metriken. Mit offenen Gewichten für [schnell] und [dev] demokratisiert Black Forest Labs State-of-the-Art Bildgenerierung. Wir sind gespannt, was als Nächstes kommt – besonders auf das Video-Modell.
