Zurück zur Übersicht
Episode #1919. August 202452 Min.

#19 FLUX: Das neue Bildmodell von Black Forest Labs schlägt Midjourney

Black Forest Labs, gegründet von Ex-Stability AI Forschern, veröffentlicht FLUX – und die AI-Bildgenerierung hat einen neuen König. Wir testen alle Varianten, vergleichen mit Midjourney und DALL-E 3, und analysieren die Technik dahinter.

Zusammenfassung

Die Macher von Stable Diffusion sind zurück – mit FLUX. Das neue Modell von Black Forest Labs setzt neue Maßstäbe in Bildqualität, Prompt-Treue und Textrendering. Wir haben alle drei Varianten getestet und erklären, warum FLUX die Bildgenerierung neu definiert.

Themen & Highlights

  • 00:00 Intro: Wer ist Black Forest Labs?
  • 08:00 FLUX Modelle: Schnell, Dev und Pro erklärt.
  • 20:00 Live-Test: FLUX vs Midjourney vs DALL-E 3.
  • 38:00 Text in Bildern: Endlich funktioniert es!
  • 45:00 Praktische Nutzung: APIs, Replicate, ComfyUI.

Deep Dive: FLUX, Black Forest Labs & die neue Ära der Bildgenerierung

Als Stable Diffusion 2021 erschien, veränderte es alles. Jetzt haben die Köpfe dahinter – Robin Rombach und sein Team – ein neues Unternehmen gegründet und FLUX veröffentlicht. Das Ergebnis übertrifft alle Erwartungen.

Black Forest Labs: Die Stable Diffusion Macher

Die Gründer von Black Forest Labs haben bei Stability AI Stable Diffusion entwickelt. Nach dem Chaos bei Stability (CEO-Rücktritt, Finanzprobleme) haben sie neu angefangen:

  • Robin Rombach: Lead Author von Stable Diffusion
  • Sitz: Freiburg, Deutschland
  • Funding: $31 Millionen Series Seed
  • Mission: State-of-the-Art generative AI, nachhaltig finanziert

Die FLUX Familie

FLUX kommt in drei Varianten:

FLUX.1 [schnell]
Optimiert für Geschwindigkeit. 4 Steps, Apache 2.0 Lizenz (komplett offen). Perfekt für schnelle Iterationen und lokales Hosting.

FLUX.1 [dev]
Der Sweet Spot. Nicht-kommerzielle Lizenz, aber Gewichte offen. Bessere Qualität als [schnell], gut für Experimente und Forschung.

FLUX.1 [pro]
Das Flaggschiff. Nur via API, beste Qualität, für kommerzielle Nutzung. Schlägt Midjourney in den meisten Benchmarks.

"FLUX ist das erste Modell, das Text in Bildern zuverlässig rendert. Schilder, Logos, Beschriftungen – alles korrekt. Das war jahrelang das größte Problem aller Bildmodelle."

Der Live-Vergleich

Wir haben identische Prompts durch FLUX Pro, Midjourney v6 und DALL-E 3 gejagt:

Fotorealismus:
FLUX Pro > Midjourney > DALL-E 3. FLUX erreicht eine Detailtreue, die fast unheimlich ist. Hauttexturen, Lichtreflexionen, Stofffalten – alles perfekt.

Prompt-Treue:
FLUX Pro > DALL-E 3 > Midjourney. FLUX folgt komplexen Anweisungen präzise. "Eine Person mit blauem Hemd, roter Krawatte, grüner Hose" – alles korrekt.

Text-Rendering:
FLUX Pro >> alle anderen. Der klare Gewinner. Midjourney und DALL-E kämpfen immer noch mit Text.

Künstlerische Stile:
Midjourney > FLUX > DALL-E 3. Hier bleibt Midjourney stark – der "Midjourney Look" ist einfach ästhetisch ansprechend.

Hände:
FLUX Pro > Midjourney v6 > DALL-E 3. Ja, FLUX kann Hände. Nicht perfekt, aber deutlich besser als alles andere.

Die Technik dahinter

Was macht FLUX anders?

  • Flow Matching: Neue Trainingsmethode, effizienter als Diffusion
  • Rectified Flows: Geradere Pfade im latenten Raum
  • 12B Parameter: Größer als SD, kleiner als DALL-E 3
  • T5-XXL Text Encoder: Besseres Sprachverständnis
  • Rotary Positional Embeddings: Bessere Textpositionierung

Wie man FLUX nutzt

Mehrere Optionen:

  • Replicate: Einfachste API, Pay-per-Image
  • fal.ai: Schnell und günstig
  • Together AI: Enterprise-ready
  • ComfyUI: Lokal mit [schnell] oder [dev]
  • Hugging Face: Modell-Downloads für Self-Hosting

Für [schnell] und [dev] reicht eine RTX 4090 mit 24GB VRAM. [pro] nur via API.

Use Cases für Unternehmen

Wo wir FLUX bei Bananapie einsetzen:

  • Marketing: Social Media Assets, Blog-Header
  • Produktvisualisierung: Mockups für Kunden-Pitches
  • UI-Design: Placeholder-Images, Icons, Illustrationen
  • Branding: Schnelle Logo-Konzepte

Das Text-Rendering macht FLUX besonders nützlich für Marketing-Assets, wo Beschriftungen wichtig sind.

Was kommt als Nächstes?

Black Forest Labs hat angekündigt:

  • Video-Modell: In Entwicklung
  • Fine-Tuning: Bald möglich
  • Inpainting/Outpainting: Kommt
  • ControlNet-Support: Community arbeitet dran

Fazit

FLUX ist ein Wendepunkt. Zum ersten Mal schlägt ein Modell Midjourney in den meisten objektiven Metriken. Mit offenen Gewichten für [schnell] und [dev] demokratisiert Black Forest Labs State-of-the-Art Bildgenerierung. Wir sind gespannt, was als Nächstes kommt – besonders auf das Video-Modell.

Bereit für Dein
nächstes Projekt?

Ob neue App, Plattform-Optimierung oder KI-Integration – wir unterstützen Dich in jeder Phase. Kostenloses Erstgespräch für Gründer und Tech-Teams.

Erdem Güner – Dein Ansprechpartner

Dein Ansprechpartner

Erdem Güner

Meld dich einfach – wir schauen uns dein Projekt gemeinsam an.

Bananapie

Digitale Produkte, Apps und Automatisierungslösungen aus Berlin – für Teams, die wirklich vorankommen wollen.

Eisenbahnstr. 11, 10997 Berlin

Montag–Freitag, 9–17 Uhr

© 2026 Bananapie GmbH. Alle Rechte vorbehalten.

Made with ♥️ in Berlin.