Explain — Modul 5

KI-Bildgenerierung: Wie Diffusion Bilder erzeugt

Bild-KI zeichnet nicht. Sie startet mit purem Chaos und entfernt Schritt für Schritt das Rauschen — gesteuert durch Ihren Text-Prompt.

KI-Bildgenerierung mit Tools wie Midjourney, DALL-E oder Stable Diffusion hat die kreative Arbeit revolutioniert. Doch wie erzeugen diese Modelle eigentlich Bilder aus Text? Die Antwort liegt im Verfahren der Diffusion.

Anders als man vielleicht denkt, „zeichnet" eine Bild-KI nicht. Stattdessen startet sie mit purem Rauschen — wie ein Fernseher ohne Signal — und entfernt dieses Rauschen in vielen kleinen Schritten. Der Text-Prompt fungiert dabei als Kompass: Er steuert, welches Bild aus dem Chaos entsteht. Unterschiedliche Prompts lenken denselben Startpunkt in völlig verschiedene Richtungen.

In diesem Modul erleben Sie interaktiv, wie Denoising funktioniert, warum Seeds für Variation sorgen und wie viele Schritte eine KI für gute Bildqualität braucht. Ob für Marketing, Design oder Produktvisualisierung — das Verständnis dieser Grundlagen hilft Ihnen, bessere Prompts zu schreiben und Ergebnisse gezielt zu steuern.

Kurz-Rückblick — Modul 4

In Context Window haben Sie gelernt: KI hat ein begrenztes Arbeitsgedächtnis — nach zu vielen Nachrichten vergisst sie Ihre Anweisungen. Heute schauen wir uns eine ganz andere Art von KI an: Bild-Generierung.

Was passiert wirklich?

Wenn Sie „Male einen Sonnenuntergang“ in Midjourney oder DALL-E eingeben, denken die meisten: Die KI nimmt einen Pinsel und zeichnet. Die Realität ist eine komplett andere.

Bild-KI startet mit reinem Rauschen — wie ein Fernseher ohne Signal. Dann entfernt sie in vielen kleinen Schritten das Rauschen, bis ein Bild entsteht. Ihr Text-Prompt bestimmt dabei die Richtung: Welches Bild soll aus dem Chaos entstehen?

Vom Rauschen zum Bild

Ziehen Sie den Slider und beobachten Sie, wie Schritt für Schritt ein Bild aus purem Rauschen entsteht.

Frames werden berechnet…

Reines Rauschen — wie ein Fernseher ohne Signal

Schritt 0 / 50

Die KI zeichnet also nicht — sie entrauscht. Aber wie steuert der Prompt diesen Prozess?

Der Prompt als Kompass

Der Prompt ist keine Zeichenanweisung. Er ist ein Kompass. Bei jedem Denoising-Schritt prüft die KI: „Sieht das aktuelle Bild schon nach dem aus, was der Text beschreibt?“ Wenn nicht, wird in die richtige Richtung korrigiert.

Das bedeutet: Gleicher Startpunkt (gleiches Rauschen) + verschiedene Prompts = komplett verschiedene Bilder.

Drei Prompts, ein Startpunkt

Alle drei Bilder starten mit identischem Rauschen. Beobachten Sie, wie sie durch verschiedene Prompts in verschiedene Richtungen divergieren.

„Ein Sonnenuntergang am Meer“

Wird berechnet…

„Berglandschaft im Winter“

„Abstrakte Kunst in Rot und Gold“

Schritt 0 / 50

Gleicher Prompt, gleiches Verfahren — aber jedes Bild sieht anders aus. Woher kommt die Variation?

Der Zufall im Rauschen

Die Antwort ist das Startrauschen. Jedes Mal, wenn Sie ein Bild generieren, startet die KI mit anderem zufälligem Rauschen — einem anderen „Seed“. Gleicher Prompt + verschiedener Seed = verschiedenes Bild.

In manchen Tools können Sie den Seed fixieren. Dann bekommen Sie bei gleichem Prompt immer dasselbe Ergebnis — nützlich, wenn Sie ein Bild gezielt variieren wollen.

Vier Seeds, vier Ergebnisse

Gleicher Prompt, aber vier verschiedene Startrauschen. Drücken Sie „Neue Seeds“, um zu sehen, wie jedes Rauschen ein anderes Bild erzeugt.

Prompt: „Ein Sonnenuntergang am Meer“

Gleicher Prompt. Verschiedenes Rauschen. Deshalb sieht jedes Bild anders aus.

Rauschen wird entfernt, der Prompt steuert, der Seed variiert — aber wie viele Schritte braucht es eigentlich?

Die Qualitätsfrage

Mehr Schritte = mehr Rechenzeit = bessere Qualität? Nicht ganz. In der Praxis gibt es einen Sweet Spot: Zu wenige Schritte (5–10) ergeben matschige Bilder. Ab ~30 Schritten ist die Qualität gut. Noch mehr bringt kaum sichtbare Verbesserung — kostet aber mehr.

Wie viele Schritte braucht es?

Vergleichen Sie dieselbe Szene bei verschiedenen Schrittzahlen.

Wird berechnet…

30 Schritte

Gut

Mehr Schritte = bessere Qualität — aber ab ~30 Schritten bringt es kaum noch was.

Key Takeaways

  • Bild-KI zeichnet nicht — sie startet mit Rauschen und entfernt es Schritt für Schritt (Diffusion).

  • Der Prompt ist ein Kompass: Er steuert, welches Bild aus dem Rauschen entsteht.

  • Verschiedene Startrauschen (Seeds) erzeugen bei gleichem Prompt verschiedene Bilder.

  • ~30 Schritte sind der Sweet Spot — mehr bringt kaum sichtbare Verbesserung.

  • Praxis-Tipp: „Seed fixieren“ gibt reproduzierbare Ergebnisse, wenn Sie ein Bild gezielt variieren wollen.

Diese Konzepte im Workshop erleben

In der Prompt Arena können Teilnehmer live gegen verschiedene KI-Modelle prompten — ideal, um Theorie in die Praxis umzusetzen.

Kostenlos testen