Stand: 23. Mai 2026
KI-Bildmodelle erzeugen in Sekunden ein brauchbares Motiv. Diese Leichtigkeit hat eine Kehrseite. Wer jedes Bild sofort in höchster Qualität rechnet und bei Nichtgefallen neu würfelt, bezahlt für eine Vielzahl verworfener Versuche. Es lohnt sich, einen Moment innezuhalten und zu fragen, wie ein professioneller Ablauf aussehen würde. Die Antwort ist überraschend alt.

Eine Lehre aus der analogen Fotografie
Vor der Digitalkamera arbeiteten Fotografen mit dem Kontaktabzug. Ein ganzer belichteter Film wurde zunächst als Bogen kleiner Vorschaubilder abgezogen, schnell und billig. Auf diesem Bogen markierte der Fotograf mit dem Stift die wenigen Aufnahmen, die eine Vergrößerung verdienten. Erst diese ausgewählten Negative wanderten dann in den teuren, aufwändigen Vergrößerungsprozess.
Das Prinzip trennt zwei Dinge, die unsere Intuition gern vermischt: die Suche nach der richtigen Bildidee und die Herstellung des fertigen Bildes. Die Suche darf billig und zahlreich sein. Die Herstellung darf teuer sein, weil sie nur noch selten stattfindet.
Das Prinzip, auf KI übertragen
Moderne Bildmodelle wie gpt-image-2 erlauben denselben zweistufigen Ablauf. In der ersten Phase entstehen vier Varianten in niedriger Qualität. Vier solche Vorschaubilder kosten zusammen etwa zwei Cent. Sie klären die Richtung. Trifft die Komposition die Aussage, passt der Stil zur Marke, stimmt die Bildidee.
In der zweiten Phase wird genau eine Richtung gewählt und in hoher Qualität gerechnet. Ein bis zwei dieser Premium-Bilder kosten zusammen rund 50 Cent. Das Verhältnis ist bemerkenswert. Die teure Stufe kostet das Fünfundzwanzig- bis Vierzigfache der billigen. Wer ohne Vorschau arbeitet und mehrere Anläufe braucht, vervielfacht genau diese teure Stufe.
Eine Eigenheit, die man kennen sollte
Ein Detail unterscheidet den digitalen Kontaktabzug vom analogen. Das Bildmodell kennt keinen festen Startwert, mit dem sich eine Vorschau pixelgenau in Hochauflösung wiederholen ließe. Das Premium-Bild ist immer ein frischer Zug, kein vergrößertes Negativ. Die gewählte Vorschau ist deshalb ein Richtungsanker, kein exaktes Auswahlbild.
In der Praxis ist das weniger einschränkend, als es klingt. Die Modelle sind sehr texttreu. Das Layout folgt dem Prompt, die Qualitätsstufe steuert vor allem Schärfe und Detailgrad. Die Vorschau sagt also zuverlässig, ob die Idee trägt, auch wenn das finale Bild im Detail abweicht.
Drei Fragen für Ihren nächsten Termin
Frage eins: Erzeugen unsere Werkzeuge oder Dienstleister Bilder direkt in hoher Qualität, oder gibt es eine billige Vorschaustufe zur Richtungsfindung?
Frage zwei: Wie viele Versuche braucht es im Schnitt, bis ein Motiv sitzt, und in welcher Qualitätsstufe laufen diese Versuche?
Frage drei: Wer entscheidet über die Richtung eines Bildes, und an welcher Stelle im Ablauf fällt diese Entscheidung?
Sind die Antworten klar, arbeitet Ihre Bildproduktion methodisch. Sind sie es nicht, liegt hier ein Hebel, der die Kosten pro Motiv oft um den Faktor zehn senkt.
Was wir daraus mitnehmen
Der Reiz der KI-Bildgenerierung liegt in ihrer Geschwindigkeit. Diese Geschwindigkeit ist zugleich die Falle, weil sie das Probieren so billig erscheinen lässt, dass niemand mehr zählt. Ein guter Prozess stellt die alte Trennung wieder her. Erst erkunden, dann herstellen. Die Frage ist nicht, wie schnell ein Bild entsteht, sondern an welcher Stelle die teure Arbeit beginnt. Wir bei KI-Berater Hamburg entwickeln solche Abläufe gemeinsam mit unseren Mandanten als Teil einer KI-Strategie, die Geschäftsergebnis und Kostenkontrolle zusammen denkt. Den Einstieg bildet eine KI-Potenzialanalyse.