Erschreckend schön: Bildbearbeitung mit KI

Zu schön um wahr zu sein?

Dem Computer oder Smartphone einfach sagen, was es machen soll und schon sind meine Bilder perfekt. Ein (Alb-)Traum dem wir immer näher kommen. Seit Google bei Gemini die Version 2.5 Flash bereit gestellt hat schwärmen viele von den neuen Qualitäten.

Um es gleich vorweg zu sagen: in der kostenlosen Version bekommt man die Ergebnisse nur klein in etwa 800x1200 Pixel ausgegeben und enthalten ein Wasserzeichen. Für das den Blog oder das Smartphone sicher ausreichend. Wer mehr will muss zahlen.

Die Ergebisse können sich durchaus sehen lassen. Einfache klare Befehle wie "mache den Himmel blau" werden promt erfüllt. (Wortspiel bemerkt?) Auch der Heideblüte zur farbenfrohen Pracht zu verhelfen war kein Problem.

Smartphone                                                                                                    Gemini

Ich erinnere mich an einen Auftrag in der Lüneburger Heide. Über Wochen hinweg gab es nur Regen, Nebel oder grauen Himmel. Da wäre das doch eine prima Lösung gewesen.

Nicht alle Bildbearbeitungswünsche erfüllt die KI perfekt. Beim ausgleichen von Kontrasten in einem Beispielbild hatte sie echt Probleme. Zwar wurden die dunkelen Stellen aufgehellt, aber leider die hellen auch.

Erschreckend gut funktioniert dagegen das Entfernen von Personen. Also die Schwiegermutter hat demnächst keine Chance mehr. Auf meinem Testbild habe ich mal einen Politiker verschwinden lassen, der im Bild etwas störte, obwohl er Parteifreund der Rednerin war.

...und weg ist er!

Und wer genau hinsieht bemerkt, dass sogar die Spiegelungen im linken Wasserglas angepsst wurden. Auch den Hintergrund hat die gleich gebügelt und die Protagonistin sieht ein weing wacher aus. Die Aufgabe war jedoch noch nur: "entferne die Person im Hintergrund." Prompt wurde etwas mehr geliefert.

Um zu sehen wie die KI mit wirklich schwierigen Motiven umgeht, gab es noch eine Nachtaufnahme vom Festival of Lights in Berlin zum bearbeiten. "Stelle das Bild gerade und entferne die Personen."

Gerade ist etwas anderes.

Mit dem gerade stellen hat es nicht geklappt. Aber die Menschenmenge ist komplett verschwunden, bis auf einige Schatten und der Zaun bis zum Boden sichtbar.
Die Ki von Gemini analysiert tatsächlich was auf dem Bild zu sehen ist. Bei bekannten Gebäuden helfen dann sicher Vergleiche mit anderen Bildern. Das führt zu einer bisher nicht dagewesenen Perfektion, wie das letzte Beispiel zeigt. Sicher hat sich jeder Fotogarf schon über die vielen Menschen am Brandenburger Tor in Berlin geärgert. der pariser Platz ist auch wirklich nie leer und schon garnicht wenn es schönes licht, einen Sonnenuntergang oder ähnliches gibt. Dann lassen wir mal alle die Kinnladen herrunterklappen:


 Einzig ein paar leuchtende Handys sind geblieben, aber wem fällt das auf? Schöne Bilder ohne große Mühe, schöner Schein führt zum Erfolg. Bleibt da die Fotografie auf der Strecke? Oder die "Wahrheit?" Werden unsere Erinnerungen das Original widergeben?
Jetzt bin ich fast geneigt ein Plädoyer für die Analoge Fotogarfie zu halten!