
Die beste Bilder KI kommt jetzt von Google! ChatGPT? Photoshop? Der neue Spitzenreiter macht einiges deutlich besser! Kurzfassung | Andreas Becker, 26.08.25
Gemini Flash | All-AI.de EINLEITUNG Google hat ein neues KI-Modell vorgestellt, das Bilder auf ein ganz neues Niveau bringt. Mit „Gemini 2.5 Flash Image“ lassen sich Fotos und Grafiken direkt in der Gemini-App bearbeiten – einfach per Texteingabe. Die Technik sorgt dafür, dass Personen, Tiere oder Produkte trotz Veränderungen wiedererkennbar bleiben. Auch komplexe Bildkombinationen sind jetzt möglich. Das Modell steht ab sofort für Nutzer und Entwickler zur Verfügung und erreicht in den meisten Kategorien Bestwerte! + Quelle: Google Gemini NEWS Einfach Texte eingeben, Bild ändern lassen Das Herzstück des neuen Modells ist die direkte Bearbeitung von Bildern durch Textbefehle. Nutzer können zum Beispiel den Hintergrund eines Fotos unscharf machen, Farben ändern oder störende Objekte entfernen – ganz ohne Bildbearbeitungsprogramm. Die KI versteht, was gemeint ist, und setzt die Anweisung direkt um. Das funktioniert selbst bei mehreren Änderungen hintereinander, ohne dass die Bildqualität darunter leidet. In der Praxis bedeutet das: Man lädt ein Bild hoch, schreibt zum Beispiel „Hintergrund weichzeichnen und Licht wärmer machen“, und die KI erledigt den Rest. Laut Google nutzt das Modell dabei sein allgemeines Weltwissen, um realistische Ergebnisse zu liefern. Besonders bei Alltagsgegenständen, Kleidung oder Lichtstimmungen wirkt das Ergebnis natürlicher als bei früheren Versionen. + Quelle: Google Gemini Wiedererkennbare Gesichter und Motive Eine große Schwäche vieler KI-Bildgeneratoren war bisher die fehlende Konsistenz: Eine Person sah auf jedem Bild anders aus. Mit Gemini 2.5 Flash hat Google dieses Problem gezielt gelöst. Das Modell kann eine Figur, ein Tier oder ein Objekt über mehrere Bilder hinweg gleich aussehen lassen – selbst bei unterschiedlichen Blickwinkeln, Posen oder Hintergründen. Das ist zum Beispiel praktisch für Unternehmen, die Serienbilder für Kataloge, Kampagnen oder Webseiten erstellen. Auch Privatnutzer können so aus einem Fotoalbum einheitliche Motive machen, ohne jedes Bild einzeln zu bearbeiten. Die KI erkennt Details und hält diese stabil – ohne, dass man es ihr extra beibringen muss. + Quelle: Google Gemini Mehrere Bilder verschmelzen zu einer neuen Szene Gemini 2.5 Flash kann auch verschiedene Fotos zu einem einzigen neuen Bild kombinieren. Wer zum Beispiel ein Produktfoto und ein Wohnzimmerbild hochlädt, bekommt eine realistische Szene mit dem Produkt im Raum. Die KI erkennt Perspektive, Licht und Farben und passt alles automatisch an. Ein weiteres Feature ist der sogenannte Stiltransfer. Dabei kann man etwa das Muster eines Kleides auf ein anderes Objekt übertragen – zum Beispiel auf einen Stiefel. Form und Proportionen bleiben erhalten, nur das Design ändert sich. Damit lassen sich kreative Varianten für Mode, Deko oder Werbung erzeugen – ganz ohne Grafikkenntnisse. + Quelle: Google Gemini Verfügbarkeit, Preis und Zugang Die neue Funktion ist direkt in der Gemini-App nutzbar. Wichtig ist: Man muss das Bildmodell „Flash“ auswählen, nicht das bisherige „Imagen“. Das ist etwas versteckt, aber sinnvoll – denn „Flash“ ist ein echtes Sprachmodell mit Bildfunktionen, kein reiner Bildgenerator. Alle Bilder, die über Gemini 2.5 Flash erstellt oder verändert werden, erhalten ein sichtbares Wasserzeichen und zusätzlich ein digitales Wasserzeichen, das unsichtbar im Bild gespeichert ist. So lässt sich jederzeit erkennen, dass es sich um KI-Bilder handelt. Für Entwickler gibt es das Modell auch in der Vorschauversion über die Gemini API, Google AI Studio und Vertex AI. Die Nutzung kostet etwa 0,040 US-Dollar pro Bild. Technisch entspricht das rund 1.290 sogenannten Token pro Bild – eine rechnerische Einheit für den Datenverbrauch. Einordnung und Ausblick Google geht mit Gemini 2.5 Flash einen wichtigen Schritt in Richtung praxisnahe Bildbearbeitung per KI. Während andere Anbieter sich vor allem auf reine Bildgenerierung konzentrieren, verbindet Google Spracheingabe, Bearbeitung und visuelles Verständnis in einem Modell. Das spart Wechsel zwischen Tools und macht die Anwendung alltagstauglicher. Für Nutzer bedeutet das: Bilder bearbeiten funktioniert jetzt einfacher, genauer und konsistenter – und zwar direkt mit der Spracheingabe, die man von Chatbots kennt. Ob das in Zukunft den Umgang mit klassischer Bildbearbeitung dauerhaft verändert, hängt auch davon ab, wie intuitiv die Bedienung bleibt. Aber der erste Eindruck: vielversprechend. DEIN VORTEIL - DEINE HILFE Kostenlose News und Tutorials – mit minimaler Werbung und maximalem Mehrwert. Damit das so bleibt und wir uns stetig verbessern können, freuen wir uns über deine Unterstützung. Teile diesen Beitrag Folge uns auf Social Media Keine KI-News mehr verpassen und direkt kommentieren! Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support! Youtube - Kanal PayPal - Kaffee KURZFASSUNG
Google hat mit Gemini 2.5 Flash ein neues KI-Modell veröffentlicht, das Bilder per Spracheingabe bearbeiten kann.
Die KI sorgt für konsistente Gesichter und Objekte über mehrere Bilder hinweg und kann verschiedene Fotos zu einer neuen Szene verschmelzen.
Das Tool ist direkt in der Gemini-App nutzbar und für Entwickler über mehrere Google-Plattformen zugänglich.
Mit Funktionen wie Stiltransfer und realistischer Lichtanpassung verändert Google den Standard der KI-Bildbearbeitung deutlich.
QUELLEN
Google Developers Blog
DeepMind Modelseite
TechCrunch
Axios
Weiterlesen...