
Google - Bilder und Video Generation auf neuem Niveau! Mit Veo 3, Imagen 4, Flow und Lyria 2 will Google Künstlern, Designern und Produzenten neue Superkräfte verleihen. Was können die Tools wirklich? Kurzfassung | Andreas Becker, 20.05.25
gpt-image-1 | All-AI.de EINLEITUNG Google DeepMind setzt auf kreative Intelligenz. Mit den neuen Modellen Veo 3, Imagen 4, Flow und Lyria 2 stellt der Konzern auf der I/O 2025 ein ganzes Arsenal an Tools vor, das nicht nur Bilder und Videos erzeugt, sondern auch Musik komponiert und Regie führt. Das Ziel: Kreative Arbeit mit KI so flüssig, intuitiv und individuell wie möglich gestalten. Wie verändert das unsere Vorstellung von künstlerischer Produktion? NEWS Veo 3: Bild und Ton aus einer Eingabe Veo 3 bringt einen echten Innovationssprung in die KI-basierte Videoproduktion. Zum ersten Mal generiert ein Modell nicht nur realistische Videos, sondern fügt auch passenden Ton hinzu. Ob Straßenlärm, Vogelstimmen oder Dialoge mit Lippensynchronisation – Veo 3 interpretiert Text- und Bildanweisungen präzise und setzt sie filmisch um. Ultra-Abonnenten in den USA haben bereits Zugriff über die Gemini-App und Flow. Unternehmenskunden nutzen das Modell über Vertex AI.
Veo 2 Reloaded: Mehr Kontrolle für Regisseure Die überarbeitete Version von Veo 2 bringt feinere Steuerung in den kreativen Prozess. Mit Funktionen wie referenzbasiertem Video, exakter Kameraführung, Outpainting für verschiedene Formate oder dem gezielten Entfernen von Objekten im Bild bietet Google den Nutzern Tools, die bislang professionellen Studios vorbehalten waren. Aktuell ist das Update über Flow nutzbar, bald auch per API. Flow: Der KI-Regisseur auf Knopfdruck Flow ist mehr als nur ein Tool. Es ist die zentrale Plattform für KI-gestützte Filmproduktion. Basierend auf Veo, Imagen und Gemini, lässt sich per Textbeschreibung eine Szene entwerfen, gestalten und zusammenfügen. Flow verwaltet Figuren, Objekte und Stilvorlagen. Zielgruppe sind Content Creator, Agenturen und kleine Studios. Der Dienst ist aktuell nur in den USA für Pro- und Ultra-Abonnenten zugänglich. Imagen 4: Wenn die KI endlich richtig schreiben kann Mit Imagen 4 zeigt Google, wie weit sich Bildgenerierung inzwischen entwickelt hat. Neben fotorealistischen und abstrakten Stilen gelingt jetzt auch Typografie – ein Problem, das viele Modelle lange nicht im Griff hatten. Texte in Bildern sind sauber gesetzt, Schriften klar lesbar. Zusätzlich unterstützt Imagen 4 hohe Auflösungen bis 2K und unterschiedliche Seitenverhältnisse. Das Tool ist in Gemini, Whisk, Vertex AI und den Google-Workspace-Apps wie Slides oder Docs eingebunden. Quelle: Google - Bilder mit Imagen 4 Lyria 2 und RealTime: Musik auf Zuruf Lyria 2 ist Googles neues Musikmodell. Es generiert Kompositionen für YouTube Shorts oder Vertex AI und ist besonders auf Songwriting und Producing ausgerichtet. Spannender ist Lyria RealTime – ein interaktives System, das Musik live erzeugen und steuern kann. Mit API-Zugang und AI Studio-Anbindung ist es ein flexibles Werkzeug für Musiker, DJs und Performances. So entsteht Musik, die sich mit dem Moment bewegt. SynthID: Digitale Signaturen gegen KI-Fakes Seit 2023 versieht Google KI-generierte Inhalte mit einem unsichtbaren Wasserzeichen. Über zehn Milliarden Dateien wurden bereits gekennzeichnet. Jetzt kommt der SynthID Detector dazu – ein Portal, mit dem sich prüfen lässt, ob ein Inhalt durch KI entstanden ist. Damit setzt Google auf Nachvollziehbarkeit und will das Vertrauen in maschinell erzeugte Inhalte stärken. AUSBLICK KI wird zum Co-Künstler Was Google mit Veo, Flow, Imagen und Lyria präsentiert, ist mehr als technische Spielerei. Es ist ein Wandel in der Art, wie Kreativität organisiert wird. Die Modelle führen nicht nur Befehle aus, sie agieren mit, reagieren, ergänzen. Besonders die Integration von Ton, Kamera und Typografie zeigt: Diese KI will nicht imitieren, sondern mitgestalten. Für viele Kreative wird das zur Chance, schneller und experimenteller zu arbeiten. Die Frage ist nicht mehr, ob KI Kunst kann – sondern, wie wir damit umgehen, wenn sie es besser kann als wir. UNSER ZIEL Wir wollen hauptberuflich über Künstliche Intelligenz berichten und dabei immer besser werden. Du kannst uns auf dem Weg unterstützen! Teile diesen Beitrag Folge uns auf Social Media Keine KI-News mehr verpassen und direkt kommentieren! Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support! Youtube - Kanal PayPal - Kaffee KURZFASSUNG
Google DeepMind hat auf der I/O 2025 neue kreative KI-Modelle wie Veo 3, Imagen 4, Flow und Lyria 2 vorgestellt.
Veo 3 kann synchronisierten Ton generieren, Imagen 4 bietet präzise Typografie und Lyria 2 ermöglicht Echtzeit-Musikkomposition.
Das Tool Flow kombiniert alle Modelle für einfache, textgesteuerte Videoproduktion.
SynthID sorgt für Transparenz bei KI-generierten Inhalten durch unsichtbare Wasserzeichen und einen Erkennungsdienst.
QUELLEN
Google Blog – Generative Media Models
Google Blog – Flow & Veo
The Verge – Imagen 4
The Verge – Veo 3 & Flow
Business Insider – Flow als Netflix-Konkurrenz
Weiterlesen...