Auf die Schnelle

Google hat auf der Entwicklerkonferenz I/O am 19. Mai 2026 Gemini Omni vorgestellt, eine KI, die aus Text, Bildern und Ton kurze Videos erzeugt. Die erste Variante ist kostenlos in YouTube Shorts und der Create-App nutzbar. Für kleine Betriebe wird damit das erste Marketing-Video erreichbar, ohne Kamerateam und ohne Agentur.

Video ist im Marketing das mit Abstand wirksamste Format und für die meisten kleinen Betriebe zugleich das mit der höchsten Hürde. Kamera, Schnitt, Ton, das kostet Zeit oder Geld, oft beides. Google hat auf seiner Entwicklerkonferenz I/O am 19. Mai 2026 ein Werkzeug gezeigt, das diese Hürde senkt: Gemini Omni erzeugt aus Text, Bildern und Tonschnipseln kurze Videos. Was das praktisch wert ist und wo die Grenzen liegen, lohnt einen nüchternen Blick.

Was Gemini Omni kann

Gemini Omni ist laut Google das erste Modell des Konzerns, das beliebige Eingaben in beliebige Ausgaben verwandeln soll, im Fachjargon any-to-any. Die erste verfügbare Variante heißt Gemini Omni Flash.

Sie nimmt Text, Bilder, Audio und Video als Eingabe und erzeugt daraus Video. Der Unterschied zu früheren Werkzeugen liegt darin, dass das Modell die Eingaben nicht einfach aneinanderhängt, sondern über sie hinweg denkt und ein zusammenhängendes Ergebnis baut. Du kannst ein Produktfoto, einen gesprochenen Satz und eine kurze Beschreibung kombinieren, und Omni macht daraus einen kleinen Clip. Bearbeiten lässt sich das Ergebnis im Gespräch, also indem du in Worten sagst, was anders werden soll.

Verfügbar ist Gemini Omni Flash seit dem Tag der Ankündigung. Kostenlos läuft es in YouTube Shorts und in der YouTube-Create-App, dazu ist es in den Bezahlstufen Google AI Plus, Pro und Ultra enthalten. Wer also ohnehin Kurzvideos auf YouTube veröffentlicht, hat das Werkzeug bereits in der Hand.

Wo die Grenzen liegen

Bevor jetzt Bilder vom Hochglanz-Werbespot aus dem Rechner entstehen: Die Grenzen sind klar gesteckt. Zum Start sind die erzeugten Clips auf zehn Sekunden begrenzt.

Bild- und Ton-Ausgabe als eigenständige Formate stehen laut Google zwar auf der Roadmap, gehören aber noch nicht zum Start. Gemini Omni Flash ist also vorerst ein Werkzeug für kurze, schnelle Videoschnipsel, nicht für den abendfüllenden Imagefilm.

Genau das passt aber zur Realität kleiner Betriebe. Niemand braucht für einen Social-Media-Post einen Spielfilm. Ein zehn Sekunden langer Clip, der ein Produkt zeigt, eine Aktion ankündigt oder eine Öffnungszeit kommuniziert, ist genau das Format, das auf Shorts, Reels und in Stories funktioniert.

Wofür sich das im Betrieb eignet

Der realistische Einsatz liegt in der Routine, nicht im großen Wurf. Ein Bäcker kündigt das Wochenend-Sortiment an. Ein Handwerker zeigt ein fertiges Projekt. Ein Laden bewirbt eine Aktion. Eine Praxis erklärt eine neue Öffnungszeit.

Das sind kleine, häufige Aufgaben, für die sich bisher kein Videodreh gelohnt hat und die deshalb meist liegengeblieben sind. Mit einem Werkzeug, das aus einem Foto und einem Satz in Minuten einen Clip baut, verschiebt sich diese Rechnung. Was vorher zu aufwändig war, wird zur Sache von Minuten.

Dazu kommt der Ort, an dem das Werkzeug sitzt. Weil Gemini Omni Flash direkt in YouTube Shorts und der Create-App steckt, entsteht der Clip dort, wo er auch veröffentlicht wird. Du musst nicht zwischen Programmen springen, sondern beschreibst, lädst ein Foto hoch und stellst online. Diese kurze Strecke vom Einfall bis zum fertigen Post ist für einen Betrieb ohne Marketing-Abteilung oft entscheidender als die reine Bildqualität.

Einordnen sollte man Omni gegenüber dem Rest der Gemini-Familie. Gemini 3.5 Flash, das Google im selben Zeitraum vorgestellt hat, ist das Modell für Text und Denken. Omni ist die Video-Schiene. Beides läuft unter dem Namen Gemini, erfüllt aber unterschiedliche Zwecke.

Worauf du achten solltest

Auch ein einfaches Werkzeug hat Pflichten im Schlepptau. Wer Bilder oder Stimmen einspeist, muss die Rechte daran haben. Ein fremdes Foto, ein bekannter Song, ein Gesicht ohne Einwilligung, das kann teuer werden.

Dazu kommt die Kennzeichnung. KI-erzeugte oder stark veränderte Inhalte unterliegen wachsenden Transparenzpflichten, und Plattformen verlangen zunehmend eine Markierung. Wer ehrlich kennzeichnet, dass ein Clip mit KI entstanden ist, steht auf der sicheren Seite und verspielt kein Vertrauen.

Was das für KMU bedeutet

Video war lange ein Luxus, den sich nur Betriebe mit Marketing-Budget leisten konnten. Ein Werkzeug, das kurze Clips kostenlos aus Foto und Text baut, öffnet dieses Format auch für den Ein-Mann-Betrieb. Das ist die eigentliche Nachricht, weniger die Technik dahinter.

Die Erwartung sollte trotzdem nüchtern bleiben. Zehn Sekunden, einfache Szenen, kein Ersatz für eine echte Geschichte über deinen Betrieb. Wer das als Werkzeug für Routine-Posts begreift und nicht als Wundermaschine, wird zufrieden sein.

Wir sehen bei unseren Teilnehmern, dass der erste Clip oft die größte Hürde ist und danach die Scheu schnell verfliegt. Wichtig ist, das Werkzeug in eine kleine Routine einzubauen, statt einmal zu spielen und es dann zu vergessen. Wie du KI fest in deine Marketing-Abläufe einbaust und dabei Rechte und Kennzeichnung im Blick behältst, zeigen wir im Vollkurs Digitalisierungsmanager.

Häufige Fragen

Was ist Gemini Omni?

Gemini Omni ist Googles KI, die aus Text, Bildern und Ton kurze Videos erzeugt. Google hat sie auf der Entwicklerkonferenz I/O am 19. Mai 2026 vorgestellt. Die erste Variante, Gemini Omni Flash, denkt über die Eingaben hinweg und baut daraus ein zusammenhängendes Video statt sie nur aneinanderzuhängen.

Ist Gemini Omni kostenlos nutzbar?

Ja, in Grenzen. Gemini Omni Flash läuft kostenlos in YouTube Shorts und der YouTube-Create-App und ist in den Bezahlstufen Google AI Plus, Pro und Ultra enthalten. Wer ohnehin Kurzvideos auf YouTube veröffentlicht, hat das Werkzeug bereits in der Hand.

Wie lang dürfen die Videos sein?

Zum Start sind die erzeugten Clips auf zehn Sekunden begrenzt. Bild- und Ton-Ausgabe als eigene Formate stehen laut Google auf der Roadmap, gehören aber noch nicht zum Start. Für kurze Social-Media-Clips reicht das, für einen abendfüllenden Imagefilm nicht.

Worauf muss ich bei KI-Videos achten?

Du brauchst die Rechte an allem, was du einspeist, also keine fremden Fotos, kein bekannter Song und kein Gesicht ohne Einwilligung. Dazu kommt die Kennzeichnung: KI-erzeugte Inhalte unterliegen wachsenden Transparenzpflichten, und eine ehrliche Markierung schützt das Vertrauen deiner Kunden.

Mehr über KI im Mittelstand lernen?

Im kostenlosen KI-Schnupperkurs zeigen wir in fünf Lektionen, wie kleine und mittlere Firmen KI praktisch einsetzen. Vollkurs Digitalisierungsmanager mit Bildungsgutschein. Förderwege: Bildungsgutschein, QCG und AFBG im Vergleich.


Zuletzt aktualisiert: 08.06.2026. Stand der Recherche: 08.06.2026.