Google hat Gemini 3.5 Flash am 19. Mai 2026 zur General Availability gebracht und seit dem 8. Juni 2026 als Enterprise-Default verankert. Parallel läuft die Public Preview der Managed Agents API mit dem Antigravity-Agenten als erstem allgemeinen Vertreter. Damit setzt Google offensiv auf autonome Agenten in isolierten Sandboxes.
Auf der Google I/O am 19. Mai 2026 hat das Unternehmen seine Gemini-Familie neu sortiert. Gemini 3.5 Flash ist seither die GA-Version, also produktiv freigegeben. Ab dem 8. Juni 2026 ist sie in der Enterprise-Variante nicht mehr abschaltbar, sie ist der Default. Gleichzeitig hat Google die Managed Agents API in die Public Preview gehoben und mit Antigravity eine agentische Entwicklerplattform gestartet, die Code schreibt, Aufgaben plant und im Browser arbeitet.
Gemini 3.5 Flash ist jetzt nicht mehr abwählbar
Google sagt in den Enterprise-Release-Notes klar, was das für Bestandskunden heißt. Der Feature-Toggle, mit dem sich Gemini 3.5 Flash bisher deaktivieren ließ, verschwindet am 8. Juni 2026. Danach ist das Modell aktiv, immer. Wer auf einer älteren Version Workflows gebaut hat, muss sie auf der neuen Generation testen.
Die Benchmarks, die Google zur GA mitliefert, liegen auf Augenhöhe mit deutlich größeren Modellen. Terminal-Bench 2.1 bei 76,2 Prozent. GDPval-AA bei 1656 Elo. MCP Atlas bei 83,6 Prozent. Multimodales Lesen, gemessen mit CharXiv, bei 84,2 Prozent.
Praktisch interessant ist der Preis. Google gibt die Kosten als "oft weniger als die Hälfte vergleichbarer Modelle" an. Für agentische Workflows, in denen ein Modell hunderte Schritte ausführt, ist das nicht kosmetisch, sondern eine reale Hebel auf das Budget.
Wer KI-Kosten im Monatsbericht stehen hat, kennt das Problem. Drei Wochen mit dem großen Modell, das fast jede Aufgabe erfüllt, ergibt am Monatsende einen Posten, der schwer zu rechtfertigen ist. Mit einem Flash-Modell, das auf agentischen Aufgaben mithält, verlagert sich das Verhältnis. Wir sehen in unseren KMU-Projekten, dass Teams häufig zwischen zwei Modellgrößen pendeln, abhängig von der Aufgabe. Gemini 3.5 Flash macht diese Pendelei einfacher.
Gemini 3.5 Pro ist parallel im Test und soll im Juli 2026 folgen.
Managed Agents API: einmal ausrollen, von Google gehostet
Der eigentliche strategische Schritt steckt nicht im Flash-Update, sondern in der Managed Agents API. Sie ist seit der I/O in Public Preview, also offen testbar, aber noch nicht garantiert stabil.
Die Idee ist einfach. Du beschreibst einen Agenten, deployst ihn mit einem einzigen API-Call und Google hostet ihn in einer abgeschirmten Umgebung. Der Agent kann dort Code ausführen, Tools aufrufen, Schritte planen und Zwischenergebnisse halten. Du brauchst keine eigene Infrastruktur, keine eigenen Container, keine eigene Sandbox-Logik.
Sicherheits- und Datenschutz-Garantien erbt der Agent von der Agent-Platform. Das heißt, Datenschutz, Governance und Sicherheitsregeln, die du für deine Google-Cloud-Umgebung gesetzt hast, gelten auch für den Agenten.
Für eine kleine Firma, die bisher keine ernsthafte Agenten-Plattform betreiben konnte, ist das eine Vereinfachung. Statt selbst zu betreiben, was Anthropic mit Claude Code oder OpenAI mit der Assistants API ebenfalls anbietet, gibst du das Hosting an Google ab.
Die Kehrseite kennst du, sobald du sie ausgesprochen hast. Wer den Agenten bei Google betreibt, gibt Daten an Google, akzeptiert Googles AGB und ist im Krisenfall an Googles Verfügbarkeit gebunden. Wer das nicht will, sollte die Managed-Agents-API als Werkzeug einordnen, nicht als Strategie.
Antigravity, die agentische Entwicklerplattform
Antigravity ist das Schaufenster-Produkt der Managed Agents. Google positioniert den Agenten als agentische Entwicklerplattform mit Code-Schwerpunkt, nicht als Office-Universalagenten. Er plant Aufgaben, schließt aus Zwischenergebnissen weiter, schreibt und führt Code aus, verwaltet Dateien und browst im Web. Alles in einer isolierten Umgebung, die nach der Sitzung verschwindet.
Google hat parallel die Antigravity 2.0 Desktop App und die Antigravity CLI ausgerollt. Die Desktop App ist eine Steuerungs-Oberfläche für Teams, die mehrere Agenten parallel orchestrieren. Die CLI ist die Variante für Entwickler, die Agenten in eigenen Build-Pipelines aufrufen.
Im Gemini-Enterprise-Kontext rollt Antigravity in den kommenden Monaten über die Agent Platform aus. Bis dahin ist es ein Testfeld, kein Produktivsystem.
Bemerkenswert ist die Positionierung. Google trennt klar zwischen dem Modell, das Antworten gibt, und dem Agenten, der Handlungen ausführt. Bei Anthropic verschwimmt die Grenze in Claude Code. Bei OpenAI mischt sich beides in der Assistants API. Google macht aus der Trennung ein Produkt-Konzept. Das ist für KMU einfacher zu verstehen, weil die Risikoabwägung beim Agenten anders ausfallen darf als beim Chat.
Was sich gleichzeitig in der Gemini-App ändert
Neben den Server-Features hat Google die Gemini-App für Endkunden überarbeitet. Die wichtigsten Änderungen im Schnelldurchlauf, weil sie in vielen KMU im Alltag auftauchen.
Daily Brief ist eine personalisierte Tagesübersicht, die Inbox, Kalender und Aufgaben kombiniert. Sie rollt zuerst für US-Nutzer aus, die Google AI abonniert haben.
Gemini Spark ist ein cloud-basierter 24/7-Agent, der auch läuft, wenn das Telefon des Nutzers gesperrt ist. Er ist im Test für Google AI Ultra. Klingt nach Bequemlichkeit, sollte aber in einem KMU-Umfeld erst einmal nicht produktiv genutzt werden, solange Datenflusspfade unklar sind.
Gemini Omni ist ein Videomodell, das aus Prompts mit Bild und Audio Videos generiert. Es geht zunächst in Google Flow und YouTube Shorts.
Die App selbst trennt Antworten stärker. Wichtige Informationen stehen fett oben, Details darunter. Für Nutzer, die in der Hektik scannen statt lesen, ist das ein spürbarer Unterschied.
MCP-Anbindung und das größere Bild
In den Benchmarks zur GA taucht ein Detail auf, das in der Berichterstattung gerne untergeht. Gemini 3.5 Flash erreicht 83,6 Prozent im MCP Atlas. Das Model Context Protocol, kurz MCP, ist der Industrie-Standard für die Integration von KI-Modellen mit Werkzeugen und Datenquellen. Es läuft seit Dezember 2025 unter der Linux Foundation.
Wer als KMU bereits MCP-Server für Buchhaltung, CRM oder Helpdesk eingebunden hat, kann Gemini 3.5 Flash mit denselben Tools nutzen, ohne sie umzubauen. Das ist die unsichtbare Konsolidierung, die im Markt gerade läuft. Anbieter konkurrieren weiter über Modelle und Agenten, aber der Klebstoff dazwischen wird zum Standard.
Was das für KMU bedeutet
Der Managed-Agents-Schritt ist der eigentliche Stresstest für kleine und mittlere Firmen, nicht das Flash-Update. Ein Agent, der Schritte plant, Code schreibt, Dateien anfasst und im Web surft, hat eine völlig andere Risikodimension als ein Chatbot, der Antworten gibt. Wir sehen in den DigiMan-Modulen zu Prozessautomatisierung regelmäßig, dass der Sprung vom Werkzeug zum Agenten genau dort scheitert, wo die Organisation nie geklärt hat, wer für Agenten-Aktionen verantwortlich ist. Wer das in den Pilotphasen nicht festlegt, holt das später mit Schmerzen nach.
Konkret heißt das für die nächsten Wochen, dass Bestandskunden auf Google Workspace prüfen sollten, was sich am 8. Juni 2026 in ihrer Konfiguration ändert. Wer Gemini bisher abgewählt hatte, hat keine Wahl mehr. Wer Workflows gebaut hat, sollte sie auf 3.5 Flash gegentesten, weil die Antwort-Stile und Token-Verbräuche anders sein können als auf der Vorgängerversion.
Antigravity dagegen ist nichts, was im Mittelstand morgen produktiv läuft. Es ist das Signal, in welche Richtung sich der Markt 2026 entwickelt, und es lohnt sich, das frühzeitig zu verstehen. Wer Mitarbeiter hat, die in den nächsten zwölf Monaten Agenten in Prozesse einbinden sollen, sollte das jetzt qualifizieren, nicht erst, wenn der Wettbewerb es schon tut.
Haeufige Fragen
Wann ist Gemini 3.5 Flash Enterprise-Default geworden?
Google hat Gemini 3.5 Flash am 19. Mai 2026 auf der Google I/O zur General Availability gebracht. Seit dem 8. Juni 2026 ist es in der Enterprise-Variante der Default und nicht mehr abwählbar. Der Feature-Toggle, mit dem sich das Modell vorher deaktivieren liess, ist seit diesem Stichtag entfernt. Wer auf älterer Version Workflows hat, muss gegentesten.
Was kostet Gemini 3.5 Flash im Vergleich?
Google gibt die Kosten als oft weniger als die Hälfte vergleichbarer Modelle an. Für agentische Workflows mit hunderten Schritten ist das ein realer Budget-Hebel. Bei den Benchmarks erreicht 3.5 Flash 76,2 Prozent im Terminal-Bench 2.1, 1656 Elo im GDPval-AA, 83,6 Prozent im MCP Atlas und 84,2 Prozent im multimodalen Lesen via CharXiv.
Was ist die Managed Agents API von Google?
Die Managed Agents API ist seit der I/O 2026 in Public Preview. Du beschreibst einen Agenten und Google hostet ihn in einer abgeschirmten Sandbox-Umgebung. Der Agent kann dort Code ausführen, Tools aufrufen, Schritte planen und Zwischenergebnisse halten. Du brauchst keine eigene Infrastruktur. Datenschutz und Sicherheitsregeln erbt der Agent von der Plattform.
Was ist der Unterschied zwischen Antigravity und Gemini Spark?
Antigravity ist das Schaufenster der Managed Agents: eine agentische Entwicklerplattform, die Code schreibt, Aufgaben plant und im Browser arbeitet. Es gibt eine Desktop-App und eine CLI. Gemini Spark ist ein cloud-basierter 24/7-Agent für Endkunden im Google AI Ultra Test, der auch läuft, wenn das Telefon gesperrt ist. Beide sind aktuell kein Produktivsystem für KMU.
Mehr über KI im Mittelstand lernen?
Im kostenlosen KI-Schnupperkurs zeigen wir in fünf Lektionen, wie kleine und mittlere Firmen KI praktisch einsetzen. Vollkurs Digitalisierungsmanager mit Bildungsgutschein. Förderwege: Bildungsgutschein und QCG im Vergleich.
Zuletzt aktualisiert: 04.06.2026. Stand der Recherche: 04.06.2026.