ChatGPT Codex bekommt Multiagent-Subagents: Das aendert sich (Mai 2026)

Auf einen Blick: OpenAI Codex unterstützt seit Mai 2026 bis zu acht parallele Subagents pro Developer. Die Codex CLI ist in General Availability. Multiagent lohnt sich für parallele Test-Generierung, Refactor-Splits und Doku-plus-Code-Workflows. Bei parallelen Schreib-Zugriffen aufs selbe Repo riskieren Subagents allerdings Konflikte.

Multiagent-Programmierung war bisher eine Sache von Spezial-Stacks wie Claude Code oder eigenen Orchestrierungs-Loesungen über n8n. Mit dem Mai-2026-Update zieht OpenAI Codex nach: bis zu 8 Subagents pro Developer, die parallel an Code-Aufgaben arbeiten können.

Die 8er-Grenze ist ein interessanter Cutoff. Sie ist hoch genug, dass praktisch alle sinnvollen Parallelisierungs-Szenarien für einen Solo-Developer abgedeckt sind. Sie ist niedrig genug, dass OpenAI die Compute-Last kalkulieren kann. Wir schauen, was das in der Praxis bedeutet, wo Multiagent in Codex sinnvoll ist und wo nicht, und wie das im Vergleich zu Claudes Subagent-Modell wirkt.

Was Mai 2026 neu war

OpenAI hat im Mai 2026 zwei Änderungen am Codex-Stack veröffentlicht. Erstens: die Codex CLI ist in General Availability. Sie laeuft jetzt nicht mehr als Beta, sondern als regulaeres Produkt für alle ChatGPT-Pro-Nutzer. Zweitens: Multiagent-Subagents bis 8 pro Developer.

Codex laeuft auf einer GPT-5.5-Codex-Variante, einem für Coding optimierten Long-Term-Support-Modell. Das ist nicht der ChatGPT-Default, sondern ein eigener Code-Pfad mit angepasster Tokenizer-Strategie und Tool-Use-Kalibrierung. Wer Codex schon vorher genutzt hat, merkt das beim Output: die Antworten sind praeziser im Code, weniger gepraegt von Stil-Floskeln.

Die Multiagent-Architektur funktioniert über einen Lead-Codex-Agent, der die Aufgabe in Teilaufgaben zerlegt und an Subagents delegiert. Jeder Subagent hat sein eigenes Kontextfenster, seine eigenen Tools und kann unabhängig arbeiten. Die Subagents schreiben auf ein gemeinsames Repo-Filesystem, das für alle sichtbar ist.

Wann Multiagent in Codex sich lohnt

Multiagent ist kein Default-Modus. Du aktivierst es bewusst für Aufgaben, die sich parallelisieren lassen. Drei Profile, in denen das sich lohnt:

Parallele Test-Generierung. Wenn du für 20 Funktionen Unit-Tests brauchst, kannst du das nicht in einem großen Prompt verarbeiten. Mit Multiagent laeuft das in vier parallelen Subagents, jeder kuemmert sich um 5 Funktionen. Statt 20 Minuten sequenziell bist du in 6 Minuten durch. Die Tests sind getrennt erzeugt, also ohne Cross-Contamination zwischen den Funktions-Kontexten.

Refactor-Splits. Ein größerer Refactor (z.B. ein Library-Upgrade von 2.x auf 3.x quer durchs Repo) zerfaellt natuerlich in unabhängige Teilaufgaben: API-Aufruf-Aktualisierungen, Test-Updates, Doku-Updates, Migrations-Skripte. Multiagent kann die parallel anpacken. Voraussetzung: die Teilaufgaben sind wirklich unabhängig und schreiben nicht in dieselben Dateien.

Doku plus Code parallel. Solo-Entwickler, die nach jeder Feature-Implementierung auch die Dokumentation aktualisieren wollen, können einen Subagent für den Code laufen lassen und einen zweiten für die Doku. Das spart kein Geld, aber Zeit, weil beide parallel arbeiten.

In allen drei Faellen ist die Voraussetzung: die parallelen Aufgaben sind sauber abgegrenzt. Wer Multiagent in einer Aufgabe einsetzt, die im Kern sequenziell ist (z.B. ein Schritt-für-Schritt-Debug-Prozess), verliert mehr, als er gewinnt.

Die 8er-Grenze im Detail

OpenAI hat die harte Grenze bewusst gewählt. Bei mehr als 8 parallelen Subagents werden zwei Probleme gleichzeitig akut: erstens explodieren die Kosten, weil jeder Subagent eigene API-Calls produziert. Zweitens entstehen Datei-Konflikte im gemeinsamen Repo-Filesystem, wenn mehrere Subagents an ähnlichen Stellen arbeiten.

8 parallele Subagents heißt in der Praxis: ein Solo-Developer kann eine Aufgabe in bis zu 8 Streams aufteilen, ohne dass die Konfliktrate stark ansteigt. Das passt zum typischen Setup, in dem Codex genutzt wird (Solo-Entwickler, Kleine Teams, individueller Workflow). Wer 16 parallele Streams braucht, ist sowieso in einem Stack, wo Codex nicht das richtige Werkzeug ist.

Praktischer Effekt: wer Multiagent nutzt, sollte vorher die Aufgaben so zuschneiden, dass sie maximal 8 unabhängige Teilstuecke ergeben. Wenn du 20 Test-Files generieren willst, fasst du sie in 4 bis 6 Bundles zu je 3 bis 5 Files zusammen. Das ist effizienter, als 20 Subagents zu wünschen, die nicht gehen.

Codex gegen Claude im Subagent-Modell

Anthropic hat im Mai 2026 ebenfalls Subagents für Claude Code und Managed Agents bekannt gegeben. Die Architekturen unterscheiden sich strukturell, und ein Direktvergleich lohnt sich.

Eigenschaft	OpenAI Codex (Mai 2026)	Claude Subagents (Mai 2026)
Maximale parallele Subagents	8 pro Developer (harte Grenze)	keine harte Grenze, Rate-Limits steigen mit Subagent-Anzahl
Subagent-Tool-Config	gemeinsame Tools, eigene Kontexte	je Subagent eigenes Modell, eigener Prompt, eigene Tools
Token-Verbrauch	tendenziell niedriger pro Task (öffentliche Benchmarks)	tendenziell höher pro Task (öffentliche Benchmarks)
Filesystem	gemeinsames Repo-Filesystem, Konflikt-Risiko bei parallelen Schreib-Zugriffen	gemeinsames Filesystem, in der Claude Console rückverfolgbar
Verfuegbarkeit	Codex CLI in GA, Plus 20 USD oder Pro 200 USD pro Monat	Claude Code in den Anthropic Tarifen, plus API-Zugang
Orchestrierungs-Modell	Lead-Codex delegiert an Subagents	Lead-Agent delegiert an Specialist-Subagents

Die Frage "welches ist besser" stellt sich nicht. Wer schon im OpenAI-Stack arbeitet, hat mit Codex weniger Reibung. Wer im Anthropic-Stack arbeitet (etwa weil Opus 4.8 bei langen Code-Reviews schon der Default ist), bleibt bei Claude. Eine Migration von einem Subagent-Modell zum anderen lohnt sich in der Regel nicht, weil die Architekturen ähnlich genug sind, dass der Performance-Unterschied vom Workflow abhängt, nicht vom Tool.

Praxis-Beispiel: Software-Agentur Heinrich, Stuttgart

Software-Agentur Heinrich (18 Mitarbeiter, Web-Apps für Mittelstand) hatte vor dem Mai-Update einen typischen Solo-Workflow mit Codex Plus-Lizenz für den Senior-Developer. Pro Tag wurden etwa 4 bis 6 Stunden mit Codex gearbeitet, vor allem für Code-Reviews und Refactor-Vorschlaege.

Nach dem Update auf Multiagent hat der Senior-Developer einen Multi-Agent-Workflow gebaut: für jeden Pull Request laufen drei Subagents parallel. Subagent 1 prüft den Code auf Bugs und Edge Cases. Subagent 2 prüft auf Performance-Probleme. Subagent 3 prüft auf Doku-Konsistenz. Jeder Subagent schreibt sein Review in ein eigenes Markdown-File im Repo.

Effekt nach drei Wochen: die Code-Review-Zeit pro PR ist von durchschnittlich 35 Minuten auf 12 Minuten gesunken. Die Anzahl der gefundenen Bugs pro Review ist gleich geblieben (kein Verlust an Qualität). Die monatlichen API-Kosten sind um etwa 22 Prozent gestiegen, weil drei Subagents pro PR mehr Tokens verbrauchen als ein sequenzieller Review.

Geschäftliche Bilanz: 22 Prozent mehr API-Kosten gegen 65 Prozent weniger Reviewer-Zeit. Bei einem Stunden-Mix-Satz von 110 Euro für den Senior-Developer ist das ein klarer Gewinn. Heinrich hat den Workflow inzwischen auf zwei weitere Developer ausgerollt.

Wichtig dabei: die drei Subagents schreiben in unterschiedliche Dateien. Die Konflikt-Frage stellt sich nicht. Wer Multiagent so einsetzt, dass mehrere Subagents in dieselbe Datei schreiben wollen, baut sich Probleme ein, die er vorher nicht hatte.

Wo Multiagent in Codex schiefgeht

Wer das unterschaetzt, baut sich Race-Conditions ins Repo. Drei typische Fallen, die wir in Beratungs-Mandaten gesehen haben:

Erstens: zwei Subagents bekommen Aufgaben, die im Detail unabhängig wirken, aber an einer zentralen Konfigurationsdatei hängen (z.B. settings.py oder config.json). Beide schreiben gleichzeitig, einer überschreibt den anderen. Die Aufgaben sind erledigt, aber die Konfiguration ist kaputt.

Zweitens: die Lead-Aufgabe wird zu fein zerlegt. 16 Subagents für 16 Funktionen erscheinen logisch, gehen aber wegen der 8er-Grenze nicht. Codex meldet das nicht immer eindeutig, sondern reduziert die Aufgabe still auf die ersten 8. Die restlichen 8 bleiben unbearbeitet, ohne dass der Developer es merkt, bis er die Tests laufen lässt.

Drittens: Multiagent wird in sequenziellen Aufgaben verwendet. Ein klassisches Beispiel: ein Debug-Workflow, in dem Schritt 2 von Schritt 1 abhängt. Wer das parallelisiert, bekommt drei Subagents, die alle auf den Ausgangsstand reagieren, ohne die Korrekturen des jeweils anderen zu sehen. Das Ergebnis ist Datenmuell.

Aus den eigenen Beratungsmandaten wissen wir: die teuerste Fehlannahme ist, Multiagent als allgemeines Beschleunigungs-Tool zu verstehen. Multiagent ist ein Werkzeug für parallelisierbare Aufgaben. Wer sequenzielle Aufgaben damit angeht, baut sich neue Bugs.

Wann du nicht auf Multiagent umstellen solltest

Wer alleine arbeitet und Codex ohnehin nur für einfache Auto-Complete-Aufgaben nutzt, gewinnt durch Multiagent wenig. Die 22 Prozent Mehrkosten an API rechnen sich nicht, wenn die Aufgaben in einer einzigen Codex-Session schon erledigt waren.

Wer in einem Stack arbeitet, in dem Claude Code schon der Default ist (etwa weil das Team mit Anthropic-Stacks vertraut ist), sollte nicht aus Pflichtgefuehl auf Codex umsteigen. Beide Subagent-Modelle leisten in der Praxis vergleichbare Dinge. Die Migration kostet Einarbeitung und liefert keinen signifikanten Vorteil. Hintergrundinfos zu Codex sind im Codex-Erklärungs-Artikel zu finden, zum Anthropic-Pendant in der Anleitung zur Claude-Code-Einführung im Unternehmen.

Wer in einem Team mit mehr als 5 Developern arbeitet, sollte vor dem Rollout mit dem Team klären, wer Multiagent in welchen Workflows einsetzt. Sonst entstehen Konflikte im Repo, die vorher nicht da waren. Die Investitions-Frage ist nicht "lohnt sich das Tool", sondern "passt der neue Workflow in unsere Code-Kultur".

Was du jetzt konkret tun kannst

Zwei Schritte, mit denen du das Update für dich validieren kannst, bevor du es in den Alltag übernimmst.

Schritt 1: identifiziere eine konkrete parallelisierbare Aufgabe in deinem aktuellen Workflow. Beispiele: alle Funktionen einer Klasse mit Unit-Tests versehen, ein Library-Upgrade über mehrere Files durchziehen, eine Doku für 12 API-Endpoints schreiben. Wichtig: die Teilaufgaben müssen unabhängig sein.

Schritt 2: setze diese eine Aufgabe mit Multiagent um (4 bis 6 Subagents). Notiere die reine Bearbeitungszeit, die API-Kosten und die Anzahl gefundener Bugs nach Vergleich mit deinem bisherigen sequenziellen Workflow. Nach 3 bis 5 solchen Aufgaben hast du belastbare Daten und kannst entscheiden, ob Multiagent für dein Setup passt.

Aus unserer Beratungserfahrung: bei Solo-Entwicklern mit klar definierten parallelisierbaren Aufgaben rechnet sich der Workflow fast immer. Bei Teams mit gemischten Workflows und unklarem Repo-Standard rechnet er sich nicht automatisch. Die Differenz liegt nicht im Tool, sondern in der Arbeitsorganisation davor.

Wer KI-Coding-Tools zum ersten Mal systematisch einsetzen will, ohne sich auf einen Anbieter festzulegen, kann mit unserem Digitalisierungsmanager den vollen Stack durcharbeiten. Die 4-monatige Vollzeit-Weiterbildung ist über Bildungsgutschein oder Qualifizierungschancengesetz förderfähig und behandelt sowohl Codex als auch Claude Code in den Praxis-Modulen.

Häufige Fragen

Brauche ich Codex Pro für die Multiagent-Funktion?

Ja, in der Praxis schon. Codex ist auf Plus (20 USD pro Monat) und Pro (200 USD pro Monat) verfuegbar. Plus hat aber niedrigere Limits, die bei mehreren Subagents schneller erreicht werden. Wer Multiagent ernsthaft nutzen will (z.B. für Code-Reviews mit drei parallelen Subagents), kommt mit Plus regelmäßig ans Limit. Pro lohnt sich, sobald du mehr als 5 Multiagent-Aufgaben pro Tag laufen lässt.

Kann ich die 8er-Grenze umgehen?

Nein, die Grenze ist hardcoded. Wenn du mehr parallele Streams brauchst, musst du die Aufgaben in mehrere Multiagent-Runs nacheinander aufteilen. Zwei Runs mit jeweils 8 Subagents sind möglich, aber nicht ein Run mit 16 Subagents. Die Grenze ist bewusst gewählt, um Race-Conditions im Filesystem zu vermeiden.

Was passiert, wenn zwei Subagents in dieselbe Datei schreiben?

Codex hat aktuell keine automatische Konflikt-Aufloesung. Wenn zwei Subagents in dieselbe Datei schreiben, gewinnt der zweite Write-Vorgang, der erste ist verloren. OpenAI empfiehlt deshalb explizit, Aufgaben so zuzuschneiden, dass jeder Subagent in eigene Files schreibt. Vor einem Multiagent-Run hilft eine kurze Plan-Phase im Lead-Agent: "Welche Files wird welcher Subagent anfassen?"

Wie unterscheidet sich Codex von Claude Code in der Multiagent-Architektur?

Codex hat eine harte Grenze von 8 Subagents pro Developer und eine eher gemeinsame Tool-Config. Claude Code hat keine harte Grenze, dafür steigen die Rate-Limits mit der Anzahl der Subagents. Codex tendiert zu geringerem Token-Verbrauch pro Task, Claude tendiert zu mehr Tokens. Welches in deinem Workflow besser passt, hängt vom Setup ab. Wer schon mit einem der beiden arbeitet, wechselt selten.

Lohnt sich der Wechsel von sequenziellem Codex zu Multiagent?

Bei parallelisierbaren Aufgaben fast immer ja, bei sequenziellen Aufgaben fast immer nein. Praktischer Test: nimm 5 typische Aufgaben aus deinem Workflow und stuf jede ein (parallel oder sequenziell). Wenn 3 oder mehr parallelisierbar sind, lohnt sich Multiagent. Wenn weniger, bleibst du beim bisherigen Workflow.

Über den Autor

Dr. Jens Aichinger ist promovierter Wirtschaftspädagoge und Gründer von SkillSprinters, einem DEKRA-AZAV-zertifizierten Bildungsträger. Er hat über 70 Sachbücher auf Amazon KDP veröffentlicht und beraet KMU und Selbstständige zu KI-Einsatz, Fördermitteln und Weiterbildung.

Bereit für den nächsten Schritt? Lerne in einem kostenlosen 5-Lektionen-Schnupperkurs, wie du KI im Berufsalltag einsetzt. Komplett online, ohne Vorkenntnisse. Jetzt anmelden.

Zuletzt geprüft am 22. Mai 2026. Quellen: OpenAI-Blog (Mai 2026), Anthropic-Blog (Mai 2026), Codex CLI Release Notes.

Bereit für deinen nächsten Karriereschritt?

Lass dich kostenlos beraten. Wir finden die passende Weiterbildung und Förderung für dich.

Weiterbildung ansehen WhatsApp

ChatGPT Codex bekommt Multiagent-Subagents: Das aendert sich (Mai 2026)

Was Mai 2026 neu war

Wann Multiagent in Codex sich lohnt

Die 8er-Grenze im Detail

Codex gegen Claude im Subagent-Modell

Praxis-Beispiel: Software-Agentur Heinrich, Stuttgart

Wo Multiagent in Codex schiefgeht

Wann du nicht auf Multiagent umstellen solltest

Was du jetzt konkret tun kannst

Häufige Fragen

Brauche ich Codex Pro für die Multiagent-Funktion?

Kann ich die 8er-Grenze umgehen?

Was passiert, wenn zwei Subagents in dieselbe Datei schreiben?

Wie unterscheidet sich Codex von Claude Code in der Multiagent-Architektur?

Lohnt sich der Wechsel von sequenziellem Codex zu Multiagent?

Über den Autor

Bereit für deinen nächsten Karriereschritt?

Das könnte dich auch interessieren

Claude Cache Diagnostics: So findest du teure Cache-Misses in der API (Beta seit Mai 2026)

Claude Cowork: Die 15 Skills im Detail, was funktioniert in DACH ohne QuickBooks?

Gemini 3.5 Flash für Unternehmen: MCP-Connector, Notion-Integration, Agentic (Mai 2026)

GPT-5.5 Instant ist der neue ChatGPT-Default: Was sich ändert (Mai 2026)

ChatGPT verbindet US-Banken: Was deutsche Nutzer rechtlich wissen sollten

Claude Managed Agents: Dreaming und Multiagent-Orchestrierung erklärt (Mai 2026)

Wir nutzen Cookies