Auf einen Blick: OpenAI Codex unterstützt seit Mai 2026 bis zu acht parallele Subagents pro Developer. Die Codex CLI ist in General Availability. Multiagent lohnt sich für parallele Test-Generierung, Refactor-Splits und Doku-plus-Code-Workflows. Bei parallelen Schreib-Zugriffen aufs selbe Repo riskieren Subagents allerdings Konflikte.
Multiagent-Programmierung war bisher eine Sache von Spezial-Stacks wie Claude Code oder eigenen Orchestrierungs-Loesungen über n8n. Mit dem Mai-2026-Update zieht OpenAI Codex nach: bis zu 8 Subagents pro Developer, die parallel an Code-Aufgaben arbeiten können.
Die 8er-Grenze ist ein interessanter Cutoff. Sie ist hoch genug, dass praktisch alle sinnvollen Parallelisierungs-Szenarien für einen Solo-Developer abgedeckt sind. Sie ist niedrig genug, dass OpenAI die Compute-Last kalkulieren kann. Wir schauen, was das in der Praxis bedeutet, wo Multiagent in Codex sinnvoll ist und wo nicht, und wie das im Vergleich zu Claudes Subagent-Modell wirkt.
Was Mai 2026 neu war
OpenAI hat im Mai 2026 zwei Änderungen am Codex-Stack veröffentlicht. Erstens: die Codex CLI ist in General Availability. Sie laeuft jetzt nicht mehr als Beta, sondern als regulaeres Produkt für alle ChatGPT-Pro-Nutzer. Zweitens: Multiagent-Subagents bis 8 pro Developer.
Codex laeuft auf einer GPT-5.5-Codex-Variante, einem für Coding optimierten Long-Term-Support-Modell. Das ist nicht der ChatGPT-Default, sondern ein eigener Code-Pfad mit angepasster Tokenizer-Strategie und Tool-Use-Kalibrierung. Wer Codex schon vorher genutzt hat, merkt das beim Output: die Antworten sind praeziser im Code, weniger gepraegt von Stil-Floskeln.
Die Multiagent-Architektur funktioniert über einen Lead-Codex-Agent, der die Aufgabe in Teilaufgaben zerlegt und an Subagents delegiert. Jeder Subagent hat sein eigenes Kontextfenster, seine eigenen Tools und kann unabhängig arbeiten. Die Subagents schreiben auf ein gemeinsames Repo-Filesystem, das für alle sichtbar ist.
Wann Multiagent in Codex sich lohnt
Multiagent ist kein Default-Modus. Du aktivierst es bewusst für Aufgaben, die sich parallelisieren lassen. Drei Profile, in denen das sich lohnt:
Parallele Test-Generierung. Wenn du für 20 Funktionen Unit-Tests brauchst, kannst du das nicht in einem großen Prompt verarbeiten. Mit Multiagent laeuft das in vier parallelen Subagents, jeder kuemmert sich um 5 Funktionen. Statt 20 Minuten sequenziell bist du in 6 Minuten durch. Die Tests sind getrennt erzeugt, also ohne Cross-Contamination zwischen den Funktions-Kontexten.
Refactor-Splits. Ein größerer Refactor (z.B. ein Library-Upgrade von 2.x auf 3.x quer durchs Repo) zerfaellt natuerlich in unabhängige Teilaufgaben: API-Aufruf-Aktualisierungen, Test-Updates, Doku-Updates, Migrations-Skripte. Multiagent kann die parallel anpacken. Voraussetzung: die Teilaufgaben sind wirklich unabhängig und schreiben nicht in dieselben Dateien.
Doku plus Code parallel. Solo-Entwickler, die nach jeder Feature-Implementierung auch die Dokumentation aktualisieren wollen, können einen Subagent für den Code laufen lassen und einen zweiten für die Doku. Das spart kein Geld, aber Zeit, weil beide parallel arbeiten.
In allen drei Faellen ist die Voraussetzung: die parallelen Aufgaben sind sauber abgegrenzt. Wer Multiagent in einer Aufgabe einsetzt, die im Kern sequenziell ist (z.B. ein Schritt-für-Schritt-Debug-Prozess), verliert mehr, als er gewinnt.
Die 8er-Grenze im Detail
OpenAI hat die harte Grenze bewusst gewählt. Bei mehr als 8 parallelen Subagents werden zwei Probleme gleichzeitig akut: erstens explodieren die Kosten, weil jeder Subagent eigene API-Calls produziert. Zweitens entstehen Datei-Konflikte im gemeinsamen Repo-Filesystem, wenn mehrere Subagents an ähnlichen Stellen arbeiten.
8 parallele Subagents heisst in der Praxis: ein Solo-Developer kann eine Aufgabe in bis zu 8 Streams aufteilen, ohne dass die Konfliktrate stark ansteigt. Das passt zum typischen Setup, in dem Codex genutzt wird (Solo-Entwickler, Kleine Teams, individueller Workflow). Wer 16 parallele Streams braucht, ist sowieso in einem Stack, wo Codex nicht das richtige Werkzeug ist.
Praktischer Effekt: wer Multiagent nutzt, sollte vorher die Aufgaben so zuschneiden, dass sie maximal 8 unabhängige Teilstuecke ergeben. Wenn du 20 Test-Files generieren willst, fasst du sie in 4 bis 6 Bundles zu je 3 bis 5 Files zusammen. Das ist effizienter, als 20 Subagents zu wünschen, die nicht gehen.
Codex gegen Claude im Subagent-Modell
Anthropic hat im Mai 2026 ebenfalls Subagents für Claude Code und Managed Agents bekannt gegeben. Die Architekturen unterscheiden sich strukturell, und ein Direktvergleich lohnt sich.
| Eigenschaft | OpenAI Codex (Mai 2026) | Claude Subagents (Mai 2026) |
|---|---|---|
| Maximale parallele Subagents | 8 pro Developer (harte Grenze) | keine harte Grenze, Rate-Limits steigen mit Subagent-Anzahl |
| Subagent-Tool-Config | gemeinsame Tools, eigene Kontexte | je Subagent eigenes Modell, eigener Prompt, eigene Tools |
| Token-Verbrauch | tendenziell niedriger pro Task (öffentliche Benchmarks) | tendenziell hoeher pro Task (öffentliche Benchmarks) |
| Filesystem | gemeinsames Repo-Filesystem, Konflikt-Risiko bei parallelen Schreib-Zugriffen | gemeinsames Filesystem, in der Claude Console rückverfolgbar |
| Verfuegbarkeit | Codex CLI in GA, Plus 20 USD oder Pro 200 USD pro Monat | Claude Code in den Anthropic Tarifen, plus API-Zugang |
| Orchestrierungs-Modell | Lead-Codex delegiert an Subagents | Lead-Agent delegiert an Specialist-Subagents |
Die Frage "welches ist besser" stellt sich nicht. Wer schon im OpenAI-Stack arbeitet, hat mit Codex weniger Reibung. Wer im Anthropic-Stack arbeitet (etwa weil Opus 4.8 bei langen Code-Reviews schon der Default ist), bleibt bei Claude. Eine Migration von einem Subagent-Modell zum anderen lohnt sich in der Regel nicht, weil die Architekturen ähnlich genug sind, dass der Performance-Unterschied vom Workflow abhaengt, nicht vom Tool.
Praxis-Beispiel: Software-Agentur Heinrich, Stuttgart
Software-Agentur Heinrich (18 Mitarbeiter, Web-Apps für Mittelstand) hatte vor dem Mai-Update einen typischen Solo-Workflow mit Codex Plus-Lizenz für den Senior-Developer. Pro Tag wurden etwa 4 bis 6 Stunden mit Codex gearbeitet, vor allem für Code-Reviews und Refactor-Vorschlaege.
Nach dem Update auf Multiagent hat der Senior-Developer einen Multi-Agent-Workflow gebaut: für jeden Pull Request laufen drei Subagents parallel. Subagent 1 prüft den Code auf Bugs und Edge Cases. Subagent 2 prüft auf Performance-Probleme. Subagent 3 prüft auf Doku-Konsistenz. Jeder Subagent schreibt sein Review in ein eigenes Markdown-File im Repo.
Effekt nach drei Wochen: die Code-Review-Zeit pro PR ist von durchschnittlich 35 Minuten auf 12 Minuten gesunken. Die Anzahl der gefundenen Bugs pro Review ist gleich geblieben (kein Verlust an Qualitaet). Die monatlichen API-Kosten sind um etwa 22 Prozent gestiegen, weil drei Subagents pro PR mehr Tokens verbrauchen als ein sequenzieller Review.
Geschäftliche Bilanz: 22 Prozent mehr API-Kosten gegen 65 Prozent weniger Reviewer-Zeit. Bei einem Stunden-Mix-Satz von 110 Euro für den Senior-Developer ist das ein klarer Gewinn. Heinrich hat den Workflow inzwischen auf zwei weitere Developer ausgerollt.
Wichtig dabei: die drei Subagents schreiben in unterschiedliche Dateien. Die Konflikt-Frage stellt sich nicht. Wer Multiagent so einsetzt, dass mehrere Subagents in dieselbe Datei schreiben wollen, baut sich Probleme ein, die er vorher nicht hatte.
Wo Multiagent in Codex schiefgeht
Wer das unterschaetzt, baut sich Race-Conditions ins Repo. Drei typische Fallen, die wir in Beratungs-Mandaten gesehen haben:
Erstens: zwei Subagents bekommen Aufgaben, die im Detail unabhängig wirken, aber an einer zentralen Konfigurationsdatei hängen (z.B. settings.py oder config.json). Beide schreiben gleichzeitig, einer überschreibt den anderen. Die Aufgaben sind erledigt, aber die Konfiguration ist kaputt.
Zweitens: die Lead-Aufgabe wird zu fein zerlegt. 16 Subagents für 16 Funktionen erscheinen logisch, gehen aber wegen der 8er-Grenze nicht. Codex meldet das nicht immer eindeutig, sondern reduziert die Aufgabe still auf die ersten 8. Die restlichen 8 bleiben unbearbeitet, ohne dass der Developer es merkt, bis er die Tests laufen laesst.
Drittens: Multiagent wird in sequenziellen Aufgaben verwendet. Ein klassisches Beispiel: ein Debug-Workflow, in dem Schritt 2 von Schritt 1 abhaengt. Wer das parallelisiert, bekommt drei Subagents, die alle auf den Ausgangsstand reagieren, ohne die Korrekturen des jeweils anderen zu sehen. Das Ergebnis ist Datenmuell.
Aus den eigenen Beratungsmandaten wissen wir: die teuerste Fehlannahme ist, Multiagent als allgemeines Beschleunigungs-Tool zu verstehen. Multiagent ist ein Werkzeug für parallelisierbare Aufgaben. Wer sequenzielle Aufgaben damit angeht, baut sich neue Bugs.
Wann du nicht auf Multiagent umstellen solltest
Wer alleine arbeitet und Codex ohnehin nur für einfache Auto-Complete-Aufgaben nutzt, gewinnt durch Multiagent wenig. Die 22 Prozent Mehrkosten an API rechnen sich nicht, wenn die Aufgaben in einer einzigen Codex-Session schon erledigt waren.
Wer in einem Stack arbeitet, in dem Claude Code schon der Default ist (etwa weil das Team mit Anthropic-Stacks vertraut ist), sollte nicht aus Pflichtgefuehl auf Codex umsteigen. Beide Subagent-Modelle leisten in der Praxis vergleichbare Dinge. Die Migration kostet Einarbeitung und liefert keinen signifikanten Vorteil. Hintergrundinfos zu Codex sind im Codex-Erklärungs-Artikel zu finden, zum Anthropic-Pendant in der Anleitung zur Claude-Code-Einführung im Unternehmen.
Wer in einem Team mit mehr als 5 Developern arbeitet, sollte vor dem Rollout mit dem Team klären, wer Multiagent in welchen Workflows einsetzt. Sonst entstehen Konflikte im Repo, die vorher nicht da waren. Die Investitions-Frage ist nicht "lohnt sich das Tool", sondern "passt der neue Workflow in unsere Code-Kultur".
Was du jetzt konkret tun kannst
Zwei Schritte, mit denen du das Update für dich validieren kannst, bevor du es in den Alltag übernimmst.
Schritt 1: identifiziere eine konkrete parallelisierbare Aufgabe in deinem aktuellen Workflow. Beispiele: alle Funktionen einer Klasse mit Unit-Tests versehen, ein Library-Upgrade über mehrere Files durchziehen, eine Doku für 12 API-Endpoints schreiben. Wichtig: die Teilaufgaben muessen unabhängig sein.
Schritt 2: setze diese eine Aufgabe mit Multiagent um (4 bis 6 Subagents). Notiere die reine Bearbeitungszeit, die API-Kosten und die Anzahl gefundener Bugs nach Vergleich mit deinem bisherigen sequenziellen Workflow. Nach 3 bis 5 solchen Aufgaben hast du belastbare Daten und kannst entscheiden, ob Multiagent für dein Setup passt.
Aus unserer Beratungserfahrung: bei Solo-Entwicklern mit klar definierten parallelisierbaren Aufgaben rechnet sich der Workflow fast immer. Bei Teams mit gemischten Workflows und unklarem Repo-Standard rechnet er sich nicht automatisch. Die Differenz liegt nicht im Tool, sondern in der Arbeitsorganisation davor.
Wer KI-Coding-Tools zum ersten Mal systematisch einsetzen will, ohne sich auf einen Anbieter festzulegen, kann mit unserem Digitalisierungsmanager den vollen Stack durcharbeiten. Die 4-monatige Vollzeit-Weiterbildung ist über Bildungsgutschein oder Qualifizierungschancengesetz foerderfaehig und behandelt sowohl Codex als auch Claude Code in den Praxis-Modulen.
Häufige Fragen
Brauche ich Codex Pro für die Multiagent-Funktion?
Ja, in der Praxis schon. Codex ist auf Plus (20 USD pro Monat) und Pro (200 USD pro Monat) verfuegbar. Plus hat aber niedrigere Limits, die bei mehreren Subagents schneller erreicht werden. Wer Multiagent ernsthaft nutzen will (z.B. für Code-Reviews mit drei parallelen Subagents), kommt mit Plus regelmäßig ans Limit. Pro lohnt sich, sobald du mehr als 5 Multiagent-Aufgaben pro Tag laufen laesst.
Kann ich die 8er-Grenze umgehen?
Nein, die Grenze ist hardcoded. Wenn du mehr parallele Streams brauchst, musst du die Aufgaben in mehrere Multiagent-Runs nacheinander aufteilen. Zwei Runs mit jeweils 8 Subagents sind möglich, aber nicht ein Run mit 16 Subagents. Die Grenze ist bewusst gewählt, um Race-Conditions im Filesystem zu vermeiden.
Was passiert, wenn zwei Subagents in dieselbe Datei schreiben?
Codex hat aktuell keine automatische Konflikt-Aufloesung. Wenn zwei Subagents in dieselbe Datei schreiben, gewinnt der zweite Write-Vorgang, der erste ist verloren. OpenAI empfiehlt deshalb explizit, Aufgaben so zuzuschneiden, dass jeder Subagent in eigene Files schreibt. Vor einem Multiagent-Run hilft eine kurze Plan-Phase im Lead-Agent: "Welche Files wird welcher Subagent anfassen?"
Wie unterscheidet sich Codex von Claude Code in der Multiagent-Architektur?
Codex hat eine harte Grenze von 8 Subagents pro Developer und eine eher gemeinsame Tool-Config. Claude Code hat keine harte Grenze, dafür steigen die Rate-Limits mit der Anzahl der Subagents. Codex tendiert zu geringerem Token-Verbrauch pro Task, Claude tendiert zu mehr Tokens. Welches in deinem Workflow besser passt, haengt vom Setup ab. Wer schon mit einem der beiden arbeitet, wechselt selten.
Lohnt sich der Wechsel von sequenziellem Codex zu Multiagent?
Bei parallelisierbaren Aufgaben fast immer ja, bei sequenziellen Aufgaben fast immer nein. Praktischer Test: nimm 5 typische Aufgaben aus deinem Workflow und stuf jede ein (parallel oder sequenziell). Wenn 3 oder mehr parallelisierbar sind, lohnt sich Multiagent. Wenn weniger, bleibst du beim bisherigen Workflow.
Über den Autor
Dr. Jens Aichinger ist promovierter Wirtschaftspädagoge und Gründer von SkillSprinters, einem DEKRA-AZAV-zertifizierten Bildungsträger. Er hat über 70 Sachbücher auf Amazon KDP veröffentlicht und beraet KMU und Selbstständige zu KI-Einsatz, Fördermitteln und Weiterbildung.
Bereit für den nächsten Schritt? Lerne in einem kostenlosen 5-Lektionen-Schnupperkurs, wie du KI im Berufsalltag einsetzt. Komplett online, ohne Vorkenntnisse. Jetzt anmelden.
Zuletzt geprüft am 22. Mai 2026. Quellen: OpenAI-Blog (Mai 2026), Anthropic-Blog (Mai 2026), Codex CLI Release Notes.
Bereit für deinen nächsten Karriereschritt?
Lass dich kostenlos beraten. Wir finden die passende Weiterbildung und Förderung für dich.