Auf einen Blick: Codex ist nicht mehr das API-Modell von 2021. Seit Sommer 2025 ist es eine Agent-Plattform, seit November 2025 als Codex CLI quelloffen, seit April 2026 direkt in ChatGPT integriert. Plus-Abonnenten bekommen den Codex Mode ohne Aufpreis, Codex Cloud beginnt bei 40 USD pro Platz. Wer Codex mit dem alten Namen verbindet, verpasst, dass OpenAI hier still ein eigenes Produkt aufgebaut hat.
Transparenzhinweis: SkillSprinters bietet eigene KI-Weiterbildungen an. Der Marktvergleich unten ist auf Marktstand Mai 2026 recherchiert.
Wer 2021 schon mit der OpenAI-API gearbeitet hat, kennt den Namen Codex noch als Code-Vervollständigungsmodell, das damals in der ersten Version von GitHub Copilot lief. 2023 wurde es eingestellt, und in vielen Köpfen war das Thema durch. Inzwischen steht Codex aber wieder im Marketing-Material von OpenAI, diesmal mit anderer Bedeutung. Wer den Begriff zuletzt 2023 gehört hat, blickt auf eine völlig andere Produktwelt.
In den letzten zwölf Monaten ist Codex von einem Forschungsprojekt zum eigenen Geschäftsbereich gewachsen. Das Modell darunter ist nicht mehr das alte, die Bedienung läuft anders, und der Wettbewerb hat sich verschärft. Drei Tools haben den Markt für KI-Coding-Agenten geöffnet, ein viertes hat ihn diesen Frühling kommerzialisiert.
Die Codex-Timeline auf einer Seite
Damit klar ist, wovon hier die Rede ist, hier der knappe Verlauf.
| Zeitraum | Ereignis |
|---|---|
| 2021 | OpenAI stellt Codex als API-Modell vor, GitHub Copilot 1.0 läuft darauf |
| März 2023 | Codex API wird eingestellt, Copilot wechselt auf GPT-4 |
| Sommer 2025 | OpenAI relaunched Codex als eigenständige Agent-Plattform |
| November 2025 | Codex CLI erscheint quelloffen als Konkurrent zu Claude Code |
| April 2026 | Codex Mode wird in ChatGPT integriert, ist in Plus und Pro enthalten |
| Mai 2026 | Codex Cloud erlaubt persistente Repos und langlaufende Hintergrund-Tasks |
Das Modell hinter Codex ist seit dem Relaunch ein angepasster Coding-Stack auf Basis der GPT-5-Reihe. Im Mai 2026 läuft als Default GPT-5.5 Spud mit erweitertem Context-Fenster. OpenAI dokumentiert das in den Release Notes, ohne große Schlagzeile.
Was Codex 2026 wirklich kann
Die zentrale Idee unterscheidet sich vom alten Codex grundlegend. 2021 war das ein Modell, das einen halben Satz Code in einen ganzen verlängert hat. 2026 ist es ein Agent, der eine Aufgabe entgegennimmt, sie selbst zerlegt und in einem Repository umsetzt.
Konkret heisst das: Du beschreibst auf Deutsch, was du brauchst. Codex liest sich in dein Repository ein, schreibt Code, führt Tests aus, beantwortet Rückfragen aus den Tests selbst und stellt am Ende einen Pull Request bereit. Du prüfst, mergst oder schickst zurück mit Anmerkungen.
Vier Bereiche, in denen Codex im Mai 2026 verlässlich arbeitet:
- Repository-Analyse: Codex versteht grössere Codebasen über mehrere Dateien hinweg und erklärt Zusammenhänge im Klartext.
- Automatische PR-Erstellung: Aus einer Aufgabenbeschreibung entsteht ein Branch, Code, Tests, Commit-Messages und ein Pull Request mit Beschreibung.
- Test-Runs in der Sandbox: Der Agent führt die Tests aus, sieht die Fehlermeldungen und arbeitet daran, bis sie grün sind oder erkennt, dass er ohne menschlichen Input nicht weiterkommt.
- Persistente Hintergrund-Tasks: In Codex Cloud kann ein Agent über Stunden laufen, an einer langen Migration arbeiten, dabei Status-Updates senden und am Ende ein Ergebnis liefern.
Der spürbare Unterschied gegenüber den ersten Versionen vom Sommer 2025: Die Stabilität ist deutlich höher, die Test-Loops greifen besser, und der Pull Request enthält nicht mehr nur Code-Diff, sondern auch eine verständliche Erklärung.
Wo Codex an seine Grenzen kommt
Die spannende Frage ist nicht, ob Codex Code generieren kann. Das können inzwischen alle Anbieter. Die spannende Frage ist, wo der Agent sich verirrt.
In der Praxis sehen wir in Beratungsmandaten drei wiederkehrende Schwachstellen. Erstens versteht Codex große, historisch gewachsene Repositories langsamer als kleinere, klar strukturierte. Wer eine zwanzig Jahre alte PHP-Anwendung hat, in der jede Datei einen anderen Stil pflegt, bekommt Outputs, die zwar funktionieren, aber stilistisch nicht zur Umgebung passen.
Zweitens scheitert Codex an undokumentierten Domänenkonventionen. Wenn dein Team intern eine bestimmte Art hat, Datenbank-Migrationen zu schreiben, und das nirgendwo dokumentiert ist, dann produziert der Agent Code, der technisch korrekt ist, aber durch jedes Review fällt. Lösung ist eine CODEX.md oder vergleichbare Konvention im Repo, in der die Spielregeln stehen.
Drittens hat Codex im Gegensatz zu Claude Code eine etwas härtere Sandbox. Was praktisch heisst: Manche Operationen, die du im Terminal mit Claude Code einfach laufen lässt, brauchen in Codex Cloud explizite Freischaltungen. Das ist sicherheitstechnisch gut, in der Lerneinarbeitung aber lästig.
Der Konkurrenzvergleich Mai 2026
Der Markt hat sich seit Frühjahr 2026 verdichtet. Fünf ernstzunehmende Player.
| Anbieter | Stärke 2026 | Einstiegspreis |
|---|---|---|
| ChatGPT Codex (Mode in ChatGPT Plus) | Tiefe Integration in ChatGPT, gut für Mischbetrieb Coding und Text | 23 EUR/Monat (Plus) |
| Codex Cloud | Persistente Repos, Hintergrund-Tasks, Team-Features | ab 40 USD/Platz/Monat |
| Claude Code (CLI) | Sehr starkes Reasoning in komplexen Repos, lokales Terminal | mit Claude Pro ab rund 20 USD |
| Cursor | IDE-zentriert, schnelle Inline-Vorschläge, beliebt bei Solo-Entwicklern | 20 USD/Monat |
| Windsurf | Ähnlich Cursor, fokussiert auf Code-Context-Verwaltung | 15 USD/Monat |
| GitHub Copilot Workspace | Tiefe Integration in GitHub, gut für reine PR-Workflows | 19 USD/Monat (Business) |
Die Preisangaben sind Listenpreise vom Mai 2026. Bei Team-Verträgen verhandeln die meisten Anbieter Sonderkonditionen. Das Bild zeigt: Codex ist im Plus-Plan unter den günstigsten Optionen, weil die Coding-Funktion Bestandteil des regulären ChatGPT-Abos ist. Wer nur gelegentlich Code generiert, hat keinen Grund, ein zweites Tool zu abonnieren.
Wer in einem grösseren Team arbeitet, an mehreren Repos parallel und mit Workflows, die über Nacht laufen sollen, kommt um Codex Cloud oder eine vergleichbare Cloud-Lösung nicht herum. Hier rechnet OpenAI nach Plätzen ab.
Was der Codex Mode in ChatGPT konkret bringt
Der Codex Mode ist seit April 2026 in ChatGPT Plus und Pro eingebaut. Du wechselst in ChatGPT die Modellauswahl in den Codex-Mode, gibst dem Chat Zugriff auf ein verbundenes Repository und arbeitest dann nicht mehr in einem reinen Textfenster, sondern in einer Mischung aus Chat und Code-View.
Drei praktische Effekte daraus.
Der erste Effekt ist, dass Code-Aufgaben nicht mehr aus ChatGPT herausgerissen werden müssen. Wenn du im normalen Plus-Plan Code generieren willst, kopierst du Snippets hin und her. Im Codex Mode bleibt alles in einem Tab.
Der zweite Effekt ist die direkte Verbindung zu GitHub. Du autorisierst Codex einmalig für ein Repository, danach kann der Agent direkt Branches anlegen und Pull Requests erstellen. Das spart in der Praxis pro Aufgabe fünf bis zehn Minuten, weil das manuelle Hin-und-Her wegfällt.
Der dritte Effekt ist eher psychologisch. Weil Codex Mode in ChatGPT lebt, nutzen ihn auch Mitarbeiter, die sonst nie ein Coding-Tool angefasst hätten. Im Mittelstand sehen wir das oft bei Vertriebsteams, die kleine Excel-Auswertungen oder einfache Skripte selbst bauen wollen, ohne die IT zu fragen.
Praxis: Wie eine Würzburger Softwarefirma Codex testet
Eine fiktive, aber typische Konstellation. Krämer Softwarelösungen GmbH in Würzburg, 17 Entwickler, baut Branchensoftware für Logistikdienstleister. Das Team arbeitet mit einem großen Java-Monolithen aus 2019, dazu mehrere kleinere Microservices auf Python-Basis.
Anfang Mai 2026 hat die Geschäftsführung beschlossen, Codex strukturiert zu evaluieren. Sechs Wochen Pilot, drei Entwickler, klar definierter Use-Case: Codex schreibt Unit-Tests für eine alte Komponente, die historisch ohne Tests entstanden ist. Aufwand pro Test bisher etwa 45 Minuten, weil der Code schlecht dokumentiert ist.
Ergebnis nach drei Wochen. Codex schafft etwa 60 Prozent der Tests sofort funktionsfähig. Weitere 25 Prozent funktionieren nach einer Korrektur durch den Entwickler. Die letzten 15 Prozent muss der Entwickler ganz selbst schreiben, weil Codex die Domänenlogik nicht versteht. Netto-Zeitersparnis liegt bei rund 40 Prozent, kombiniert mit besserer Konsistenz im Test-Stil.
Was nicht funktioniert hat. Die ursprüngliche Hoffnung, Codex könnte über Nacht die ganze Test-Lücke schliessen, hat sich nicht erfüllt. Hintergrund-Tasks in Codex Cloud sind zwar verfügbar, aber bei der Komplexität dieser Codebase produzieren sie Outputs, die niemand ohne Review mergen will. Das Team setzt Codex jetzt synchron ein, also Entwickler triggert Aufgabe, prüft direkt, merged. Asynchron läuft nichts.
Wer in einer ähnlichen Konstellation steckt, kann den Test mit überschaubarem Aufwand selbst durchführen: Plus-Plan reicht für die ersten Wochen, Codex Cloud kommt erst dazu, wenn Team-Features wirklich gebraucht werden.
Was bedeutet das für die Weiterbildungsfrage
Codex ist kein Tool, das man in zwei Stunden lernt. Die Bedienung ist einfach, aber die Frage, wie ein Team damit produktiv wird, ist eine eigene Disziplin. In unserem Digitalisierungsmanager-Kurs ist das Thema KI-gestütztes Programmieren ein eigenes Modul, weil wir bei Teilnehmern aus IT-nahen Berufen sehen, dass die Werkzeuge oft schneller bereitstehen als der Umgang damit.
Wer als Quereinsteiger in die IT will und sich fragt, ob Codex die Lernkurve einfacher macht, sollte ehrlich antworten. Codex hilft beim Tippen, nicht beim Verstehen. Wer Code lesen kann und Architekturen einordnet, profitiert massiv. Wer noch nicht weiss, was ein Pull Request ist, sollte erst die Grundlagen lernen und dann die Tools dazunehmen. Sonst entstehen Outputs, die der Nutzer selbst nicht beurteilen kann.
Was als nächstes ansteht
OpenAI hat für die zweite Hälfte 2026 zwei grössere Codex-Iterationen angekündigt. Erstens eine engere Integration in IDEs, vergleichbar mit Cursor und Windsurf. Zweitens eine Erweiterung der Hintergrund-Tasks, die längere Laufzeiten und bessere Status-Visualisierung in Codex Cloud erlauben soll.
Wer heute mit einem Tool startet, sollte trotzdem nicht warten. Die Grundprinzipien (Repository-Setup, Test-Loops, klare Aufgabenformulierung) gelten für alle Coding-Agents. Wer sie mit Codex 2026 lernt, kann später auf Claude Code, Cursor oder GitHub Copilot Workspace umsteigen, ohne komplett neu anzufangen.
Häufige Fragen
Ist das Codex von 2021 das gleiche wie das von 2026?
Nein. Das Codex von 2021 war ein API-Modell für Code-Vervollständigung, das März 2023 eingestellt wurde. Das Codex von 2026 ist eine Agent-Plattform mit eigenem Interface, eigenem Pricing und einem ganz anderen Modell darunter. Der Name ist gleich, das Produkt nicht. Wer beides verwechselt, vergleicht Äpfel mit Birnen.
Brauche ich Codex Cloud, oder reicht der Codex Mode in ChatGPT Plus?
Für Solo-Entwickler oder kleine Teams reicht der Codex Mode in Plus völlig aus. Du arbeitest synchron, triggerst Aufgaben, prüfst, mergst. Codex Cloud lohnt sich erst, wenn du persistente Repos brauchst, mehrere Entwickler im Team das Tool parallel nutzen oder langlaufende Hintergrund-Tasks abbilden willst. Ab vier bis fünf aktiven Entwicklern wird die Cloud-Variante interessant.
Wie unterscheidet sich Codex von Claude Code?
Codex läuft tiefer integriert mit ChatGPT und ist in dessen Plus-Plan enthalten. Claude Code ist ein CLI-Tool, das im lokalen Terminal läuft und stärker auf langlaufende Reasoning-Aufgaben in komplexen Repos zugeschnitten ist. Wer in einem Team mit ChatGPT-Lizenzen sitzt, hat Codex automatisch dabei. Wer am Terminal arbeitet und tiefes Reasoning braucht, ist mit Claude Code oft besser bedient. Viele Teams nutzen beides nebeneinander für unterschiedliche Aufgaben.
Was kostet ein Codex-Cloud-Platz im Mittelstand realistisch?
OpenAI listet Codex Cloud ab 40 USD pro Platz pro Monat. Bei drei bis fünf Entwicklern liegst du also zwischen 120 und 200 USD monatlich. Dazu kommt der Aufwand für die Verwaltung, Repository-Anbindung und Schulung der Mitarbeiter. Wer ehrlich rechnet, kalkuliert für die ersten drei Monate Einarbeitungszeit mit dazu. Erst danach lässt sich seriös sagen, ob das Tool den Preis rechtfertigt.
Zuletzt geprüft am 21. Mai 2026.
Bereit für den nächsten Schritt? Wenn du KI im Geschäftsalltag systematisch einsetzen willst, schau dir unseren kostenlosen KI-Schnupperkurs an. Fünf Lektionen, eine Live-Demo pro Woche, null Euro.
Über den Autor
Dr. Jens Aichinger ist promovierter Wirtschaftspädagoge, Erwachsenenbildner und Geschäftsführer von SkillSprinters by Dr. Aichinger. Er bildet seit über 15 Jahren Berufstätige, Fachkräfte und Quereinsteiger weiter, hat über 70 Fachbücher zu Prüfungsvorbereitung und Karrierethemen veröffentlicht und betreibt mit SkillSprinters einen der digital am stärksten wachsenden Bildungsträger im DACH-Raum.
Bereit für deinen nächsten Karriereschritt?
Lass dich kostenlos beraten. Wir finden die passende Weiterbildung und Förderung für dich.