Auf die Schnelle

Anthropic hat am 28. Mai 2026 Claude Opus 4.8 veröffentlicht. Laut Hersteller etwa viermal weniger übersehene Code-Fehler als beim Vorgänger Opus 4.7. Dazu Dynamic Workflows als Research Preview, die hunderte Subagenten parallel orchestrieren können. Für die meisten KMU bringt das vor allem stabilere Ergebnisse bei langen Aufgaben, nicht zwingend neue Use Cases.

Am 28. Mai 2026 hat Anthropic Claude Opus 4.8 als neues Spitzenmodell verfügbar gemacht. Verbesserte Code-Qualität, niedrigerer Schwellenwert für Prompt-Caching, eine neue Mid-Conversation-System-Message-Funktion und die ersten Schritte in Richtung Dynamic Workflows mit hunderten parallelen Subagenten. Für Tech-Teams ist das ein Sprung. Für die meisten kleinen und mittleren Firmen ist es eher ein Update der Substanz, weniger der Funktionspalette.

Was Anthropic konkret veröffentlicht hat

Opus 4.8 ist Anthropics aktuelles Top-Modell. Es ersetzt Opus 4.7 als Empfehlung für komplexe Aufgaben, lange Agent-Läufe und Programmierung mit hoher Autonomie. Anthropic gibt in den eigenen Release Notes vom 28. Mai 2026 an, dass Opus 4.8 auf einem 1-Millionen-Token-Kontextfenster läuft, dass die maximale Output-Länge bei 128.000 Tokens liegt und dass die Schwelle für Prompt-Caching auf 1.024 Tokens gesenkt wurde.

Die Preise bleiben gegenüber 4.7 stabil: 5 Dollar pro Million Input-Tokens, 25 Dollar pro Million Output-Tokens.

Die wichtigste Aussage, die Anthropic in der Modell-Doku kommuniziert: Opus 4.8 sei beim Programmieren etwa viermal weniger wahrscheinlich, eigene Code-Fehler nicht zu bemerken. Das ist die Zahl, die für KMU mit eigener Entwicklung am relevantesten ist. Wer Claude für Code Reviews einsetzt, bekommt nach Aussage des Herstellers messbar weniger Falsch-Negative.

Daneben gibt es ein paar API-seitige Neuerungen, die in der Praxis spürbar sind. Mit aktiviertem Adaptive Thinking schaltet Opus 4.8 die Denkphase nur dann ein, wenn die Frage es wirklich braucht. Gegenüber 4.7 spart das bei einfachen Aufgaben Tokens und damit Geld. Der Effort-Parameter, der die Tiefe der Antwort steuert, steht ab Opus 4.8 standardmäßig auf "high". Wer das nicht möchte, muss explizit umschalten. High-Resolution-Bilder bis 2576 Pixel auf der langen Seite werden unterstützt, gleich wie bei Opus 4.7. Computer-Use, also die Steuerung eines virtuellen Computers durch das Modell, läuft jetzt auch auf 4.8.

Dynamic Workflows: was das wirklich ist

Mit dem Release hat Anthropic in Claude Code Workflows als Research Preview eingeführt. Damit kann ein Hauptmodell hunderte parallele Subagenten orchestrieren, die jeweils einen Teilbereich abarbeiten. Was vorher manuell mit Skripten gebaut wurde, soll im Workflow-Modus mit einem Prompt anlaufen.

Klingt eindrucksvoll. In der Praxis ist das ein Werkzeug für Entwickler, die ohnehin große Multi-Step-Aufgaben automatisieren. Wer aktuell einen Buchhaltungs-Workflow in n8n baut, profitiert nicht direkt von Dynamic Workflows. Wer als Software-Team mit Claude Code arbeitet, schon: lange Migrationen, große Codebasen, Multi-Repo-Refactorings.

Research Preview heißt aber auch, dass das Feature noch nicht produktionsstabil ist. Anthropic empfiehlt selbst Vorsicht für produktive Workloads.

Konkret: ein Workflow im Claude-Code-Sinne ist ein mehrstufiger Plan, den das Modell aus einem Prompt ableitet und dann selbständig abarbeitet. Es darf Subagenten spawnen, die parallel an Teilaufgaben arbeiten, ihre Ergebnisse zurückspielen und vom Hauptmodell zusammengeführt werden. Das ist das, was Entwicklerteams bisher mit eigenen Orchestrierungs-Tools wie LangGraph, n8n oder hausgemachten Skripten gebaut haben. Anthropic packt einen Teil davon jetzt ins Modell-Verhalten selbst.

Mid-Conversation System Messages

Ein zweites Feature aus dem Release hat im KMU-Alltag mehr Wirkung. Auf Opus 4.8 kann man jetzt System-Messages mitten in der Konversation einfügen, nicht nur am Anfang. Das klingt nach Detail, ist aber für längere Chats mit Claude relevant. Wenn ein Mitarbeiter eine zwei Stunden lange Recherche-Session mit Claude führt und auf halber Strecke der Recherche merkt, dass eine zusätzliche Regel gelten soll, kann er die jetzt einfach einfügen. Ohne den Prompt-Cache zu verlieren, ohne die ganze Konversation neu zu starten.

Wer Claude im Kundensupport einsetzt, kennt das Problem: wenn neue Tarifregeln greifen, müssen Support-Skripte überall ergänzt werden. Mit Mid-Conversation System Messages lässt sich das im laufenden Gespräch ergänzen.

Was sich an der Modellauswahl ändert

Anthropic führt aktuell drei Modelle als aktiv im Katalog. Opus 4.8 für komplexe Aufgaben, lange Agent-Läufe, anspruchsvolles Programmieren. Sonnet 4.6, das im Februar 2026 erschien, als der ausgewogene Allrounder für den Alltag. Haiku 4.5, seit Oktober 2025, für schnelle, kostengünstige Antworten.

Daneben sind Opus 4.7, 4.6, 4.5 und 4.1 sowie Sonnet 4.5 weiter verfügbar, aber als Legacy gekennzeichnet. Anthropic empfiehlt die Migration auf die aktuellen Versionen.

Die Faustregel für KMU: Sonnet 4.6 deckt den Alltag ab. Opus 4.8 kommt zum Einsatz, wenn die Aufgabe wirklich komplex ist oder wenn ein Fehler teuer wäre. Haiku 4.5 für Massenverarbeitung und Tasks, bei denen Geschwindigkeit zählt.

Preislich liegt zwischen Sonnet 4.6 und Opus 4.8 ein Faktor von ungefähr 1,7 beim Input und 1,7 beim Output. Sonnet 4.6 kostet 3 Dollar pro Million Input-Tokens und 15 Dollar pro Million Output-Tokens. Opus 4.8 entsprechend 5 und 25 Dollar. Haiku 4.5 liegt bei 1 Dollar Input und 5 Dollar Output und damit deutlich darunter. Wer Sonnet statt Opus einsetzt, wo Sonnet reicht, spart bei 1.000 Anfragen am Tag schnell zwei- bis dreistellige Beträge im Monat.

Was das für KMU bedeutet

Realistisch betrachtet: für eine Firma mit 20 Mitarbeitern, die ChatGPT oder Claude im Marketing, in der Buchhaltung und im Kundensupport einsetzt, ändert das Opus-4.8-Release am Alltag wenig. Sonnet 4.6 reicht für die meisten Workflows. Opus ist teurer, langsamer und nicht überall notwendig.

Der wahre Hebel sitzt nicht im Modell, sondern im Workflow. Wer Claude direkt in der App nutzt, ohne das Modell in eigene Tools eingebaut zu haben, profitiert vom Release ohnehin automatisch. Claude.ai schaltet im Backend auf 4.8 um, der Nutzer merkt es höchstens an der Antwortqualität. Wer dagegen eigene Workflows betreibt, sei es n8n, eigene Skripte oder Custom-Backends, sollte explizit prüfen, ob 4.8 als Standardmodell gesetzt wird und ob die Migration vom alten 4.7-Modell-ID hinhakt.

Wir sehen das bei unseren Teilnehmern regelmäßig. Wer aus Reflex immer das teuerste Modell wählt, weil es das beste sei, gibt Geld aus, das er nicht ausgeben muss. Sonnet 4.6 bringt für die meisten Standard-Anwendungen ähnliche Qualität bei einem Drittel der Kosten. Opus 4.8 lohnt sich, wenn eine Aufgabe wirklich komplexe Mehrschritt-Logik braucht oder wenn ein Fehler im Output direkten Schaden verursacht.

Praktisch heißt das: prüf in deiner Firma, wo Claude oder ChatGPT regelmäßig zum Einsatz kommen. Schau, welches Modell aktuell läuft. In vielen Fällen wird sich zeigen, dass ein günstigeres Modell genauso gut die Aufgabe erledigt. Und wenn du Code generierst oder lange Workflows fährst, dann ist Opus 4.8 jetzt der neue Standard. Aber nur dann.

Ein weiterer Punkt: wer im Sommer 2026 noch mit dem alten claude-opus-4-20250514 oder claude-sonnet-4-20250514 arbeitet, sollte das prüfen. Diese Modell-IDs werden am 15. Juni 2026 abgeschaltet. Für die meisten Direktnutzer von Claude.ai ist das egal, das Frontend wählt automatisch das aktuelle Modell. Für Firmen, die Claude über die API in eigenen Tools eingebaut haben, ist die Umstellung jetzt fällig. Wer hier nicht handelt, hat ab 15. Juni keinen Service mehr.

KI-Modelle wechseln mittlerweile schneller, als manche Firma ihre Schulungsunterlagen aktualisieren kann. Wer KI im Mittelstand strukturiert einführen will, braucht weniger das Wissen über das aktuell teuerste Modell, sondern das Verständnis, wann welches Modell zum Einsatz kommt und wie sich das im Geschäftsalltag rechnet. Genau das deckt unser Vollkurs Digitalisierungsmanager ab.

Haeufige Fragen

Wann wurde Claude Opus 4.8 veröffentlicht und was kostet es?

Anthropic hat Claude Opus 4.8 am 28. Mai 2026 verfügbar gemacht. Die Preise bleiben stabil zu Opus 4.7: 5 US-Dollar pro Million Input-Tokens und 25 US-Dollar pro Million Output-Tokens. Sonnet 4.6 kostet 3 USD bzw. 15 USD, Haiku 4.5 liegt bei 1 USD bzw. 5 USD pro Million Tokens und ist damit deutlich günstiger.

Was ist neu bei Claude Opus 4.8 im Vergleich zu 4.7?

Laut Anthropic ist Opus 4.8 etwa viermal weniger wahrscheinlich, eigene Code-Fehler nicht zu bemerken. Die Schwelle für Prompt-Caching wurde auf 1024 Tokens gesenkt, der Effort-Parameter steht standardmäßig auf high, Mid-Conversation-System-Messages sind möglich, und Dynamic Workflows in Claude Code orchestrieren als Research Preview hunderte parallele Subagenten.

Welches Claude-Modell soll mein KMU im Alltag nutzen?

Sonnet 4.6 reicht für die meisten Workflows zu rund einem Drittel der Kosten von Opus 4.8. Opus 4.8 lohnt sich nur bei komplexer Mehrschritt-Logik oder wenn ein Fehler im Output direkten Schaden verursacht, etwa beim Code-Review. Haiku 4.5 ist die Wahl für Massenverarbeitung und Tasks, bei denen Geschwindigkeit zählt.

Was sind Dynamic Workflows in Claude Code?

Dynamic Workflows sind eine Research Preview, mit der ein Hauptmodell hunderte parallele Subagenten orchestrieren kann. Was vorher manuell mit n8n oder LangGraph gebaut wurde, soll mit einem Prompt anlaufen. Anthropic empfiehlt das Feature für lange Migrationen und Multi-Repo-Refactorings, rät aber bei produktiven Workloads zu Vorsicht.

Mehr über KI im Mittelstand lernen?

Im kostenlosen KI-Schnupperkurs zeigen wir in fünf Lektionen, wie kleine und mittlere Firmen KI praktisch einsetzen. Vollkurs Digitalisierungsmanager mit Bildungsgutschein. Förderwege: Bildungsgutschein und QCG im Vergleich.


Zuletzt aktualisiert: 04.06.2026. Stand der Recherche: 04.06.2026.