Claude Sonnet 4 + Opus 4 retired 15.06.: Migrations-Plan

Auf die Schnelle

Anthropic deprecated am 14. April 2026 die Modelle claude-sonnet-4-20250514 und claude-opus-4-20250514. Beide werden am 15. Juni 2026 abgeschaltet. Wer die Modell-IDs noch in Tools, Skripten oder Integrationen nutzt, muss bis dahin auf claude-sonnet-4-6 oder claude-opus-4-8 umstellen. Anfragen an die alten IDs ab 15. Juni werden fehlschlagen.

Am 14. April 2026 hat Anthropic die Deprecation der Modelle claude-sonnet-4-20250514 und claude-opus-4-20250514 angekündigt. Retirement-Datum: 15. Juni 2026. Wer einen dieser Modell-IDs nach dem Stichtag aufruft, bekommt einen Fehler zurück. Direktnutzer von Claude.ai sind nicht betroffen, das Frontend zieht automatisch das aktuelle Modell. Aber jede Firma, die Claude über die API in eigenen Anwendungen eingebaut hat, muss jetzt umstellen.

Was genau deprecated wurde

Anthropic dokumentiert die Deprecation in der eigenen Übersicht. Zwei Modelle sind betroffen, beide aus der ersten Welle Claude 4 vom Mai 2025.

claude-sonnet-4-20250514 war der ausgewogene Allrounder der Claude-4-Reihe und der Standard für viele Integrationen, die im Sommer und Herbst 2025 aufgebaut wurden. Empfohlene Migration laut Anthropic: claude-sonnet-4-6, das im Februar 2026 veröffentlicht wurde.

claude-opus-4-20250514 war das ursprüngliche Top-Modell, ausgelegt für komplexe Aufgaben und Agent-Workflows. Empfohlene Migration: claude-opus-4-8, das am 28. Mai 2026 erschien.

Beide Modelle bleiben bis 15. Juni 2026 funktionsfähig. Ab dem Stichtag liefern API-Anfragen einen Fehler zurück. Anthropic hat in den vergangenen Jahren konsequent eingehalten, was sie ankündigen: ein deprecated Modell läuft bis zum Retirement-Datum, dann ist Schluss.

Die Frist von 60 Tagen zwischen Deprecation und Retirement ist Anthropics Standard für öffentlich freigegebene Modelle. In diesem Fall sind es zwei Monate, weil die Ankündigung am 14. April 2026 kam und der Stichtag 15. Juni 2026 ist. Wer in der Zeit dazwischen migriert, hat keinen Druck. Wer wartet, sieht ab Mitte Juni Fehler im Log.

Wer ist davon betroffen

Direktnutzer von Claude.ai, Cowork oder den Anthropic-Apps sind nicht betroffen. Das Frontend wählt automatisch das aktuelle Modell und schaltet im Backend um.

Betroffen ist jeder, der die Modelle in Skripten oder Integrationen explizit referenziert. Das umfasst typischerweise:

Eigene Backend-Anwendungen, die die Anthropic-API direkt aufrufen
n8n-Workflows mit fest hinterlegten Modell-IDs
Custom-GPT-ähnliche Konstrukte in Tools wie LangChain, LlamaIndex, Haystack
Slack-, Teams- oder Discord-Bots, die Claude im Hintergrund nutzen
Eigene CRM- oder ERP-Erweiterungen mit Claude-Integration
Tests und CI-Pipelines mit fixierten Modell-IDs

Auch Cloud-Integrationen über Amazon Bedrock oder Google Vertex AI sind betroffen, wenn dort die alten IDs anthropic.claude-sonnet-4-20250514-v1:0 oder anthropic.claude-opus-4-20250514-v1:0 verwendet werden.

Wie man Nutzung der alten Modelle auditieren kann

Anthropic empfiehlt einen einfachen Weg. In der Claude Console gibt es auf der Usage-Seite einen Export-Button, der die API-Nutzung als CSV herunterlädt, aufgeschlüsselt nach Modell und API-Key. Wer das öffnet, sieht sofort, ob und wie oft die alten IDs noch aufgerufen werden.

Für Firmen mit mehreren API-Keys ist das die schnellste Diagnose. Wenn der CSV-Export keine Treffer auf claude-sonnet-4-20250514 oder claude-opus-4-20250514 zeigt, ist die Umstellung schon erledigt. Wenn Treffer auftauchen, weiß man, welcher Workspace oder welcher API-Key noch das alte Modell aufruft.

Daneben hilft die klassische Suche im eigenen Codebase. Wer mit grep oder dem GitHub-Search-Feature nach den Strings "claude-sonnet-4-20250514" und "claude-opus-4-20250514" sucht, findet die meisten Treffer. Konfigurationsdateien, YAML-Files in CI/CD-Pipelines, .env-Files in Docker-Setups, n8n-Workflow-Exporte.

Was bei der Migration konkret zu beachten ist

Die Modell-IDs sind das Offensichtliche. Daneben gibt es ein paar weniger sichtbare Punkte, die in der Praxis auflaufen.

Erstens: ab Opus 4.7 werden die Sampling-Parameter temperature, top_p und top_k mit einem 400-Fehler abgelehnt, wenn man einen Wert ungleich Default setzt. Wer in der eigenen Anwendung temperature=0.7 oder top_p=0.9 hartcodiert hat, weil das früher der Standard war, muss das jetzt rausnehmen. Steuerung der Antwortqualität läuft über Prompting, nicht über Sampling-Parameter.

Zweitens: Opus 4.8 nutzt standardmäßig den Effort-Parameter auf "high". Wenn die eigene Anwendung schnelle Antworten erwartet und Opus früher schnell genug war, sollte man jetzt explizit effort="low" oder "medium" setzen.

Drittens: Adaptive Thinking ist auf Opus 4.7 und 4.8 neu. Wer früher manuelles Thinking mit thinking.type="enabled" und budget_tokens gesetzt hat, bekommt einen Hinweis, dass das deprecated ist. Empfohlen ist die adaptive Variante, die selbst entscheidet, wann gedacht werden muss.

Viertens: das Output-Limit bei Opus 4.8 liegt bei 128.000 Tokens, bei Sonnet 4.6 bei 64.000. Wer Skripte hat, die max_tokens auf 32.000 oder 64.000 hartcodiert haben, kann das je nach Use Case nach oben schieben.

Fünftens: das 1-Millionen-Token-Kontextfenster ist auf Sonnet 4.6 und Opus 4.6 und höher direkt verfügbar, ohne Beta-Header. Auf den alten Sonnet 4 und Sonnet 4.5 lief das nur mit dem context-1m-2025-08-07-Beta-Header, der am 30. April 2026 für diese Modelle abgeschaltet wurde. Wer in der eigenen Anwendung mit dem 1M-Kontext arbeitet und noch das alte Sonnet 4 referenziert, bekommt also bereits seit Ende April einen Fehler bei Requests, die über 200.000 Tokens hinausgehen. Migration auf Sonnet 4.6 löst beide Probleme auf einmal.

Sechstens: das Tokenizing hat sich mit Opus 4.7 geändert. Identischer Prompt-Text erzeugt jetzt 0 bis 35 Prozent mehr Tokens als auf den älteren Opus-Versionen. Wer mit knappen Token-Budgets oder genauen Kostenkalkulationen arbeitet, sollte einmal nachrechnen.

Was das für KMU bedeutet

Die meisten kleinen und mittleren Firmen nutzen Claude über Claude.ai oder über fertige Integrationen wie Cowork, Slack-Plugins oder Microsoft-365-Erweiterungen. Diese Integrationen werden vom jeweiligen Anbieter aktualisiert. Wer kein eigenes Backend mit Anthropic-API gebaut hat, muss nichts tun.

Wer aber im letzten Jahr einen eigenen kleinen Chatbot, ein n8n-Workflow oder ein Excel-Plugin mit Claude-Anbindung gebaut hat, der ist jetzt in der Pflicht. Das ist häufig der Fall bei Firmen, die einen IT-affinen Mitarbeiter haben, der "schnell mal" eine Automatisierung gebaut hat. Wir sehen das bei unseren Teilnehmern regelmäßig: ein engagierter Werkstudent hat im Sommer 2025 einen Slack-Bot gebaut, der seit Monaten läuft, niemand weiß genau wie. Wenn dieser Bot am 16. Juni plötzlich nichts mehr tut, sucht jemand zwei Stunden nach der Ursache.

Praktische Empfehlung: bis Anfang Juni alle Claude-Integrationen im eigenen Haus auditieren. Modell-IDs ersetzen, Sampling-Parameter prüfen, einen Test laufen lassen. Wer das jetzt einmal ordentlich macht, ist auch für die nächsten Deprecations gerüstet, die alle paar Monate kommen. Anthropic versendet Notifications an die Account-Inhaber, aber wer eine API-Key in einem Werkstudent-Projekt hat, das längst keiner mehr betreut, bekommt diese Mail vielleicht gar nicht zu sehen.

Eine pragmatische Architekturentscheidung, die viele Firmen jetzt nachholen: nie hartcodierte Modell-IDs in Skripten. Stattdessen einen zentralen Konfig-Eintrag, idealerweise eine Umgebungsvariable wie CLAUDE_MODEL, der an einer Stelle gepflegt wird. Beim nächsten Modellwechsel ist die Umstellung dann eine einzelne Konfigänderung, kein Such-und-Ersetz über fünf Repositories. Das ist ein typisches Reifegrad-Indiz für KI-Integrationen, und es zahlt sich genau in diesen Tagen aus.

Und ein letzter Hinweis: bei Cloud-Integrationen über Bedrock und Vertex AI können die Retirement-Daten von denen auf der Anthropic-API abweichen. Bedrock und Vertex AI setzen ihre eigenen Zeitpläne. Wer dort die alten 20250514-IDs einsetzt, sollte zusätzlich die jeweiligen Bedrock- und Vertex-Modellseiten prüfen. In den meisten Fällen sind die Cloud-Retirement-Daten gleichauf mit der Anthropic-API oder ein paar Wochen später, garantiert ist das aber nicht.

Die strukturierte Antwort auf die laufende KI-Modell-Karussell-Frage ist Kompetenzaufbau im Team. Wer im Mittelstand selber versteht, wie Modell-Versionen, Migrationen und Audits funktionieren, ist nicht angewiesen auf den Werkstudenten, der gerade keine Zeit hat. Unser Vollkurs Digitalisierungsmanager bildet genau diese Rolle aus.

Häufige Fragen

Wann werden Claude Sonnet 4 und Opus 4 abgeschaltet?

Anthropic hat am 14. April 2026 die Deprecation angekündigt, das Retirement-Datum ist der 15. Juni 2026. Ab diesem Stichtag liefern API-Anfragen an claude-sonnet-4-20250514 und claude-opus-4-20250514 einen Fehler zurück. Anthropic hält seine 60-Tage-Standardfrist zwischen Deprecation und Abschaltung üblicherweise konsequent ein.

Auf welches Modell soll ich von claude-sonnet-4-20250514 umstellen?

Anthropic empfiehlt als Migrationsziel claude-sonnet-4-6, das im Februar 2026 erschien. Wer claude-opus-4-20250514 nutzt, migriert auf claude-opus-4-8 vom 28. Mai 2026. Beide neuen Modelle laufen über denselben API-Endpunkt, die Umstellung ist meist ein einfacher String-Tausch in der Konfiguration.

Wer ist von der Abschaltung nicht betroffen?

Direktnutzer von Claude.ai, Cowork und den Anthropic-Apps sind nicht betroffen. Das Frontend wählt automatisch das aktuelle Modell. Betroffen sind eigene Backend-Anwendungen, n8n-Workflows mit fest hinterlegten Modell-IDs, Slack- oder Discord-Bots, CRM-Erweiterungen sowie Cloud-Integrationen über Amazon Bedrock oder Google Vertex AI.

Was muss ich bei der Claude-Migration sonst noch beachten?

Sechs Punkte: Sampling-Parameter (temperature, top_p, top_k) werden seit Opus 4.7 mit 400-Fehler abgelehnt. Opus 4.8 nutzt standardmäßig Effort high. Manuelles Thinking ist deprecated, Adaptive Thinking ist Pflicht. Output-Limits steigen auf 128k bei Opus, 64k bei Sonnet. Das Tokenizing erzeugt 0 bis 35 Prozent mehr Tokens. 1M-Kontextfenster braucht keinen Beta-Header mehr.

Mehr über KI im Mittelstand lernen?

Im kostenlosen KI-Schnupperkurs zeigen wir in fünf Lektionen, wie kleine und mittlere Firmen KI praktisch einsetzen. Vollkurs Digitalisierungsmanager mit Bildungsgutschein. Förderwege: Bildungsgutschein und QCG im Vergleich.

Zuletzt aktualisiert: 04.06.2026. Stand der Recherche: 04.06.2026.

Claude Sonnet 4 + Opus 4 retired 15.06.: Migrations-Plan

Was genau deprecated wurde

Wer ist davon betroffen

Wie man Nutzung der alten Modelle auditieren kann

Was bei der Migration konkret zu beachten ist

Was das für KMU bedeutet

Häufige Fragen

Das könnte dich auch interessieren

GPT-5.5 Instant: 52 Prozent weniger Halluzinationen

Gemini 3.5 Flash GA + Managed Agents: Googles Push

Mistral Medium 3.5 + Work Mode: EU-souverän für KMU