n8n Multi-Agent-Patterns mit Claude 2026: Vier bewährte Architekturen für den Mittelstand

Auf einen Blick: Wer n8n und Claude für Multi-Agent-Workflows koppelt, hat 2026 vier bewährte Patterns zur Auswahl: Sequential Pipeline, Router-Pattern, Hierarchical Orchestrator und Peer-to-Peer-Critic. Die Token-Kosten unterscheiden sich um den Faktor 10, von unter einem Cent pro Lauf bis zu 30 Cent. Das richtige Pattern hängt vom Use Case ab, nicht von der Anzahl der Schritte. Production-Pflichten wie Timeouts, Audit-Logs und Error-Workflows sind keine Optionen.

Drei Beratungsgespräche pro Monat enden mit derselben Frage: "Wie viele Agents brauchen wir denn?" Die ehrliche Antwort lautet meistens: einen weniger, als ihr gerade plant. Multi-Agent-Architekturen klingen modern und produktiv, sind aber oft die teurere und langsamere Variante eines Workflows, der mit einem einzigen LLM-Aufruf besser laufen würde. Die folgenden vier Patterns helfen, die Entscheidung sauber zu treffen, statt aus der Begeisterung für Agent-Frameworks heraus zu überbauen.

Pattern 1: Sequential Pipeline

Das einfachste Pattern. Ein Agent erledigt alles in einer linearen Kette. Schritt 1 produziert ein Ergebnis, Schritt 2 nimmt das Ergebnis als Input, Schritt 3 baut darauf auf. Kein Verzweigen, kein Delegieren, kein paralleles Arbeiten.

In n8n bauschst du das mit einer Reihe von AI-Agent-Nodes oder Claude-API-Calls, die hintereinander stehen. Der State läuft über den Item-Stream, jeder Node liest aus dem vorherigen.

Typischer Use Case ist die Eingangsrechnungs-Verarbeitung mit fester Reihenfolge. Schritt 1: PDF einlesen und Felder extrahieren (Lieferant, Datum, Betrag, Steuersatz, Rechnungsnummer). Schritt 2: Lieferant im Stammdaten-System suchen oder neu anlegen. Schritt 3: Buchungskonto anhand der Position bestimmen. Schritt 4: Buchung in DATEV oder Lexware anlegen. Wer das mit nur einem Agent macht, der "alles erledigen soll", verliert die Kontrolle darüber, was an welchem Punkt schiefgeht.

Die Token-Kosten sind die niedrigsten aller vier Patterns. Ein typischer Sequential-Workflow mit vier bis sechs Schritten liegt bei 0,5 bis 1,5 Cent pro Durchlauf. Bei 200 Rechnungen pro Monat sind das 2 bis 3 Euro, geschenkt im Vergleich zur Zeitersparnis.

Stärke: Einfach zu bauen, einfach zu debuggen, jede Stufe ist isoliert testbar. Schwäche: Wenn die Schritte sehr unterschiedliche Komplexität haben, verschwendest du Modell-Power. Eine einfache Feld-Extraktion mit Opus 4.7 zu machen, weil der nächste Schritt komplexe Argumentation braucht, kostet unnötig.

Pattern 2: Router-Pattern

Ein Triage-Agent prüft den Input und leitet ihn an einen von mehreren spezialisierten Sub-Agents weiter. Der Triage-Agent macht selbst keine inhaltliche Arbeit, er klassifiziert nur.

Typischer Use Case ist die Customer-Support-Triage. Ein eingehendes Ticket kommt rein, der Router-Agent erkennt: "Das ist eine Rechnungsfrage" oder "Das ist eine technische Frage" oder "Das ist eine Beschwerde". Je nach Klasse geht das Ticket an den Buchhaltungs-Agent, den Technical-Support-Agent oder den Eskalations-Workflow für menschliche Bearbeitung.

In n8n setzt du das mit einem AI-Klassifikations-Node plus Switch-Node um. Der Klassifikator kann ein kleines, günstiges Modell sein (Claude Haiku 4.5, GPT-Mini, lokales Hermes 4.3). Die Sub-Agents nutzen das jeweils passende Modell für ihre Spezial-Aufgabe.

Token-Kosten liegen niedrig bis mittel. Der Router selbst ist günstig (Klassifikation kostet wenig Token), die Sub-Agents schlagen je nach Aufgabe an. Bei einem typischen Support-Workflow mit Haiku-Router und Sonnet-Sub-Agent landest du bei 0,5 bis 2 Cent pro Ticket.

Stärke: Das Modell-Pricing ist optimiert. Du zahlst nur dann viel Token, wenn der Use Case es rechtfertigt. Schwäche: Der Router kann falsch klassifizieren, und dann läuft das Ticket im falschen Workflow. Wer hier nicht regelmäßig stichprobenartig prüft, hat in drei Monaten eine Liste von Beschwerden, die der Buchhaltungs-Agent kommentarlos abgeschlossen hat.

Pattern 3: Hierarchical Orchestrator

Ein Lead-Agent erhält eine komplexe Aufgabe und delegiert Teil-Aufgaben an spezialisierte Sub-Agents. Der Lead-Agent kennt das Gesamtziel, weiß welche Schritte nötig sind und ruft die Sub-Agents in der richtigen Reihenfolge auf. Die Sub-Agents kennen das Gesamtziel nicht, sondern erledigen nur ihren Auftrag.

Das entspricht dem Multiagent-Orchestration-Pattern aus den Claude Managed Agents, die Anthropic im Mai 2026 vorgestellt hat. In n8n bauast du das mit dem AI-Agent-Node, der seit Version 1.50 nativen Multi-Agent-Support hat. Der Lead-Agent ruft per Sub-Workflow-Trigger spezialisierte Workflows auf.

Typischer Use Case ist ein komplexer Vertriebs-Workflow. Lead-Agent bekommt einen neuen Lead aus dem CRM. Er delegiert: Research-Agent recherchiert die Firma (Website-Scraping, Mitarbeiter-Anzahl, Branche, Tech-Stack). Lead-Scoring-Agent bewertet den Lead anhand interner Kriterien. Personalisierungs-Agent schreibt einen ersten Email-Entwurf. Der Lead-Agent kombiniert alles, prüft Konsistenz und legt einen Entwurf zur menschlichen Freigabe an.

Die Token-Kosten sind die höchsten aller vier Patterns. Jede Delegation produziert Verbrauch für Lead und Sub. Bei einem komplexen Vertriebs-Workflow mit drei Sub-Agents landest du bei 5 bis 30 Cent pro Lead, je nach Modell-Auswahl und Recherche-Tiefe.

Stärke: Komplexe Aufgaben werden in handhabbare Teile zerlegt, jeder Sub-Agent kann mit einem optimal passenden Modell und Prompt arbeiten. Schwäche: Debugging wird anspruchsvoll. Wenn der Lead-Agent ein schlechtes Ergebnis liefert, ist nicht immer offensichtlich, welcher Sub-Agent dafür verantwortlich war.

Pattern 4: Peer-to-Peer-Critic

Zwei Agents arbeiten parallel oder seriell mit gegenseitiger Kritik. Agent A erzeugt einen Output, Agent B prüft den Output und gibt Feedback, Agent A überarbeitet, und das wiederholt sich bis ein Stop-Kriterium erreicht ist.

Typischer Use Case ist die Content-Produktion mit Qualitäts-Schleife. Texter-Agent schreibt einen Blogartikel, Lektor-Agent prüft auf Stilbruch, faktische Fehler und Anti-AI-Pattern. Texter überarbeitet basierend auf Lektor-Feedback. Nach zwei bis drei Runden hat man typischerweise ein Ergebnis, das deutlich besser ist als ein One-Shot-Output.

In n8n setzt du das mit zwei AI-Agent-Nodes plus einem Loop-Controller um. Der Loop bricht entweder bei einer maximalen Anzahl Iterationen (typisch 3) oder wenn der Lektor "ready to publish" signalisiert.

Token-Kosten sind mittel bis hoch. Beide Agents zählen pro Iteration. Bei zwei bis drei Iterationen mit Sonnet 4.6 für beide Rollen landest du bei 3 bis 8 Cent pro Artikel.

Stärke: Output-Qualität ist deutlich höher als One-Shot. Besonders nützlich bei Tasks mit subjektiver Qualität (Texte, Code-Reviews, Argumentationsketten). Schwäche: Endlos-Schleifen-Risiko, wenn das Stop-Kriterium nicht sauber definiert ist. Wir haben in einem Beratungsmandat einen Loop gesehen, der zwischen Texter und Lektor 17 Runden gedreht hat, weil beide Agents jede Korrektur des anderen wieder rückgängig machten. Hartes Maximum setzen.

Vergleichstabelle: Wann welches Pattern

Pattern	Token-Kosten	Komplexität	Debugging	Typischer Use Case
Sequential Pipeline	0,5 bis 1,5 Cent	niedrig	einfach	Rechnungsverarbeitung in fester Reihenfolge
Router-Pattern	0,5 bis 2 Cent	mittel	mittel	Support-Triage nach Kategorie
Hierarchical Orchestrator	5 bis 30 Cent	hoch	schwer	Komplexe Vertriebs-Workflows mit Research
Peer-to-Peer-Critic	3 bis 8 Cent	mittel	mittel	Content-Produktion mit Qualitäts-Schleife

Die Zahlen sind Richtwerte für Claude Sonnet 4.6 plus Haiku 4.5 in typischen KMU-Workflows. Wer Opus 4.7 als Lead-Agent einsetzt, multipliziert die Kosten in den oberen Patterns ungefähr mit drei.

Praxis-Beispiel: Schneider Industrievertretung GmbH, 18 Mitarbeiter

Eine erfundene Industrievertretung in Bayreuth, B2B-Vertrieb von Maschinenbau-Komponenten. Vier Vertriebsmitarbeiter im Außendienst, ein Innendienst-Team von drei Personen. Pro Woche kommen 15 bis 25 neue Leads über Website, Messen und LinkedIn rein.

Die Innendienst-Aufgaben pro Lead: Firma recherchieren (15 Minuten), passende Produktauswahl identifizieren (10 Minuten), Erstkontakt-Mail formulieren (10 Minuten), Termin-Vorschlag mit Vertrieb abstimmen (5 Minuten). Pro Lead also 40 Minuten Innendienst, bei 20 Leads pro Woche sind das 13 Stunden, also ein Drittel einer Vollzeitstelle.

Der gewählte Stack ist Pattern 3 (Hierarchical Orchestrator). Lead-Agent (Claude Sonnet 4.6) übernimmt die Koordination. Sub-Agents: Research-Agent (Sonnet, mit Tool-Use für Website-Scraping), Produkt-Matching-Agent (Sonnet, mit Vector-Search im Produktkatalog), Email-Entwurf-Agent (Opus 4.7 für Stil und Personalisierung). Der Lead-Agent legt am Ende einen vollständigen Vorbereitungs-Brief plus Email-Entwurf im CRM ab, das Innendienst-Team prüft und sendet.

Setup-Aufwand drei Wochen extern plus 20 Stunden intern für Prompt-Tuning. Token-Kosten pro Lead etwa 18 Cent, bei 80 Leads pro Monat also 14 Euro. Wartung 2 bis 4 Stunden pro Monat.

Nach vier Monaten Produktion: Innendienst-Zeit pro Lead von 40 auf 8 Minuten reduziert. 80 Prozent der Email-Entwürfe gehen ohne Anpassung raus, 20 Prozent werden vor dem Senden überarbeitet. Die gesparte Zeit fließt in proaktive Outbound-Kampagnen, was die Lead-Anzahl pro Woche von 20 auf 28 erhöht hat. Nettoeffekt für das Vertriebsteam: 40 Prozent mehr Pipeline bei gleichem Personalstand.

Production-Pflichten, die du nicht ignorieren darfst

Drei Punkte trennen ein Proof-of-Concept von einem Production-Workflow.

Timeout-Limits pro Node. Ein Claude-API-Call mit langer Context-Verarbeitung kann mehrere Minuten dauern. Bei einem Multi-Agent-Workflow ohne Timeouts kann ein einzelner hangender Call die gesamte Pipeline blockieren. Setze auf Node-Ebene Timeouts (typisch 60 bis 120 Sekunden) und auf Workflow-Ebene ein Global-Timeout (5 bis 10 Minuten). Wer das vergisst, baut sich genau dann ein Problem, wenn die LLM-API einen schlechten Tag hat.

Error-Workflow mit Notification. Multi-Agent-Workflows scheitern oft leise. Ein Sub-Agent gibt ein leeres Ergebnis zurück, der Lead-Agent interpretiert das als "alles fertig" und schließt den Workflow ab. Niemand merkt, dass nichts passiert ist. Lösung: jeder Production-Workflow hat einen Error-Workflow, der bei Fehlern oder Timeouts eine Notification an einen menschlichen Verantwortlichen schickt (Telegram, Slack, Mail). In n8n setzt du das im Workflow-Settings unter "Error Workflow" ein.

Audit-Log für jeden Agent-Call. Für jeden LLM-Aufruf protokollierst du: Prompt, Response, Token-Verbrauch, Modell-Version, Zeitstempel. Bei Workflows mit kaufmännischem Inhalt (Buchhaltung, Rechnungen, Verträge) ist das GoBD-Pflicht. Bei datenschutzrelevanten Workflows (Personalbewertung, Lead-Scoring mit personenbezogenen Daten) ist es Pflicht aus Art. 30 DSGVO (Verzeichnis von Verarbeitungstätigkeiten). Wer das wegspart, hat im Streitfall keine Beweisgrundlage, was der Agent tatsächlich gemacht hat.

Anti-Pattern: Multi-Agent für einfache Tasks

Die häufigste Fehlentscheidung, die wir in Beratungsmandaten sehen: Aus der Begeisterung für Agent-Frameworks heraus wird ein Pattern 3 für einen Workflow gebaut, der mit Pattern 1 oder einem einzigen LLM-Call schneller, billiger und zuverlässiger gelaufen wäre.

Ein klassischer Fall war ein KMU, das einen vierstufigen Hierarchical Orchestrator gebaut hat, um Kundenbewertungen auf Trustpilot zu klassifizieren und Antwort-Entwürfe zu generieren. Pattern 3 mit Lead-Agent, Sentiment-Agent, Faktencheck-Agent und Antwort-Agent. Token-Kosten 12 Cent pro Bewertung, Laufzeit 45 Sekunden, Wartungsaufwand 4 Stunden pro Monat.

Nach zwei Monaten haben wir das auf einen einzigen Claude-Call mit gutem Prompt umgebaut. Token-Kosten 0,8 Cent pro Bewertung, Laufzeit 4 Sekunden, Wartungsaufwand 30 Minuten pro Monat. Die Qualität der Antwort-Entwürfe war gleich.

Faustregel: Wenn ein erfahrener LLM-Nutzer den Workflow mit einem gut strukturierten Prompt in einem einzigen Aufruf schaffen könnte, brauchst du kein Multi-Agent. Multi-Agent lohnt sich erst bei Tasks, die echte Tool-Use brauchen (Datenbank-Lookups, API-Calls, Suchen) oder bei Qualitäts-Schleifen, wo der Wert durch Iteration entsteht.

Implementation in n8n: Was sich seit 2026 verändert hat

Der AI-Agent-Node in n8n hat seit Version 1.50 nativen Multi-Agent-Support. Sub-Workflow-Trigger erlauben rekursive Orchestrierung. Tool-Use für Claude Sonnet 4.6 und Opus 4.7 ist standardmäßig integriert, ohne dass du eigene HTTP-Request-Nodes für jede Funktion bauen musst.

Wichtig zu wissen: Die n8n-AI-Agent-Nodes nutzen unter der Haube LangChain. Wer komplexere Multi-Agent-Strukturen bauen will, kommt schneller voran, wenn er die LangChain-Konzepte (Agent, Tool, Memory, Chain) versteht. Für simple Pattern 1 und Pattern 2 brauchst du das nicht.

Ein häufiger Stolperstein: Memory zwischen Agents. Standardmäßig hat jeder Agent-Call seinen eigenen Kontext und vergisst nach dem Lauf alles. Wer einen Konversations-Verlauf braucht (für mehrstufige Dialoge oder iterative Workflows), muss explizit eine Memory-Konfiguration anlegen. Das ist nicht intuitiv und kostet bei den ersten Implementierungen typisch einen halben Tag Debugging.

Wer die n8n-Architektur und LLM-Integration sauber verstehen will, findet im Digitalisierungsmanager-Kurs die Module zu n8n-Workflow-Design, LLM-Tool-Use und Multi-Agent-Patterns als Bestandteil der 16-wöchigen Weiterbildung.

Häufige Fragen

Wie viele Agents sind zu viel?

Faustregel: Wenn du mehr als drei Sub-Agents im Hierarchical-Pattern hast, prüf nochmal ob das wirklich gerechtfertigt ist. Jeder zusätzliche Sub-Agent erhöht Token-Kosten, Wartungsaufwand und Debugging-Schwierigkeit überproportional. Wir haben Workflows mit acht Sub-Agents gesehen, die nach drei Monaten reduziert wurden auf zwei Sub-Agents mit besseren Prompts, und das Endergebnis war besser. Die Verlockung, jeden Spezial-Aspekt in einen eigenen Agent zu kapseln, führt zu fragiler Architektur.

Lohnt sich Pattern 4 wirklich oder ist das Spielerei?

Lohnt sich bei Tasks, wo Output-Qualität kritisch und subjektiv bewertbar ist. Content-Produktion ist das klassische Beispiel: Ein Lektor-Agent fängt Stilbrüche und faktische Schwächen ab, die ein One-Shot-Agent regelmäßig übersieht. Auch bei Code-Reviews ist der Critic sinnvoll. Bei strukturierten Aufgaben mit klarer Korrektheit (Datenextraktion, Klassifikation) ist es Verschwendung. Setze Pattern 4 nur ein, wenn du nach drei Iterationen einen messbar besseren Output bekommst als nach einer Iteration mit demselben Modell.

Kann ich Patterns auch mischen?

Ja, und in Production-Setups passiert das fast immer. Ein typischer komplexer Workflow ist: Pattern 2 (Router) als Eingang, der je nach Klasse Pattern 1 (Sequential) für einfache Fälle oder Pattern 3 (Hierarchical) für komplexe Fälle aufruft. Beim Email-Entwurf am Ende kommt dann noch Pattern 4 (Critic) dazu, um die Antwort-Qualität zu prüfen. Wichtig: Halte jede einzelne Pattern-Instanz so einfach wie möglich. Komplexität entsteht durch Komposition, nicht durch Überladen einzelner Schritte.

Welche Rolle spielen die neuen Claude Outcomes und Webhooks?

Sehr große. Anthropic hat im Mai 2026 Outcomes und Webhooks für Managed Agents vorgestellt. Outcomes ersetzen Pattern 1 in vielen Fällen vollständig: Statt eine Pipeline in n8n zu bauen, definierst du nur das Ziel und lässt Claude die Schritte selbst koordinieren. Webhooks ersetzen die n8n-Trigger-Logik durch direkte HTTPS-Endpunkte. Für einfache Workflows wird n8n dadurch in vielen Fällen überflüssig, für komplexe Multi-Provider-Setups bleibt n8n als Orchestrator wertvoll. Stand Mai 2026 ist beides Public Beta, also vorsichtig in Production einsetzen.

Zuletzt geprüft am 23. Mai 2026.

Du willst Multi-Agent-Workflows im eigenen Unternehmen aufbauen, mit Förderung für die Mitarbeiterqualifizierung? Im DigiMan-Kurs lernen deine Mitarbeiter in 16 Wochen, wie n8n, LLM-Integration und Multi-Agent-Patterns in der Praxis zusammenspielen. Mit Bildungsgutschein oder QCG-Förderung in vielen Fällen ohne Eigenanteil.

Über den Autor

Dr. Jens Aichinger ist promovierter Wirtschaftspädagoge, Gründer von SkillSprinters und seit über zehn Jahren in der digitalen Bildung tätig. Mit dem DEKRA-zertifizierten Bildungsträger SkillSprinters betreut er bundesweit KMU bei der KI-Einführung. Mehr unter skill-sprinters.de/autor/jens-aichinger/.

Bereit für deinen nächsten Karriereschritt?

Lass dich kostenlos beraten. Wir finden die passende Weiterbildung und Förderung für dich.

Weiterbildung ansehen WhatsApp

n8n Multi-Agent-Patterns mit Claude 2026: Vier bewährte Architekturen für den Mittelstand

Pattern 1: Sequential Pipeline

Pattern 2: Router-Pattern

Pattern 3: Hierarchical Orchestrator

Pattern 4: Peer-to-Peer-Critic

Vergleichstabelle: Wann welches Pattern

Praxis-Beispiel: Schneider Industrievertretung GmbH, 18 Mitarbeiter

Production-Pflichten, die du nicht ignorieren darfst

Anti-Pattern: Multi-Agent für einfache Tasks

Implementation in n8n: Was sich seit 2026 verändert hat

Häufige Fragen

Wie viele Agents sind zu viel?

Lohnt sich Pattern 4 wirklich oder ist das Spielerei?

Kann ich Patterns auch mischen?

Welche Rolle spielen die neuen Claude Outcomes und Webhooks?

Über den Autor

Bereit für deinen nächsten Karriereschritt?

Das könnte dich auch interessieren

AI Email Auto-Reply-Agent für KMU 2026: Was du automatisierst und was du besser nicht anfasst

Anthropic Code with Claude (Mai 2026): Die fünf wichtigsten Ankündigungen für KMU

Anthropic Legal MCP-Connectors (Mai 2026): Was 20 neue Tools für Anwaltskanzleien bringen

Anthropic plus SpaceX: Was die 220.000 GPUs in Memphis für Claude-Nutzer bedeuten

Claude Design mit Opus 4.7: Was das neue Anthropic-Tool für Mittelständler kann (Mai 2026)

Coding-Agents 2026 im Vergleich: Cursor, Claude Code, Cline, Aider, Continue

Wir nutzen Cookies