Auf einen Blick: KI-Telefonassistenten nehmen Anrufe an, beantworten Standardfragen, qualifizieren und buchen Termine. Stand Mai 2026 sind sie in deutscher Sprache für einfache Dialoge brauchbar. Zwei Rechtsfragen sind zentral: Art. 50 KI-VO (ab 02.08.2026) verlangt, dass der Anrufer erkennt, dass er mit einer KI spricht. Und § 201 StGB macht heimliches Aufzeichnen strafbar, ein Mitschnitt geht nur mit klarem Hinweis oder Einwilligung. Der Hebel ist hoch bei vielen gleichartigen Anrufen, der Mensch bleibt beim Abschluss.
Ein Handwerksbetrieb, der zur Stoßzeit den Hörer nicht abnimmt, verliert Aufträge. Eine Praxis, in der das Telefon im Behandlungszimmer durchklingelt, verärgert Patienten. Eine Werkstatt, die 30 gleichartige Terminanfragen am Tag bekommt, bindet eine halbe Stelle nur fürs Telefon. Genau an diesem Punkt setzen KI-Telefonassistenten an. Sie sind 2026 ein realer Hebel, aber sie kommen mit zwei rechtlichen Pflichten, die man kennen muss, bevor man ein System aktiviert. Dieser Artikel zeigt, was die Technik kann, wo sie versagt und was DSGVO, Art. 50 KI-VO und § 201 StGB konkret verlangen.
Was ein KI-Telefonassistent Stand Mai 2026 kann
Ein KI-Voice-Agent ist ein System, das Anrufe entgegennimmt, gesprochene Sprache versteht, in Echtzeit antwortet und einfache Aufgaben erledigt. Die Kette dahinter: Spracherkennung wandelt das Gesagte in Text, ein Sprachmodell versteht die Absicht und formuliert die Antwort, eine Sprachsynthese spricht sie aus. Das passiert im Idealfall in unter einer Sekunde.
Was 2026 in deutscher Sprache zuverlässig funktioniert:
- Anrufe außerhalb der Servicezeiten annehmen, statt den Anrufer ins Leere laufen zu lassen
- Standardfragen beantworten: Öffnungszeiten, Anfahrt, Verfügbarkeit, Preisrahmen
- Termine aufnehmen und in einen Kalender eintragen oder einen Rückruf vereinbaren
- den Anrufer qualifizieren: Worum geht es, ist es dringend, an wen muss weitergeleitet werden
- bei klaren Fällen direkt an den richtigen Menschen oder die richtige Abteilung weiterleiten
Was nicht funktioniert:
- echte Beratung, die auf den Einzelfall eingeht
- Verkaufsgespräche mit Verhandlung
- emotionale Situationen, Beschwerden, sensible Anliegen
- komplexe Fälle mit mehreren Verzweigungen, in denen der Anrufer mitten im Satz das Thema wechselt
Der nüchterne Stand: KI eignet sich für Erstkontakt, Qualifizierung und Routine. Der letzte Schritt zum Abschluss braucht meist einen Menschen. Wer das Telefon komplett der KI überlässt, verliert genau die Anrufe, die zählen.
Art. 50 KI-VO: Der Anrufer muss erkennen, dass er mit einer KI spricht
Das ist die wichtigste Pflicht und gleichzeitig die am leichtesten zu erfüllende. Art. 50 KI-VO regelt die Transparenzpflicht und tritt am 02.08.2026 in Kraft. Wer ein KI-System betreibt, das mit Menschen interagiert, muss sicherstellen, dass die betroffene Person erkennt, dass sie mit einer KI kommuniziert, sofern das nicht aus den Umständen offensichtlich ist.
Für den Telefonassistenten heißt das konkret: Der Anrufer muss am Gesprächsbeginn erfahren, dass er mit einer künstlichen Stimme spricht. Ein kurzer Satz reicht, etwa "Sie sprechen mit dem digitalen Assistenten der Firma Müller". Das ist keine bürokratische Hürde, sondern eine einfache Begrüßung, die ohnehin in jedes seriöse Setup gehört.
Warum die Pflicht ernst zu nehmen ist: Eine KI-Stimme klingt 2026 oft so natürlich, dass der Anrufer sie nicht von einem Menschen unterscheidet. Genau dieser Fall ist gemeint. Die Pflicht greift, weil es eben nicht offensichtlich ist. Wer den Hinweis weglässt, riskiert ein Bußgeld nach Art. 99 KI-VO und beschädigt das Vertrauen der Kunden, wenn der Schwindel auffliegt.
Eine saubere Lösung verbindet beides: Der Assistent stellt sich als digitaler Assistent vor, bietet aber jederzeit die Weiterleitung an einen Menschen an. So bleibt der Anrufer informiert und fühlt sich nicht abgewimmelt.
§ 201 StGB: Heimliches Aufzeichnen ist strafbar
Hier liegt die Falle, die viele übersehen. § 201 StGB schützt die Vertraulichkeit des Wortes. Wer das nicht-öffentlich gesprochene Wort eines anderen unbefugt auf einen Tonträger aufnimmt, macht sich strafbar. Ein Telefongespräch zwischen einem Anrufer und einem Betrieb ist nicht-öffentlich gesprochenes Wort. Das gilt auch dann, wenn auf der einen Seite eine KI sitzt.
Viele Voice-Agent-Systeme zeichnen Gespräche auf, sei es zur Qualitätssicherung, zum Training oder zur Dokumentation. Das ist nur zulässig, wenn der Anrufer informiert ist und entweder ausdrücklich zustimmt oder durch den klaren Hinweis und die Fortsetzung des Gesprächs konkludent einwilligt. Ein heimlicher Mitschnitt ohne Hinweis ist eine Straftat, kein Datenschutzverstoß im Hintergrund, sondern ein Tatbestand mit Freiheits- oder Geldstrafe.
In der Praxis heißt das: Wenn der Assistent das Gespräch aufzeichnet, gehört der Hinweis "Dieses Gespräch wird zu Qualitätszwecken aufgezeichnet" an den Anfang, bevor die Aufnahme läuft. Der Anrufer muss die Möglichkeit haben, der Aufnahme zu widersprechen oder aufzulegen. Wer keine Aufzeichnung braucht, vermeidet das Thema komplett, indem er nur das transkribierte Ergebnis oder eine Zusammenfassung speichert, nicht die Roh-Aufnahme. Auch dann gilt aber: Transkripte sind personenbezogene Daten und brauchen eine DSGVO-Rechtsgrundlage.
DSGVO: Auftragsverarbeitung und Rechtsgrundlage
Telefonate enthalten fast immer personenbezogene Daten: Name, Telefonnummer, Anliegen, manchmal Gesundheits- oder Vertragsdaten. Damit ist die DSGVO in voller Breite einschlägig.
Wer einen externen Voice-Agent-Dienst nutzt, schließt mit dem Anbieter einen Auftragsverarbeitungsvertrag nach Art. 28 DSGVO. Der Anbieter verarbeitet die Sprach- und Gesprächsdaten im Auftrag des Betriebs. Ohne diesen Vertrag fehlt die rechtliche Basis für die Weitergabe der Daten an den Dienstleister.
Für die Verarbeitung selbst braucht es eine Rechtsgrundlage. Die Bearbeitung einer Anfrage, also Terminvereinbarung oder Auskunft, lässt sich meist auf Art. 6 Abs. 1 lit. b DSGVO (Vertragsanbahnung) oder lit. f (berechtigtes Interesse) stützen. Für eine Aufzeichnung über die reine Bearbeitung hinaus ist in der Regel die Einwilligung nach Art. 6 Abs. 1 lit. a DSGVO der sichere Weg.
Besonders heikel ist der Drittlandtransfer. Viele Voice-Agent-Anbieter hosten in den USA oder leiten Sprachdaten dorthin. Sprachdaten sind besonders sensibel, weil die Stimme selbst ein biometrisches Merkmal sein kann. EU-Hosting ist die saubere Wahl. Wo das nicht geht, sollte der Anbieter zumindest nach dem EU-US Data Privacy Framework zertifiziert sein. Ein klarer Ausschluss vom Modelltraining gehört in jeden Vertrag.
Technik: Worauf es bei der Auswahl ankommt
Zwei technische Faktoren entscheiden, ob ein Voice-Agent im Betrieb taugt oder den Kunden vergrault.
Der erste ist die Latenz. Lange Antwortzeiten wirken unnatürlich und machen das Gespräch zäh. Wenn nach jeder Frage zwei Sekunden Stille kommen, legt der Anrufer auf. Gute Systeme reagieren in unter einer Sekunde. Bei der Auswahl lohnt ein Testanruf zu Stoßzeiten, nicht nur in der ruhigen Demo-Umgebung.
Der zweite ist die Mailbox- und Anrufbeantwortererkennung. Wenn der Assistent ausgehende Anrufe tätigt und nicht erkennt, dass er auf einer Mailbox gelandet ist, redet er gegen das Band und hinterlässt peinliche Halbsätze. Das ist eine der häufigsten Schwachstellen. Bei eingehenden Anrufen entfällt das Problem, bei ausgehenden ist es ein wichtiges Auswahlkriterium.
Dazu kommen weichere Faktoren: Wie gut versteht das System Dialekt und Hintergrundlärm? Wie sauber leitet es weiter, wenn es nicht weiterweiß? Wie zuverlässig erkennt es, wann ein Mensch ran muss? Diese Punkte lassen sich nur im echten Betrieb beurteilen, deshalb gehört eine Testphase mit begrenztem Volumen an den Anfang jeder Einführung.
Wo KI sinnvoll ist und wo der Mensch ran muss
In der Praxis sehen wir eine klare Trennlinie. KI eignet sich für den Anfang und die Routine eines Anrufs, der Mensch für den Kern und den Abschluss.
Sinnvoll sind: Terminannahme, Öffnungszeiten, Statusabfragen, Anfahrtsbeschreibung, Vorqualifizierung und die Weiterleitung an die richtige Stelle. Das sind die Anrufe, die sich wiederholen und die ein Mensch ohnehin halb gelangweilt abarbeitet.
Nicht sinnvoll sind: Beratung, Verkauf, Beschwerden, sensible Anliegen. Wer hier die KI alleine lässt, verliert genau die Anrufe, die Geld bringen oder Schaden verhindern. Ein verärgerter Kunde, der von einer KI abgewimmelt wird, ist verloren. Eine Beratung, die der Assistent oberflächlich abhandelt, kostet einen Abschluss.
Die Kosten richten sich meist nach Gesprächsminuten. Für KMU lohnt sich der Einsatz, wenn viele gleichartige Anrufe anfallen: Terminvergabe, Standardfragen, Status. Wer dagegen wenige, aber komplexe Anrufe hat, holt mit einem Voice-Agent wenig heraus und sollte das Geld lieber in Erreichbarkeit durch echte Menschen stecken.
Schritt für Schritt: Einen Voice-Agent rechtssicher einführen
Wer das Thema strukturiert angeht, vermeidet die typischen Fehler.
- Use Case eingrenzen. Definiere genau, welche Anrufe der Assistent übernehmen soll und ab wann ein Mensch übernimmt. Je enger der Rahmen, desto zuverlässiger das System.
- Anbieter prüfen. Achte auf EU-Hosting, einen Auftragsverarbeitungsvertrag nach Art. 28 DSGVO, den Ausschluss vom Modelltraining und eine niedrige Latenz. Mache einen echten Testanruf.
- Transparenz einbauen. Der Assistent stellt sich am Gesprächsbeginn als digitaler Assistent vor (Art. 50 KI-VO) und bietet jederzeit die Weiterleitung an einen Menschen an.
- Aufzeichnung klären. Entscheide bewusst, ob du aufzeichnest. Wenn ja, kommt der Hinweis vor die Aufnahme (§ 201 StGB). Wenn du keine Aufnahme brauchst, speichere nur Zusammenfassungen.
- Eskalation definieren. Lege fest, bei welchen Stichworten oder Anliegen der Assistent sofort an einen Menschen weiterleitet, etwa bei "Beschwerde", "dringend" oder bei einem Anliegen, das er nicht versteht.
- Testphase mit begrenztem Volumen. Lass den Assistenten zunächst nur außerhalb der Servicezeiten laufen oder nur einen Teil der Anrufe übernehmen. Höre dir Mitschnitte an (mit Hinweis), prüfe die Qualität.
- Schulung und Dokumentation. Mitarbeiter, die den Assistenten betreuen, müssen ihn verstehen (Art. 4 KI-VO). Dokumentiere Einsatzzweck, Anbieter, Rechtsgrundlagen und Aufbewahrungsfristen.
Praxis: Zahnarztpraxis Dr. Linden in Augsburg
Ein konstruiertes, aber typisches Beispiel. Die Zahnarztpraxis Dr. Linden in Augsburg, neun Mitarbeiter, hatte ein Dauerproblem: Das Telefon klingelte den ganzen Tag, oft während der Behandlung, und die Mitarbeiter am Empfang kamen nicht hinterher. Viele Anrufer landeten in der Warteschleife und legten auf, ein Teil der Termine ging verloren.
Was sie tun: Seit März 2026 nimmt ein EU-gehosteter KI-Telefonassistent Anrufe an, wenn der Empfang besetzt ist oder außerhalb der Servicezeiten. Der Assistent stellt sich als digitaler Assistent der Praxis vor, beantwortet Fragen zu Öffnungszeiten und Anfahrt, nimmt Terminwünsche auf und vermerkt dringende Fälle für einen Rückruf. Schmerzpatienten und alles, was nach Beratung klingt, leitet er sofort an den Empfang weiter, sobald der wieder frei ist.
Was sie nicht tun: Sie zeichnen keine Gespräche auf, weil der Aufwand für die Einwilligung und die besondere Sensibilität von Gesundheitsdaten in einer Praxis das Risiko nicht wert ist. Der Assistent speichert nur eine kurze Notiz zum Anliegen und den Terminwunsch. Diagnosen und Behandlungsgespräche laufen nie über die KI.
Aufwand für die Einführung: Zwei Wochen, davon eine Woche für die Anbieterauswahl und den Auftragsverarbeitungsvertrag, eine Woche für Test und Feinschliff der Antworten. Laufende Kosten richten sich nach Gesprächsminuten, in einer Praxis dieser Größe ein überschaubarer Betrag pro Monat.
Praxisinhaberin Dr. Linden sieht den Hebel weniger in der Zeitersparnis als in den nicht mehr verlorenen Anrufen. Wer früher in der Warteschleife auflegte, bekommt jetzt zumindest einen Termin oder einen Rückruf. Das zahlt direkt auf den Praxisumsatz ein. Wer überlegt, KI im Betrieb breiter einzusetzen, findet im Digitalisierungsmanager eine viermonatige geförderte Weiterbildung, in der Teilnehmer lernen, solche Systeme rechtssicher und sinnvoll aufzusetzen. Mit Bildungsgutschein nach § 81 SGB III sind die Kursgebühren 0 Euro.
Was Voice-Agents im Betrieb wirklich verändern
Wer das Telefon als lästige Pflicht sieht, unterschätzt, wie viel Geschäft dort beginnt. Ein verpasster Anruf ist oft ein verlorener Auftrag. Ein KI-Telefonassistent löst dieses Problem nicht vollständig, aber er fängt die Anrufe ab, die sonst ins Leere laufen, und er entlastet die Mitarbeiter von der Routine. Der entscheidende Punkt ist die Trennung: Die KI übernimmt das Gleichförmige, der Mensch das Wichtige.
Wer einen Voice-Agent einführt, sollte ihn nicht als Sparmaßnahme verstehen, sondern als Erweiterung der Erreichbarkeit. Wer ihn als Ersatz für echte Menschen am Telefon einsetzt, vergrault die Kunden, die persönlich behandelt werden wollen. Mit der richtigen Trennung, einem ehrlichen Transparenzhinweis und einem sauberen DSGVO-Setup ist der Hebel für viele KMU real.
Häufige Fragen
Muss ich Anrufer darüber informieren, dass sie mit einer KI sprechen?
Ja. Art. 50 KI-VO, in Kraft ab dem 02.08.2026, verlangt, dass eine Person erkennt, dass sie mit einer KI interagiert, sofern das nicht offensichtlich ist. Da eine KI-Stimme 2026 oft täuschend natürlich klingt, ist genau dieser Fall gemeint. Ein kurzer Satz am Gesprächsbeginn wie "Sie sprechen mit dem digitalen Assistenten der Firma X" reicht. Wer den Hinweis weglässt, riskiert ein Bußgeld nach Art. 99 KI-VO und beschädigt das Vertrauen der Kunden.
Darf ein KI-Telefonassistent Gespräche aufzeichnen?
Nur mit klarem Hinweis und Einwilligung. § 201 StGB schützt die Vertraulichkeit des Wortes, ein heimliches Aufzeichnen nicht-öffentlich gesprochener Worte ist strafbar. Wenn der Assistent aufzeichnet, gehört der Hinweis vor die Aufnahme, und der Anrufer muss widersprechen oder auflegen können. Zusätzlich brauchst du eine DSGVO-Rechtsgrundlage, meist die Einwilligung nach Art. 6 Abs. 1 lit. a DSGVO. Wer keine Aufzeichnung braucht, speichert nur eine Zusammenfassung des Anliegens und vermeidet das Thema.
Welche DSGVO-Pflichten gelten beim KI-Telefonassistenten?
Telefonate enthalten personenbezogene Daten, daher ist die DSGVO einschlägig. Mit dem Anbieter schließt du einen Auftragsverarbeitungsvertrag nach Art. 28 DSGVO. Für die Bearbeitung einer Anfrage genügt meist Art. 6 Abs. 1 lit. b DSGVO (Vertragsanbahnung) oder lit. f (berechtigtes Interesse), für eine Aufzeichnung die Einwilligung. Beim Anbieter solltest du auf EU-Hosting und den Ausschluss vom Modelltraining achten, weil Sprachdaten besonders sensibel sind. Bei US-Anbietern ist der Drittlandtransfer nach Art. 44 ff. DSGVO zu prüfen.
Für welche Anrufe lohnt sich ein KI-Telefonassistent?
Für viele gleichartige Anrufe: Terminannahme, Öffnungszeiten, Statusabfragen, Anfahrt, Vorqualifizierung und Weiterleitung. Genau die Anrufe, die sich wiederholen und Routine sind. Nicht geeignet ist die KI für Beratung, Verkauf und Beschwerden, dort gehört ein Mensch ran. Wer wenige, aber komplexe Anrufe hat, holt mit einem Voice-Agent wenig heraus. Der größte Hebel entsteht in Betrieben mit hohem Anrufaufkommen und vielen Standardanfragen, etwa Praxen, Werkstätten oder Handwerksbetrieben.
Über den Autor
Dr. Jens Aichinger ist promovierter Wirtschaftspädagoge und Inhaber von SkillSprinters, einem DEKRA-zertifizierten Bildungsträger. Er entwickelt seit 2024 KI-gestützte Weiterbildungs- und Prozessautomatisierungslösungen für den Mittelstand. Über Skill-Sprinters läuft auch der Digitalisierungsmanager, eine 4-monatige geförderte Weiterbildung.
30 Minuten Klarheit kosten nichts. Wenn Du KI im Betrieb einsetzt oder überlegst einzusetzen, kommt es nicht auf das Tool an. Es kommt auf die Frage: wo entstehen Risiken, wo Hebel? In 30 Minuten gehen wir Deine konkrete Lage durch und Du weißt, wo Du anfangen solltest. Termin reservieren oder kostenlosen KI-Schnupperkurs starten.
Zuletzt geprüft am 27. Mai 2026.
Bereit für deinen nächsten Karriereschritt?
Lass dich kostenlos beraten. Wir finden die passende Weiterbildung und Förderung für dich.