Die Verwalter-Hotline ist einer der lautesten Engpässe im Alltag einer Hausverwaltung. Montagmorgens gegen neun, in der ersten Januarwoche der Heizperiode, am ersten Werktag nach einem Gewitterwochenende — in diesen Zeitfenstern häufen sich Anrufe mit immer ähnlichem Inhalt. Mieter fragen nach dem Status ihrer vorletzte Woche gemeldeten Schadensmeldung, Eigentümer erkundigen sich nach dem nächsten Wartungstermin, Handwerker melden sich wegen Zugangsfragen. Die Antworten stehen überwiegend in der Verwaltungssoftware, aber sie kommen nicht rechtzeitig zum Anrufer zurück.
In dieses Vakuum stoßen seit einiger Zeit KI-gestützte Telefon-Assistenten — sogenannte Voicebots —, die versprechen, Routineanfragen rund um die Uhr entgegenzunehmen, den Anrufer zu identifizieren und strukturierte Auskünfte zu liefern. Die Frage für jede Verwaltung ist nicht mehr, ob solche Systeme funktionieren, sondern unter welchen Bedingungen sie rechtssicher, datenschutzkonform und fachlich seriös eingesetzt werden können.
Was ein Voicebot realistisch leistet
Ein professionell eingesetzter Voicebot ist kein Gesprächspartner, sondern ein schreibgeschützter Auskunfts-Agent mit eng definierten Schreib-Intents. Technisch besteht er aus drei Komponenten: der Telefonie-Anbindung über einen SIP-Provider, einem Spracherkennungs- und Sprachausgabe-Modul und einem Intent-Router, der natürliche Sprache in eine überschaubare Zahl vordefinierter Aktionen übersetzt. Die meisten in der Hausverwaltung sinnvollen Anwendungsfälle lassen sich auf fünf bis sieben solcher Intents reduzieren: Status einer Schadensmeldung abfragen, neue Schadensmeldung aufnehmen, Sprechzeiten des Hausmeisters nennen, Rückruf vereinbaren, auf einen Mitarbeiter durchstellen.
Alles darüber hinaus — freies Gespräch, komplexe Vertragsauslegung, Reklamationsbearbeitung — gehört aus guten Gründen nicht in die Zuständigkeit eines Voicebots der ersten Generation. Die Verantwortung für die fachliche Beurteilung, für Beweissicherung und für empathische Gesprächsführung bleibt beim Menschen.
Der DSGVO-Rahmen ist nicht optional
Telefonate sind personenbezogene Daten. Das beginnt bei der Rufnummer (nach Art. 4 Nr. 1 DSGVO), setzt sich fort über Transkripte und Audioaufnahmen und endet erst bei den Metadaten zu Dauer und Zeitpunkt. Wer einen Voicebot einsetzt, wird zum Verantwortlichen im Sinne der DSGVO für jeden dieser Verarbeitungsschritte — auch dann, wenn der technische Betrieb einem spezialisierten Anbieter überlassen wird.
Daraus ergeben sich mehrere nicht verhandelbare Anforderungen:
- Auftragsverarbeitungsvertrag (Art. 28 DSGVO) mit dem Voicebot-Anbieter, der Serverstandort, Subdienstleister, technisch-organisatorische Maßnahmen und Löschfristen verbindlich regelt. Anbieter ohne EU-Rechenzentrum und ohne transparente Subauftragnehmer-Kette fallen für eine seriöse Auswahl aus.
- Einwilligungs-Bandansage am Gesprächsbeginn, die den Anrufer darüber informiert, dass das Gespräch automatisiert verarbeitet wird, und eine unmittelbare Opt-Out-Möglichkeit auf einen menschlichen Mitarbeiter eröffnet. Diese Ansage ist zugleich Transparenzmaßnahme nach Art. 13 DSGVO und Einwilligung im Sinne des TTDSG, soweit Aufzeichnungen erfolgen.
- Löschkonzept mit tatsächlichen Fristen. Transkripte benötigen in den seltensten Fällen eine Aufbewahrung jenseits von 30 bis 90 Tagen. Audioaufnahmen sind im Regelfall gar nicht erforderlich und sollten als Default deaktiviert sein. Wer Audio aktiviert, löst praktisch eine Datenschutz-Folgenabschätzung nach Art. 35 DSGVO aus.
- Verzicht auf Sprachbiometrie. Die stimmliche Wiedererkennung eines Anrufers ist biometrische Verarbeitung nach Art. 9 DSGVO und verlangt eine ausdrückliche Einwilligung sowie zwingend eine DSFA. Für einen Auskunfts-Agenten ist sie weder nötig noch empfehlenswert. Die Rufnummer — normalisiert nach E.164 — genügt für einen Abgleich gegen bereits gespeicherte Mieter- und Eigentümerdaten vollständig.
Harte Grenzen: wo der Voicebot schweigen muss
Nicht alles, was technisch ginge, sollte in einem Voicebot abgebildet werden. Die Grenze verläuft dort, wo aus einer Auskunft eine rechtsverbindliche Handlung wird oder wo die Folgen einer Fehlinterpretation finanziell oder persönlich schwer werden.
- Zahlungsabwicklung gehört in keinen Telefon-Kanal. Ein Voicebot, der nach IBAN-Diktat Betragsbestätigungen entgegennimmt, ist eine offene Flanke für Enkeltrick-Adaptionen und Social Engineering. Die Zahlungsabwicklung läuft weiterhin über SEPA-Mandate und Banking-Vorgänge mit starker Kundenauthentifizierung nach PSD2.
- Kündigungen und kündigungsähnliche Erklärungen verlangen nach § 568 BGB die Schriftform. Eine Wohnungskündigung, die ein Mieter dem Voicebot diktiert, ist unwirksam. Der Voicebot muss entsprechende Anliegen erkennen und sofort an einen Mitarbeiter durchstellen — nicht, weil er nicht antworten könnte, sondern weil seine Antwort dem Anrufer rechtlich schaden würde.
- Vertragsauskünfte mit finanzieller Tragweite (Mietpreisanpassung, Nebenkostennachzahlung, Kautionsrückzahlung) bleiben ebenfalls im menschlichen Kanal. Ein falsch verstandener Betrag am Telefon wird regelmäßig zum Streit, der sich schriftlich vermeiden ließe.
- Notfallsituationen — Wasserrohrbruch, Gasgeruch, Aufzugsnotruf — brauchen einen unmissverständlichen Erkennungspfad und einen sofortigen Transfer. Kein Voicebot darf zwischen Mieter und Feuerwehr stehen.
Die Datenbasis liegt bereits vor
Der häufigste Einwand gegen einen Voicebot — „wir müssten erst unsere Daten aufräumen” — greift in der Praxis seltener, als man erwartet. Eine ordentlich geführte Hausverwaltungssoftware enthält die für einen Auskunfts-Agenten benötigten Felder bereits: Rufnummern von Mietern und Eigentümern, Anfragen mit Status und Zuständigkeitsinformationen, Hausmeister-Durchwahlen und Sprechzeiten. Was es braucht, ist nicht eine neue Datenwolke, sondern eine saubere Abbildung dieser vorhandenen Felder auf die Intent-Ausgaben des Bots.
In der Praxis zeigt sich, dass zwei vorbereitende Arbeiten wichtiger sind als jede Modellwahl: die E.164-Normalisierung aller Telefonnummern (damit der Rufnummern-Abgleich deterministisch funktioniert) und die Vereinheitlichung der Anfragen-Kategorien, damit aus einem Status-Intent überhaupt eine verständliche Auskunft entstehen kann.
Ein praktisches Beispiel
Eine Mieterin im Objekt einer mittelgroßen Verwaltung hat am Dienstag um neun Uhr einen Rohrschaden gemeldet. Am Mittwoch gegen achtzehn Uhr — außerhalb der Bürozeiten — ruft sie an, um sich zu erkundigen. Der Voicebot nimmt den Anruf entgegen, erkennt die Nummer als die einer hinterlegten Mieterin, spricht die Einwilligungs-Ansage und fragt nach dem Anliegen. Auf die Bitte um den Bearbeitungsstand liest er die letzte, für den Mieter bestimmte Statusmeldung aus der Verwaltungssoftware vor, nennt das voraussichtliche Wartungsfenster — „Ein Hausmeister-Einsatz ist für Donnerstagvormittag vorgesehen” —, verzichtet auf die namentliche Nennung des Mitarbeiters und bietet einen Rückruf am nächsten Werktag an. Ist die Mieterin einverstanden, legt das System einen entsprechenden Eintrag in der Aufgabenliste der Verwaltung an.
Das gesamte Gespräch dauert unter zwei Minuten, es gibt keine Warteschleife, der Verwalter findet am nächsten Morgen den dokumentierten Rückrufwunsch in seiner Aufgabenliste. Weder musste jemand spätnachts erreichbar sein, noch hat die Mieterin eine E-Mail geschrieben, die sich in einem vollen Posteingang verloren hätte.
Was Verwalter vor der Einführung prüfen sollten
Ein sinnvoll vorbereiteter Produkt-Auswahlprozess beantwortet mindestens fünf Fragen:
- Serverstandort und Subdienstleister — rein in der EU, mit namentlich benannten Subauftragnehmern im AVV. US-gehostete Modelle scheiden ohne Schrems-II-konforme Transferfolgenabschätzung aus.
- Aufbewahrungsfristen konfigurierbar — Transkripte standardmäßig unter 90 Tage, Audio standardmäßig deaktiviert, Löschfunktion für einzelne Gespräche zur Bearbeitung von Auskunfts- und Löschungsverlangen nach Art. 15 und 17 DSGVO.
- Transparente Intent-Konfiguration — der Verwalter muss sehen und dokumentieren können, welche Anliegen der Bot beantworten darf und welche zum Transfer führen. Eine Black-Box-Konfiguration ist im Verwaltungskontext ungeeignet.
- Kostenkontrolle — monatliche Minuten- oder Anruflimits, die nicht stillschweigend überschritten werden, sondern den Bot in einen definierten Voicemail-Fallback überführen.
- Austauschbarkeit des Anbieters — die Anbindung sollte hinter einer Abstraktion erfolgen, damit ein späterer Wechsel des Voicebot-Anbieters nicht das gesamte Verwaltungs-Setup ins Wanken bringt.
Wo wir stehen
Das Epic zur ImmoGenio-Telefonanbindung ist beschlossen. Die Architektur sieht eine Provider-Abstraktion vor, die in der ersten Iteration mit einem DSGVO-konformen deutschen Anbieter umgesetzt wird, aber austauschbar bleibt. Die Anrufer-Identifikation greift auf die bereits gepflegten Telefonnummern in den Mieter-, Eigentümer- und Hausmeister-Stammdaten zu. Sechs MVP-Intents sind definiert, die Schreib-Grenzen sind architektonisch erzwungen — das System hat schlicht keinen technischen Zugang zu Verträgen, Buchungen oder Kautionskonten und kann dort auch bei bestem Willen keine Änderungen vornehmen. Transkripte werden pro Mandant mit konfigurierbarer Retention zwischen sieben und neunzig Tagen gehalten, Audio bleibt standardmäßig deaktiviert, ein Kostenlimit pro Monat schützt vor Überraschungen.
Was Sie nicht erleben werden: einen Bot, der eigenmächtig kündigt, Beträge bestätigt oder Vertragsänderungen zusichert. Was Sie erleben werden: einen Kanal, der den Montagmorgen-Stau abfängt, strukturierte Rückmeldungen zu Routinefragen gibt und den Verwalter für die Gespräche freihält, in denen ein Mensch unverzichtbar ist.
Fragen, Rückmeldungen oder eigene Erfahrungen mit telefonischen KI-Assistenten im Verwaltungsbetrieb? Wir freuen uns über Ihre Nachricht an kontakt@immogenio.de.