Natural Language Processing bei der TeamBank

Seit 2017 konzentriert sich die TeamBank verstärkt auf den Ausbau von Data Analytics und hat dazu einen eigenen Bereich „Data Analytics Center“ neu gegründet. Hier arbeiten Data Scientisten und Data Analysten an Themen wie Machine Learning, Text-Mining und Chatbots und setzen dazu Tools wie Python und Jupyter Notebook ein. Ein Thema, das für die TeamBank viel Potential birgt, ist das sogenannte Natural Language Processing (NLP). Dabei werden Techniken und Methoden verwendet, um natürliche Sprache maschinell verarbeiten zu können. Typische Spracherkennungen kennt jeder von Siri und Alexa.  Aber was hat das eigentlich mit einer Bank zu tun? Magdalena Deschner ist Data Scientist und arbeitet bei der TeamBank an dem Thema Natural Language Processing.

Magdalena, warum ist NLP für die TeamBank so wichtig und an welchen Ideen arbeitest du gerade?

Das Thema NLP setzen wir genau dort ein, wo wir mit diesen Technologien Prozesse automatisieren können und damit schneller für unseren Kunden werden. Wo viele Texte entstehen, ist oft auch viel menschliches Know-how und Zeit nötig, um diese Texte bewerten zu können. Wenn uns ein Kunde zum Beispiel eine E-Mail schickt, wollen wir ihm so zügig wie möglich eine zufriedenstellende und abschließende Antwort geben. Dazu muss ein Mensch den Inhalt der E-Mail schnell erfassen und an den richtigen Sachbearbeiter weiterleiten. Bei mehreren Hundert E-Mails am Tag kann das sehr viel Zeit in Anspruch nehmen. Hier kann uns NLP helfen, die Semantik, die Syntax und weitere relevante Merkmale einer E-Mail zu erkennen. So könnte zum Beispiel eine Adressänderung, die der Kunde per E-Mail mitteilt, vom E-Mail-Eingang bis Anpassung im System automatisch durchgeführt werden. Die Maschine kann das mittels neuer Technologien viel schneller als ein Mensch und trotzdem sehr treffsicher. Der Kunde bekommt damit schneller aber immer noch persönlich eine Antwort auf sein Anliegen.

Das klingt sehr effizient. Wie setzt du das Thema aktuell um und welche Herausforderungen gibt es dabei?

Aktuell haben wir aus allen möglichen Prozessen, die durch eine Kundenmail ausgelöst werden können, einen Beispielprozess herausgenommen. Mit Python und verfügbaren Paketen für die deutsche Sprache  habe ich einen Prototypen entwickelt. Dieser wird mit Hilfe einer Flask API von einem Workflow System aufgerufen. Das Workflow System kann dann mit den gelieferten Infos aus der Schnittstelle den entsprechenden Prozess weiterverarbeiten und abschließen.

Bei der Extraktion des Inhalts gibt es einige Herausforderungen. So beinhalten E-Mails nicht immer einen Text, sondern enthalten die relevanten Informationen in Form eines PDF oder Bild-Anhangs. Für diese Fälle werde ich Methoden zur Extraktion von Buchstaben und Texten aus Bildern oder PDF-Dokumenten einsetzen. Ebenfalls ist die Forschung im NLP Bereich für die englische Sprache beispielsweise um einiges fortgeschrittener als für Deutsch. Eine weitere Herausforderung ist, dass Kunden nicht immer ihre Kundendaten, wie z.B. Kundennummer oder ihren vollständigen Namen in die E-Mail reinschreiben, sodass der Prozess nicht abschließend erledigt werden kann. Für solche Fälle konzeptioniere ich ein System, das erkennt, wenn relevante Daten fehlen und dem Kunden zeitnah eine entsprechende Nachricht schickt mit der Aufforderung die fehlenden Daten bereit zu stellen.

Welches Potential siehst du für die Bank in Zukunft noch für NLP-Themen?

Vor allem im Kontakt mit unseren Kunden können wir durch NLP einen noch besseren Service bieten, nämlich wenn die Maschine erkennt, aus welchem Grund ein Kunde uns kontaktiert und umgehend eine Lösung vorschlägt. Dabei erreichen uns nicht nur Anliegen per E-Mail, sondern auch über andere Kanäle, wie z.B. per Chat und Telefon. Jeder Kanal hat seine Eigenheiten und bedarf spezieller Methoden, um das Kundenanliegen automatisiert erfassen und bearbeiten zu können. So muss bei einem Telefonat die gesprochene Sprache zunächst in Text transformiert werden bevor das Anliegen automatisiert verarbeitet werden kann. Bei einem Chat hingegen erwarten uns eher kurze Sätze in umgangssprachlichem Stil. Die Maschine muss dann speziell diesen Sprachstil erlernen, um den Kundenwunsch zu verstehen.

Ein weiteres Anwendungsgebiet für NLP bieten Kundenbewertungen. Diese finden sich auf Vergleichsplattformen, sozialen Netzwerken und anderen Kanälen. Wenn diese Datenquellen verknüpft werden können, so ist eine Auswertung der gesamten Kundenwünsche und -meinungen möglich. NLP ist mittlerweile fähig, Themen sowie Emotionen aus einem Text zu extrahieren, Texte automatisiert zusammenzufassen uvm. Einzelne Personen könnten die Menge an Texten kaum bewältigen und die Kundenmeinungen könnten nur schwer beachtet werden. Werden die Kundenmeinungen automatisiert verarbeitet, sind wir dazu in der Lage in Sekunden die Meinung von Tausenden Nutzern zu verstehen und unser Produkt dementsprechend weiterzuentwickeln.

Danke für den Ausblick, Magdalena. Die neuen Technologien ermöglichen auf der einen Seite die Verarbeitung großer Datenmengen. Auf der anderen Seite sind viele Verbraucher aber verunsichert, wenn es um den Schutz ihrer Daten geht. Welche Rolle spielt das in deiner Arbeit.

Bei aller Euphorie für die Erprobung neuer Technologien werden vor jedem Use-Case die datenschutzrechtlichen Bestimmungen geprüft. Gerade durch die Datenschutzgrundverordnung haben sich die Rechte der Verbraucher geschärft, die gilt es täglich zu wahren. Dadurch entsteht aber auch eine neu gewonnene Transparenz, die zum Teil ermöglicht, Daten für tiefere Einblicke zu nutzen und somit die Produkte, Prozesse und Dienstleistungen für alle Beteiligte zu verbessen. Wir beschäftigen uns also sehr intensiv mit dem Thema Datenschutz und auch mit der digitalen Verantwortung, die wir mit der Verarbeitung von Daten haben.