Eingabehilfen öffnen

  • Inhaltsskalierung 100%
  • Schriftgröße 100%
  • Zeilenhöhe 100%
  • Buchstabenabstand 100%

KI-Blog

End-to-End-Automatisierung des Firmenkreditprozesses

Texterkennung, TextMining und Künstliche Intelligenz


Ein Beitrag von Andreas Strunz

In Folge 2 unserer Artikelserie „End-to-End-Automatisierung des Firmenkreditprozesses“ wollen wir uns eingehender mit der Frage beschäftigen, welche Rolle Technologien wie klassische Texterkennung, TextMining und Künstliche Intelligenz im Zusammenhang mit der Automatisierung des Firmenkreditprozesses spielen.

Dokumenteneingangskanäle

Zunächst ist der Umstand zu betrachten, dass es für Dokumente und Informationen, die für den Firmenkreditprozess benötigt werden, nicht nur einen, sondern eine Vielzahl von Eingangskanälen gibt. Das reicht von der persönlichen Übergabe im Rahmen des Kreditgesprächs, dem Posteingang und dem Eingang als E-Mail-Anhang bis hin zu moderneren Varianten wie dem Upload im zugangsgeschützten Bereich des Online-Bankings. 

Ein Kreditinstitut kann sich also in aller Regel nicht auf nur einen Eingangskanal beschränken. Das entspricht auch der heutigen Bedeutung des Multikanalmanagements und den Veränderungen bei der Nutzung der Kanäle durch die Kunden. Während das klassische Fax, wenn überhaupt noch im Einsatz, langfristig wohl keine Rolle mehr spielen wird, sind E-Mail, Online-Banking und standardisierte Schnittstellen, wie etwa DATEV für Steuerberaterinformationen weiter auf dem Vormarsch.

Eine kürzlich von der msg GillardonBSM durchgeführte Studie unter Fach- und Führungskräften aus dem Vertrieb und Kundenmanagement von Banken machte dies nochmals deutlich. Nahezu alle Befragten stimmten dabei der Aussage zu, dass der Orchestrierung der Kanäle eine große Bedeutung zukommt und dass auch die Kunden digital mündiger werden.

Digital ist nicht gleich digital

Je nachdem, welcher Eingangskanal gewählt wurde, schließen sich daran unterschiedliche Prozess-Schritte an (Ausdruck, physische Ablage, Speicherung von Anhängen, Speicherung von Uploads). Die Problematik besteht im klassischen, nicht automatisierten Prozess allerdings in der manuellen, fehleranfälligen Erfassung, in der u.U. lokalen Speicherung von personenbezogenen Daten, dem fehlenden digitalen Workflow im Anschluss an die Erfassung und der Tatsache, dass Daten nicht für weitere Auswertungen über alle Kreditnehmer hinweg oder Reportings verfügbar sind.

Am Ende der automatisierten Verarbeitung steht daher immer das Ziel, den Inhalt eines Dokuments in maschinenlesbare und interpretierbare Form zu überführen, idealerweise in Form eines Datenbankeintrags. Das bringt dann die Potenziale der Prozessautomation erst so richtig zur Geltung.

Dabei ist digital nicht gleich digital, was uns zur Frage des Digitalisierungsgrades und der  Dokumentenarten führt.

Digitalisierungsgrad und Dokumentenarten

Dokumente in Papierform, also analog, sind natürlich am weitesten von dem gewünschten Digitalisierungsgrad entfernt. Der erste Schritt ist hier das zeit- und kostenaufwändige Einscannen, weshalb es im Interesse des Kreditinstituts ist, diesen Bearbeitungsschritt, wo möglich, durch den Einreicher erledigen zu lassen. Scanner erzeugen allerdings Rastergrafiken, also in Pixel unterteilte Bilder mit unterschiedlichen Farb- und Helligkeitswerten je Bildpunkt (gemessen bspw. in HSL, englisch für hue, lightness und saturation). Ähnliches gilt auch für eingereichte Bilder, etwa im JPG-Format.

Das fehlerfreie Zurückführen der Bildpunkte in digitale Zeichen, überwiegend im UTF-8 Unicode-Format, stellt daher eine besondere Herausforderung dar. Insbesondere wenn dann noch das Erkennen von Handschriften oder die Eliminierung von Verschmutzungen und Textüberlagerungen hinzukommen.

Die msg-Gruppe stellt hierfür mit dem Smart-Inputmanagement msg.SIMA eine praktikable Lösung zur Verfügung, die auch als „Software-as-a-Service“ (SaaS) ohne kostenintensive Installation vor Ort genutzt werden kann. Die Daten werden dabei im XML-Format für die Weiterverarbeitung zur Verfügung gestellt.

Häufig sind PDF-Dokumente aber auch direkt am Computer aus einer Datei heraus erzeugt worden. Dann lassen sich die darin enthaltenen Informationen auch direkt auslesen. Noch einfacher geht es mit Word- und Excel- und CSV-Formaten, die bereits digitalisiert sind und sich vergleichsweise einfach weiterverarbeiten lassen.

Neben dem Digitalisierungsgrad sind Dokumente aber auch unterschiedlich strukturiert, was die Komplexität des Einlese- und Interpretationsvorgangs beeinflusst.

Von strukturierten, semi-strukturierten und unstrukturierten Daten

Der einfachste Fall sind vollkommen strukturierte Dokumente; Etwa, wenn das Kreditinstitut ein Formular bereitstellt, dessen Felder bereits in einer Dokumentenerfassungslösung definiert werden können. So könnte beispielsweise der Kreditnehmer gebeten werden, bestimmte Basisangaben in Formularform zur Verfügung zu stellen. Auch andere Dokumente, wie z. B. ein Handelsregisterauszug, sind überwiegend gleich strukturiert und daher relativ einfach einlesbar.

Semi-strukturierte Dokumente enthalten im Wesentlichen die gleichen Informationen, unterscheiden sich jedoch hinsichtlich Inhalt und Aufbau schon deutlicher. So können betriebswirtschaftliche Auswertungen unterschiedliche Kontenrahmen verwenden, unternehmensindividuelle Konten und Unterkonten enthalten und Anhänge mit sich führen. Die Herausforderung besteht dann darin, diese unterschiedlichen Fälle weitestgehend zu antizipieren, um die gewonnenen Finanzdaten in eine automatisierte Bilanz- und GuV-Analyse überführen zu können.

Zur Klasse der weitestgehend oder vollständig unstrukturierten Dokumente könnte man bereits Jahresabschlüsse zählen. Zwar folgen sie mit ihren Bestandteilen Bilanz, GuV, Anhang und Lagebericht noch einer gewissen Form, die sich allerdings bereits nach Unternehmensgröße und Unternehmensgegenstand schon deutlich voneinander unterscheiden. Auch spezielle Informationen, die für die automatisierte Bilanz- und GuV-Analyse benötigt werden, können sich im Jahresabschluss an unterschiedlichen Stellen befinden.

Als Beispiel seien hier die kurzfristigen Verbindlichkeiten mit einer Restlaufzeit von unter einem Jahr genannt. Sie können einerseits direkt in der Bilanz erscheinen, andererseits auch noch einmal weiter detailliert in einem Verbindlichkeitenspiegel. Die Herausforderung besteht dann darin, im Gesamtdokument die relevanten Stellen zu identifizieren und fehlerfrei einzulesen.

Die msg GillardonBSM AG hat hier bereits auf Basis von Python-Skripts, die mit der Process Engine kommunizieren, Lösungen entwickelt, wie strukturierte und semi-strukturierte Dokumente eingelesen werden können. Dabei kommen Libraries wie Numpy (Mathematik- und Vektorbibliothek), Pandas (Datenbank- und Tabellenbibliothek) und PDFPlumber (Bibliothek für einfaches einlesen und verarbeiten von PDF-Dateien) zum Einsatz.

Im simpelsten Fall kann eine Tabelle durch vorgefertigte Funktionen vollständig ausgelesen werden. Es ist dann nur noch das Formatieren des Textes und einzelner Zellen vonnöten. Diese Methode wird für das Auslesen der Auszüge des Handelsregisters verwendet. Falls Tabellen keine konventionellen Rahmenlinien besitzen , muss manuell eine Tabelle gebildet werden. Dabei werden Algorithmen zur Berechnung und Abschätzung von Zellengrenzen verwendet, die Tabellen aus Informationen über Wortpositionen und Darstellungsbreite/-höhe aufbauen.

 

Prozessuale Verarbeitung

Die prozessuale Verarbeitung lässt sich in drei wesentliche Schritte unterteilen.

Einlesevorgang:

  • Überführung unterschiedlicher Formate, Strukturen und Inhalte in eine maschinenlesbare Form (Datenbanktabelle) unter Verwendung einer großen Auswahl an Schriftzeichensätzen
  • PDF-Dateien werden vollautomatisiert eingelesen; andere Dateiformate der Inputdokumente werden in ein PDF-Format konvertiert und eingelesen (*.txt, *.jpg, *.tiff, Excel)
  • Mit Hilfe von Optical Character Recognition (OCR) können mehrseitige, auch handschriftliche Dokumente eingelesen und zusammengehörende Seiten identifiziert werden.

Qualitätssicherung:

  • Bei entsprechender Parametrisierung können in der Regel 80 – 85 Prozent der enthaltenen Daten fehlerfrei und sicher eingelesen werden. Plausibilisierungen, Listen von akzeptierten Werten und das Training der Daten unterstützen dabei, die Fehleranfälligkeit zu reduzieren.
  • Eine 100%ige Automatisierung zu versprechen, wäre allerdings keine seriöse Herangehensweise, da es auch zu zweifelhaften Fällen kommen kann, die ein Eingreifen an der Mensch-Maschine-Schnittstelle erforderlich machen, beispielsweise bei verschmutzten, geknickten oder mit handschriftlichen Bemerkungen überlagerten Dokumenten. Auch kann es sein, dass es sich um die falschen Dokumente handelt.
  • Zur Qualitätssicherung ist daher eine Anzeige zweifelhafter oder zurückgewiesener Dokumente zur manuellen Beurteilung. Ein Ampelsystem kann hier eine Prüfroutine visualisieren, die zweifelhafte oder zurückgewiesene Dokumente klassifiziert.

Interpretation:

Mit der Überführung in eine maschinenlesbare und damit auswertbare Form sind die wesentlichen Voraussetzungen zur Hebung der Potenziale in der Kreditprozessautomation erfüllt.

Mit Hilfe von Künstlicher Intelligenz (KI) lassen sich im nächsten Schritt aber auch noch weitere Vorteile erzielen. KI kommt immer dann zum Einsatz, wenn es darum geht neues Wissen aus vorhandenen Daten zu generieren, sofern man über rein deterministische Ansätze hinausgehen will. Im Zusammenhang mit Eingangsdokumenten ist hier vor allem das TextMining zu nennen. Dabei geht es unter den Stichworten Natural Language Processing und Natural Language Understanding um die kognitive Erfassung und semantische Analyse der Inhalte mit Methoden des maschinellen Lernens.

Eingangsdokumente werden also nicht einfach nur ausgelesen, sondern auch interpretiert. Das kann sinnvoll sein bei der Analyse von Dokumenten aus speziellen Brancheninformationsdiensten, bei der Sentimentsanalyse oder allgemein bei der Auswertung unstrukturierter Dokumente, wie sie in NoSQL-Datenbanken wie MongoDB oder CouchDB abgespeichert werden. Zur Visualisierung eignen sich Wordclouds und Histogramme.

Neben den weit verbreiteten Bibliotheken und Frameworks wie Tensorflow, PyTorch oder scikit-learn existieren hier auch spezielle Libraries wie Gensim, NLTK oder SpaCy für die Analyse semantischer Strukturen und Schlüsselwörter.

 

Business Case

Die Metrik zur Berechnung der Vorteilhaftigkeit automatisierter Dokumentenerfassung unterscheidet sich von Bank zu Bank abhängig von den verwendeten Parametern wie Mengengerüst, eingesetzte Mitarbeiterkapazitäten oder Personalkosten. Grundsätzlich lassen sich jedoch einige Eckpunkte festlegen.

Auf der Aufwandsseite stehen:

  • Implementierungskosten (Installation, Customizing und Training), die sich durch eine SaaS-Lösung allerdings reduzieren, bzw. variabilisieren
  • Nutzungs- und Lizenzgebühren, die sich in der Regel an der Anzahl der eingelesen Dokumente pro Jahr in Form von Paketpreisen orientieren

Dem stehen auf der Ertragsseite gegenüber:

  • Reduzierung der für die manuelle Erfassung notwendigen Mitarbeiterkapazitäten
  • Vereinfachung, Beschleunigung und Stabilisierung des gesamten Prozesses

In Form einer dynamischen Amortisationsrechnung lässt sich unter Berücksichtigung des Zeitwertes, des anfänglichen Kapitaleinsatzes, des jährlichen Kapitalrückflusses und eines Diskontierungsfaktors die Vorteilhaftigkeit sehr gut in messbaren und überprüfbaren Größen darstellen.

Fazit

Fassen wir zum Schluss nochmal die Funktionalitäten und Vorteile zusammen: 

Funktionalitäten

  • Geringe manuelle Intervention bei der Dokumentenauslesung benötigt
  • Selbstlernendes System – Ergebnisse verbessern sich im laufenden Betrieb
  • Flexible Inputmöglichkeiten sowie eine Vielzahl unterstützter Dokumentenformate
  • Einfache und effiziente Wartung der Systeme
  • Zieloutput voll konfigurierbar – Aufbereitung für Weiterverarbeitung möglich
  • Vor-Ort-Betrieb oder in der Cloud
  • Einbindung in bestehende Geschäftsprozesse oder eigenständiges System

Vorteile

  • Kostenersparnis
  • Freisetzen wertvoller Zeit für wertschöpfendere Tätigkeiten
  • Qualitätsgesicherter Input für die Weiterverarbeitung
  • Optimierung der Durchlaufzeiten im Kreditprozess
  • Integration in vor- und nachgelagerte Systeme
  • Anbindung von Workflows
  • Grundlage für konsistente Berichterstattung
  • Nachvollziehbarkeit für Revisionszwecke

Weiterführende Quellen: Blog-Artikel von msg for banking zum TextMining

Andreas Strunz msg

Über den Autor

Andreas Strunz ist Director im Bereich Change & Transformation bei msg for banking ag. Im Business Consulting beschäftigt er sich neben den Einsatzmöglichkeiten künstlicher Intelligenz im Finanzwesen mit strategischen Zukunftsthemen der Branche.

Dokumenteneingangskanäle

Zunächst ist der Umstand zu betrachten, dass es für Dokumente und Informationen, die für den Firmenkreditprozess benötigt werden, nicht nur einen, sondern eine Vielzahl von Eingangskanälen gibt. Das reicht von der persönlichen Übergabe im Rahmen des Kreditgesprächs, dem Posteingang und dem Eingang als E-Mail-Anhang bis hin zu moderneren Varianten wie dem Upload im zugangsgeschützten Bereich des Online-Bankings. 

Ein Kreditinstitut kann sich also in aller Regel nicht auf nur einen Eingangskanal beschränken. Das entspricht auch der heutigen Bedeutung des Multikanalmanagements und den Veränderungen bei der Nutzung der Kanäle durch die Kunden. Während das klassische Fax, wenn überhaupt noch im Einsatz, langfristig wohl keine Rolle mehr spielen wird, sind E-Mail, Online-Banking und standardisierte Schnittstellen, wie etwa DATEV für Steuerberaterinformationen weiter auf dem Vormarsch.

Eine kürzlich von der msgGillardon durchgeführte Studie unter Fach- und Führungskräften aus dem Vertrieb und Kundenmanagement von Banken machte dies nochmals deutlich. Nahezu alle Befragten stimmten dabei der Aussage zu, dass der Orchestrierung der Kanäle eine große Bedeutung zukommt und dass auch die Kunden digital mündiger werden.

Digital ist nicht gleich digital

Je nachdem, welcher Eingangskanal gewählt wurde, schließen sich daran unterschiedliche Prozess-Schritte an (Ausdruck, physische Ablage, Speicherung von Anhängen, Speicherung von Uploads). Die Problematik besteht im klassischen, nicht automatisierten Prozess allerdings in der manuellen, fehleranfälligen Erfassung, in der u.U. lokalen Speicherung von personenbezogenen Daten, dem fehlenden digitalen Workflow im Anschluss an die Erfassung und der Tatsache, dass Daten nicht für weitere Auswertungen über alle Kreditnehmer hinweg oder Reportings verfügbar sind.

Am Ende der automatisierten Verarbeitung steht daher immer das Ziel, den Inhalt eines Dokuments in maschinenlesbare und interpretierbare Form zu überführen, idealerweise in Form eines Datenbankeintrags. Das bringt dann die Potenziale der Prozessautomation erst so richtig zur Geltung.

Dabei ist digital nicht gleich digital, was uns zur Frage des Digitalisierungsgrades und der  Dokumentenarten führt.

Digitalisierungsgrad und Dokumentenarten

Dokumente in Papierform, also analog, sind natürlich am weitesten von dem gewünschten Digitalisierungsgrad entfernt. Der erste Schritt ist hier das zeit- und kostenaufwändige Einscannen, weshalb es im Interesse des Kreditinstituts ist, diesen Bearbeitungsschritt, wo möglich, durch den Einreicher erledigen zu lassen. Scanner erzeugen allerdings Rastergrafiken, also in Pixel unterteilte Bilder mit unterschiedlichen Farb- und Helligkeitswerten je Bildpunkt (gemessen bspw. in HSL, englisch für hue, lightness und saturation). Ähnliches gilt auch für eingereichte Bilder, etwa im JPG-Format.

Das fehlerfreie Zurückführen der Bildpunkte in digitale Zeichen, überwiegend im UTF-8 Unicode-Format, stellt daher eine besondere Herausforderung dar. Insbesondere wenn dann noch das Erkennen von Handschriften oder die Eliminierung von Verschmutzungen und Textüberlagerungen hinzukommen.

Die msg-Gruppe stellt hierfür mit dem Smart-Inputmanagement msg.SIMA eine praktikable Lösung zur Verfügung, die auch als „Software-as-a-Service“ (SaaS) ohne kostenintensive Installation vor Ort genutzt werden kann. Die Daten werden dabei im XML-Format für die Weiterverarbeitung zur Verfügung gestellt.

Häufig sind PDF-Dokumente aber auch direkt am Computer aus einer Datei heraus erzeugt worden. Dann lassen sich die darin enthaltenen Informationen auch direkt auslesen. Noch einfacher geht es mit Word- und Excel- und CSV-Formaten, die bereits digitalisiert sind und sich vergleichsweise einfach weiterverarbeiten lassen.

Neben dem Digitalisierungsgrad sind Dokumente aber auch unterschiedlich strukturiert, was die Komplexität des Einlese- und Interpretationsvorgangs beeinflusst.

Von strukturierten, semi-strukturierten und unstrukturierten Daten

Der einfachste Fall sind vollkommen strukturierte Dokumente; etwa wenn das Kreditinstitut ein Formular bereitstellt, dessen Felder bereits in einer Dokumentenerfassungslösung definiert werden können. So könnte beispielsweise der Kreditnehmer gebeten werden, bestimmte Basisangaben in Formularform zur Verfügung zu stellen. Auch anderer Dokumente, wie z.B. ein Handelsregisterauszug, sind überwiegend gleich strukturiert und daher relativ einfach einlesbar.

Semi-strukturierte Dokumente enthalten im Wesentlichen die gleichen Informationen, unterscheiden sich jedoch hinsichtlich Inhalt und Aufbau schon deutlicher. So können betriebswirtschaftliche Auswertungen unterschiedliche Kontenrahmen verwenden, unternehmensindividuelle Konten und Unterkonten enthalten und Anhänge mit sich führen. Die Herausforderung besteht dann darin, diese unterschiedlichen Fälle weitestgehend zu antizipieren, um die gewonnenen Finanzdaten in eine automatisierte Bilanz- und GuV-Analyse überführen zu können.

Zur Klasse der weitestgehend oder vollständig unstrukturierten Dokumente könnte man bereits Jahresabschlüsse zählen. Zwar folgen sie mit ihren Bestandteilen Bilanz, GuV, Anhang und Lagebericht noch einer gewissen Form, die sich allerdings bereits nach Unternehmensgröße und Unternehmensgegenstand schon deutlich voneinander unterscheiden. Auch spezielle Informationen, die für die automatisierte Bilanz- und GuV-Analyse benötigt werden, können sich im Jahresabschluss an unterschiedlichen Stellen befinden.

Als Beispiel seien hier die kurzfristigen Verbindlichkeiten mit einer Restlaufzeit von unter einem Jahr genannt. Sie können einerseits direkt in der Bilanz erscheinen, andererseits auch nochmal weiter detailliert in einem Verbindlichkeitenspiegel. Die Herausforderung besteht dann darin, im Gesamtdokument die relevanten Stellen zu identifizieren und fehlerfrei einzulesen.

Die msgGillardon hat hier bereits auf Basis von Python-Skripts, die mit der Process Engine kommunizieren, Lösungen entwickelt, wie strukturierte und semi-strukturierte Dokumente eingelesen werden können. Dabei kommen Libraries wie Numpy (Mathematik- und Vektorbibliothek), Pandas (Datenbank- und Tabellenbibliothek) und PDFPlumber (Bibliothek für einfaches einlesen und verarbeiten von PDF-Dateien) zum Einsatz.

Im simpelsten Fall kann eine Tabelle durch vorgefertigte Funktionen vollständig ausgelesen werden. Es ist dann nur noch das Formatieren des Textes und einzelner Zellen vonnöten. Diese Methode wird für das Auslesen der Auszüge des Handelsregisters verwendet. Falls Tabellen keine konventionellen Rahmenlinien besitzen , muss manuell eine Tabelle gebildet werden. Dabei werden Algorithmen zur Berechnung und Abschätzung von Zellengrenzen verwendet, die Tabellen aus Informationen über Wortpositionen und Darstellungsbreite/-höhe aufbauen.

 

Prozessuale Verarbeitung

Die prozessuale Verarbeitung lässt sich in drei wesentliche Schritte unterteilen.

Einlesevorgang:

  • Überführung unterschiedlicher Formate, Strukturen und Inhalte in eine maschinenlesbare Form (Datenbanktabelle) unter Verwendung einer großen Auswahl an Schriftzeichensätzen
  • PDF-Dateien werden vollautomatisiert eingelesen; andere Dateiformate der Inputdokumente werden in ein PDF-Format konvertiert und eingelesen (*.txt, *.jpg, *.tiff, Excel)
  • Mit Hilfe von Optical Character Recognition (OCR) können mehrseitige, auch handschriftliche Dokumente eingelesen und zusammengehörende Seiten identifiziert werden

Qualitätssicherung:

  • Bei entsprechender Parametrisierung können in der Regel 80 – 85 % der enthaltenen Daten fehlerfrei und sicher eingelesen werden. Plausibilisierungen, Listen von akzeptierten Werten und das Training der Daten unterstützen dabei, die Fehleranfälligkeit zu reduzieren.
  • Eine 100%ige Automatisierung zu versprechen, wäre allerdings keine seriöse Herangehensweise, da es auch zu zweifelhaften Fällen kommen kann, die ein Eingreifen an der Mensch-Maschine-Schnittstelle erforderlich machen, beispielsweise bei verschmutzten, geknickten oder mit handschriftlichen Bemerkungen überlagerten Dokumenten. Auch kann es sein, dass es sich um die falschen Dokumente handelt.
  • Zur Qualitätssicherung ist daher eine Anzeige zweifelhafter oder zurückgewiesener Dokumente zur manuellen Beurteilung Ein Ampelsystem kann hier eine Prüfroutine visualisieren, die zweifelhafte oder zurückgewiesene Dokumente klassifiziert.

Interpretation:

Mit der Überführung in eine maschinenlesbare und damit auswertbare Form sind die wesentlichen Voraussetzungen zur Hebung der Potenziale in der Kreditprozessautomation erfüllt.

Mit Hilfe von Künstlicher Intelligenz (KI) lassen sich im nächsten Schritt aber auch noch weitere Vorteile erzielen. KI kommt immer dann zum Einsatz, wenn es darum geht neues Wissen aus vorhandenen Daten zu generieren, sofern man über rein deterministische Ansätze hinausgehen will. Im Zusammenhang mit Eingangsdokumenten ist hier vor allem das TextMining zu nennen. Dabei geht es unter den Stichworten Natural Language Processing und Natural Language Understanding um die kognitive Erfassung und semantische Analyse der Inhalte mit Methoden des maschinellen Lernens.

Eingangsdokumente werden also nicht einfach nur ausgelesen, sondern auch interpretiert. Das kann sinnvoll sein bei der Analyse von Dokumenten aus speziellen Brancheninformationsdiensten, bei der Sentimentsanalyse oder allgemein bei der Auswertung unstrukturierter Dokumente, wie sie in NoSQL-Datenbanken wie MongoDB oder CouchDB abgespeichert werden. Zur Visualisierung eignen sich Wordclouds und Histogramme.

Neben den weit verbreiteten Bibliotheken und Frameworks wie Tensorflow, PyTorch oder scikit-learn existieren hier auch spezielle Libraries wie Gensim, NLTK oder SpaCy für die Analyse semantischer Strukturen und Schlüsselwörter.

 

Business Case

Die Metrik zur Berechnung der Vorteilhaftigkeit automatisierter Dokumentenerfassung unterscheidet sich von Bank zu Bank abhängig von den verwendeten Parametern wie Mengengerüst, eingesetzte Mitarbeiterkapazitäten oder Personalkosten. Grundsätzlich lassen sich jedoch einige Eckpunkte festlegen.

Auf der Aufwandsseite stehen:

  • Implementierungskosten (Installation, Customizing und Training), die sich durch eine SaaS-Lösung allerdings reduzieren, bzw. variabilisieren
  • Nutzungs- und Lizenzgebühren, die sich in der Regel an der Anzahl der eingelesen Dokumente pro Jahr in Form von Paketpreisen orientieren

Dem stehen auf der Ertragsseite gegenüber:

  • Reduzierung der für die manuelle Erfassung notwendigen Mitarbeiterkapazitäten
  • Vereinfachung, Beschleunigung und Stabilisierung des gesamten Prozesses

In Form einer dynamischen Amortisationsrechnung lässt sich unter Berücksichtigung des Zeitwertes, des anfänglichen Kapitaleinsatzes, des j ährliche n Kapitalrückflusses und eines Diskontierungsfaktors die Vorteilhaftigkeit sehr gut in messbaren und überprüfbaren Größen darstellen.

Fazit

Fassen wir zum Schluss nochmal die Funktionalitäten und Vorteile zusammen: 

Funktionalitäten

  • Geringe manuelle Intervention bei der Dokumentenauslesung benötigt
  • Selbstlernendes System – Ergebnisse verbessern sich im laufenden Betrieb
  • Flexible Inputmöglichkeiten sowie eine Vielzahl unterstützter Dokumentenformate
  • Einfache und effiziente Wartung der Systeme
  • Zieloutput voll konfigurierbar – Aufbereitung für Weiterverarbeitung möglich
  • Vor Ort Betrieb oder in der Cloud
  • Einbindung in bestehende Geschäftsprozesse oder eigenständiges System

Vorteile

  • Kostenersparnis
  • Freisetzen wertvoller Zeit für wertschöpfendere Tätigkeiten
  • Qualitätsgesicherter Input für die Weiterverarbeitung
  • Optimierung der Durchlaufzeiten im Kreditprozess
  • Integration in vor- und nachgelagerte Systeme
  • Anbindung von Workflows
  • Grundlage für konsistente Berichterstattung
  • Nachvollziehbarkeit für Revisionszwecke

Weiterführende Quellen: Blog-Artikel von msg for banking zum TextMining

Andreas Strunz msg

Über den Autor

Andreas Strunz ist Director im Bereich Change & Transformation bei msg for banking ag. Im Business Consulting beschäftigt er sich neben den Einsatzmöglichkeiten künstlicher Intelligenz im Finanzwesen mit strategischen Zukunftsthemen der Branche.