Anknüpfend an Teil I dieser Artikelserie ist die Gewinnung von Informationen aus großen und komplexen Mengen von Dokumenten und Daten erfahrungsgemäß eine der zentralen Herausforderungen in Schadenersatzklagen. Die Lösung lautet: Intelligente Dokumentenverarbeitung.

Noch sehr häufig wird dabei die knappe Arbeitszeit hoch qualifizierter Mitarbeiter für mühselige Routineaufgaben bei der Verarbeitung komplexer Dokumentenbestände und -ströme verschwendet! Zudem gehen dadurch wichtige Informationen verloren oder liegen nicht in der notwendigen Qualität vor.

Zudem muss die Übermittlung von Ausgangsdaten und Zwischenergebnissen unter Zeitdruck möglichst effizient und transparent zwischen den verschiedenen beteiligten Rollen erfolgen.

Lösung: Intelligente Dokumentenverarbeitung bei Schadensersatzklagen

Hierbei können die folgenden IT- und KI-Bausteine unserer Plattform zur kollaborativen und intelligenten Verarbeitung der Dokumente und Ergebnisse helfen. Deren jeweiliger Nutzen wird im Folgenden noch genauer dargestellt:

Kollaboration und Datenaustausch bei Schadensersatzklagen

Über Portale können Dokumente, Daten und Auswertungsergebnisse sicher und mit definierten Zugriffsrechten ausgetauscht werden. Die entsprechenden Anwender oder Anwendergruppen erhalten Nachrichten bei Aktualisierungen und direkte Hyperlinks auf die Inhalte. Diese können auch eigene Überarbeitungen bereitstellen sowie Anmerkungen und Nachrichten zu den einzelnen Inhalten übermitteln, wobei Versionen der Dateien automatisch erstellt werden.

Systematisches Daten Management

Gerade bei großen Dokumentenbeständen, die zum Beispiel bei einer großen Anzahl von Mandanten vorliegen, ist deren systematisches Management erforderlich. Ablagestrukturen, Versionierung, Archivierung, Löschung und Protokollierung können durch entsprechende Lösungen unterstützt werden, um den Überblick und die Datenkonsistenz zu wahren. Dieses gilt auch für Dokumente die im Zeitverlauf eintreffen, nachgeliefert oder korrigiert werden, wie z.B. bei einer fortlaufenden Mandantengewinnung. 

Intelligentes Data Mining: Informationsextraktion

Tatsächlich entsteht aber der wesentliche Effekt erst durch KI-gestützte Verarbeitungsschritte, die im Sinne aller Beteiligten die Geschwindigkeit, Effizienz und Qualität der Informationsgewinnung deutlich steigern. Dadurch werden auch die Aufwände und der Zeitdruck für Anwälte und Gutachter gesenkt.

Dabei setzen wir die folgende drei Bausteine des Machine Learning in der gesamten Verarbeitungskette ein, um so automatisiert wie möglich maximale Ergebnisse zu erreichen: Sprachverarbeitung, Maschinelles Sehen und Prädiktive Analyse

Einige, wesentliche Beispiele für diese Verarbeitungsschritte:

Integration und Vorverarbeitung bei Schadensersatzklagen

Sofern die Dokumente nicht direkt digital generiert oder von professionellen Dienstleistern digitalisiert wurden, sondern von Mandanten oder anderweitig gescannt worden sind, liegt häufig eine Vielzahl von Dateiformaten vor. Gerade bei archivierten Belegen aus längeren Zeiträumen ist außerdem häufig die Qualität, d.h. die Lesbarkeit relativ niedrig.

Durch vielfältige Möglichkeiten für Import und Umwandlung werden diese Eingangsdaten vereinheitlicht, sofern möglich in der Qualität verbessert und durch eine Texterkennung mit Zeichen und Worten versehen. Auch sehr große Mengen können durch die Skalierbarkeit unserer Lösung zügig verarbeitet werden.

Die Abbildung auf der linken Seite zeigt ein Beispiel für die Beseitigung von Störungen, das sogenannte Denoising.

 

Auf der rechten Seite stellt die Abbildung die Erkennung von Zeichen und die Zusammensetzung zu ganzen Worten dar. Dies wird auch als das Optical Character Recognition (OCR) bezeichnet.

Automatisch Ordnung schaffen

Kanzleien und Gutachter werden häufig mit riesigen, ungeordneten Bergen von Dokumenten konfrontiert, da Mandanten die relevanten Belege (z.B. Rechnungen, Gutschriften) vermischt mit irrelevanten Dokumenten (z.B. Lieferscheine, Schriftverkehr, Protokolle) in Aktenordnern abgelegt haben. In den von uns unterstützten Projekten waren bis zu 70% der Seiten aus rechtlicher und kaufmännischer Sicht nicht relevant für die Analyse und Klage. Insbesondere bei mehreren hunderttausend oder sogar Millionen Seiten, liegt also ein riesiger Ausschuss vor. Eine Bereinigung ist daher nicht nur wichtig, um Kosten und Laufzeiten zu senken, sondern auch um Richtern und Gegenseite bei Schadensersatzklagen keine Ansatzpunkte für die Bemängelung der unterliegenden Informationen oder sogar Abweisung des Anspruchs zu geben.

Verschiedene Verfahren zum Clustering auf Basis von Layouts oder der textlichen Inhalte bilden automatisch – d.h. ohne menschliche Vorgaben – Gruppen zusammengehöriger Seiten und Dokumente. Dies erleichtert nicht nur die Schaffung von Struktur und Ordnung, sondern kann auch von den KI Modellen für die weiteren Verarbeitungsschritte genutzt werden.

Stapel in Einzeldokumente trennen

Da manchmal Dokumente nicht mehr getrennt vorliegen oder die manuelle Trennung der physischen Dokumente für den Scanvorgang sehr aufwändig sein kann, liegen ganze Stapel mit vielen Seiten vor, die zunächst noch in Einzeldokumente getrennt werden müssen.

Dieser Verarbeitungsschritt ist für das Verständnis der effizienten Umsetzung von KI Bausteinen besonders interessant: die Aufgabe kann in verschiedenen Varianten umgesetzt werden:

  1. erkenne erste / mittlere / letzte Seiten,
  2. erkenne die Zusammengehörigkeit von Seiten oder
  3. erkenne das Ende einer Seiten Sequenz.

Dabei können nur textliche Inhalte oder / und auch das grafische Erscheinungsbild genutzt werden.

Stapel, Dokumente und Seiten klassifizieren

Auf der durch die vorhergehenden Schritte geschaffenen Basis können dann Stapel, Dokumente und Seiten nach den gewünschten Kategorien klassifiziert werden. Auch dies kann durch zielgerichtetes Training zügig und zielgerichtet erfolgen. Dokumente können damit einfach nach Rechnungen, Gutschriften, Lieferscheine, Kontoauszüge usw. differenziert werden, während Seiten z.B. nach AGBs oder Einzelaufstellungen und Zusammenfassungen von Positionen unterscheidbar sein können.

An dem Beispiel links lässt sich auch gut erkennen, wie sich die Konfidenz der KI Modelle (hier visualisiert durch rote, gelbe und grüne Markierungen) für die gezielte Auswahl nur unsicher erkannter Beispiele nutzen lässt. Dies erhöht die Geschwindigkeit des Trainings und die Qualität der Ergebnisse.

Informationen und Entitäten erkennen

Bereits als Basis für die erste Einschätzung von Umsätzen, Volumina und Schäden müssen früh und zeitnah vielfältige Informationen aus den Dokumenten extrahiert und zu Entitäten (z.B. Kopf- / Fußinformationen, Positionen, Bezugsobjekte wie LKW) zusammengefasst werden. Im Verlauf der Klagevorbereitung und gegebenenfalls im Rahmen der Erstellung eines ökonomischen Gutachtens muss das entsprechende Datenmodell dann fallweise noch erweitert werden. Dabei ist es auch wichtig, flexibel zusätzlich benötigte Datenpunkte ergänzen zu können.

Auch dies kann mit Hilfe lernfähiger KI-Bausteine trainiert und schrittweise durch Validierung der Ergebnisse verbessert werden. Diese nutzen dabei sowohl die Struktur der zu erkennenden Inhalte als auch Position und umgebende Schlüsselworte. Für Informationen in komplexeren Fließtexten kommen sogenannte semantische Modelle zum Einsatz, die sich statistische Eigenschaften zunutze machen oder Bedeutungszusammenhänge erlernen können.

Die Ergebnisse können dann final als strukturierte Tabellen, falls notwendig mit Verknüpfungen zu den Ausgangsdokumenten, so bereitgestellt werden, dass die Nutzer und Empfänger hiermit möglichst einfach umgehen können.

Intelligentes Data Mining: Fortgeschrittene und prädiktive Analysen

Über die verarbeiteten Dokumente hinweg und eventuell auch durch Nutzung zusätzlicher Datenquellen können weitere KI Bausteine verschiedene Aufgabenstellungen unterstützen: z.B. die Erkennung von Anomalien oder Brüchen in der Preisentwicklung sowie Korrelationen zwischen den Preisen verschiedener Lieferanten. Auffällige Daten können zudem einer besonderen Validierung unterzogen und Lücken in Zeitreihen durch Prognosemodelle geschlossen werden.

Neben standardisierten Bausteinen setzen wir auch individuelle Analysen und Visualisierungen um, um das Verständnis für das entsprechende Schadensgeschehen zu verbessern.

Sind Sie an der Ermittlung eines Schadensersatzes beteiligt?

Ob Prozessfinanzierer, Gutachter/Ökonomen oder Rechtsanwälte – wir unterstützen Sie beim Einsatz von künstlicher Intelligenz in Schadensersatzklagen. Wie das geht, zeigen wir anhand von Praxisbeispielen in unserem Web-Seminar.

Prozess Automatisierung und Zugriffssteuerung

Abgerundet werden diese automatisierten, intelligenten Verarbeitungs- und Auswertungsbausteine durch eine Automatisierung des gesamten Prozesses und die Steuerung der Zugriffsmöglichkeiten für verschiedene Beteiligte. Hierdurch wird sichergestellt, dass der Ablauf einerseits möglichst nahtlos und schnell erfolgt – aber andererseits keine Daten in falsche Hände geraten.

Fazit: Weniger Aufwand, mehr Geschwindigkeit + Qualität

Technologie ist natürlich nur ein Baustein in Schadensersatzprozessen, der aber die Effizienz und Qualität bei der Verarbeitung von Daten und Dokumenten deutlich verbessern kann. Wie wir diese nutzen, um für Sie alle notwendigen Services zu erbringen und Klagen in Form eines zielführend strukturierten Projektes zu unterstützen, legen wir in den nächsten beiden Artikeln in Kürze dar.

Wir freuen uns auf Ihr Feedback und einen persönlichen Austausch.

Gerne stehe ich Ihnen bei weiteren Fragen bezüglich des Einsatzes von KI in Schadensersatzklagen zur Verfügung.

Ben Peters

Geschäftsbereichsleiter