Tief im neuronalen Netz: Wie Deep Learning das Inputmanagement revolutioniert
Systeme für Inputmanagement unterstützen Prozessbeschleunigung und Automatisierung, reduzieren manuellen Aufwand in der Datenerfassung und erhöhen die Qualität der fachlichen Bearbeitung. Je präziser und umfassender das Inputmanagement ist, desto effizienter können die Daten im nachfolgenden Prozessverlauf genutzt werden. Mit einem kognitiven Klassifikator auf der Basis von Deep-Learning-Netzen wird ein neues Level im Inputmanagement erreicht. Ein Gastbeitrag von Karl-Josef Krechel-Mohr und Dr. Darko Obradovic.
AUSGANGSSITUATION: ZUVERLÄSSIGE KLASSIFIKATION ERMÖGLICHT MEDIENBRUCHFREIE DUNKELVERARBEITUNG
Bei allen Finanzdienstleistern gehen täglich Tausende unstrukturierte Dokumente wie Arztrechnungen, Schadenfotos, Adressänderungen, Immobilienunterlagen, Grundrisszeichnungen, Personalausweiskopien, Sterbedokumente, Urkunden usw. ein. Unabhängig vom Eingangsmedium werden diese unstrukturierten Dokumente mittels Erkennungssoftware klassifiziert und die geschäftsrelevanten Informationen extrahiert. Die zuverlässige Digitalisierung unstrukturierter Dokumente entscheidet bereits in dieser frühen Phase darüber, in welchem Maße eine medienbruchfreie Dunkelverarbeitung in den weiterverarbeitenden Systemen möglich ist.
Durch die Klassifikation von Dokumenten in Taxonomien lassen sich die eingehenden Dokumente übersichtlich nach Themen strukturieren. Dies muss zuverlässig erfolgen, weil bei einer falschen Klassifikation das Risiko einer fehlerhaften Folgeverarbeitung besteht. Die sichere und fehlerfreie Klassifikation ist von entscheidender Bedeutung, weil sie gleich mehreren Zwecken dient und bei falscher Zuweisung z.B.
- irrtümlich an der Nacherfassung/-korrektur vorbeigeleitet wird,
- das Extraktionsergebnis (Fachdatenübernahme) negativ beeinflusst,
- zu Fehlern in der Dunkelverarbeitung führt,
- vom Enterprise-Task-Management zu den falschen Sachbearbeitern geroutet wird,
- bei der Vorgangsbearbeitung die Fehlerquote erhöht.
Letztendlich führen Klassifikationsfehler zu Reklamationen und zu Unzufriedenheit der Versicherten und zu höheren Prozesskosten.
KLASSIFIKATION: SOGAR KI-BASIERTE VERFAHREN KÖNNEN WEITER OPTIMIERT WERDEN
Das älteste Klassifikationsverfahren arbeitet mit einer regelbasierten Erkennung auf der Basis mittels OCR gefundener Schlüsselworte. Dieses statische Verfahren hat den gravierenden Nachteil, dass die eingehenden Belege kontinuierlich von Menschen beobachtet werden müssen und bei Änderungen des Beleggutes immer wieder Anpassungen des deterministischen Regelwerkes erforderlich sind. Im Gegensatz dazu werden schon seit rund zwei Jahrzehnten selbstlernende Verfahren der Künstlichen Intelligenz eingesetzt. Hierbei lernt die Maschine selbstständig und einmalig anhand von Referenzstapeln. Sie lernt darüber hinaus, im laufenden Betrieb die Erkennungsqualität zu steigern.
Mittlerweile ist es üblich, mehrere Methoden parallel anzuwenden und über ein Voting die Wahrscheinlichkeit einer besseren Klassifizierung zu erhöhen.
Obwohl KI-basierte Verfahren statischen Verfahren seit Jahren überlegen sind, besteht auch bei ihnen Optimierungspotenzial, wenn
- der Text für die OCR schlecht lesbar ist (z.B. Fotos von Smartphones),
- Bilder mit geringem Textanteil vorliegen (z.B. Ausweise),
- das Dokument nur Bilder aufweist (Immobiliendokumente, Grundrisszeichnungen, Schadenfotos).
Sowohl für die Klassifizierung derartiger Problemfälle als auch für die Klassifikation von Standarddokumenten versprechen kognitive Systeme höhere Zuverlässigkeit.
KOGNITIVE SYSTEME: ORDNEN WIE EIN MENSCH ES TUN WÜRDE
Die Kernkomponenten eines kognitiven Systems nutzen moderne Methoden der Künstlichen Intelligenz wie beispielsweise Deep Learning. Kognitive Klassifikatoren eignen sich für unstrukturierte Dokumente der Versicherungswirtschaft, auf deren Basis das kognitive System nach Mustern und Layoutinformationen sucht, Fotos erkennt, Artefakte wahrnimmt, lernt, Schlüsse zieht, Entscheidungen ableitet und seine Analysemethoden ständig verfeinert. Kognitive Klassifikatoren ordnen Dokumente automatisch Kategorien in derselben Weise zu, wie ein Mensch das tun würde. Mit einem kognitiven Klassifikator lässt sich darüber hinaus das Risiko einer unerkannten Falschzuordnung von Dokumenten („False-Positiv-Rate“) durch eine vermeintlich sichere, aber falsche Klassifizierung deutlich verringern.
HYBRIDER KOGNITIVER KLASSIFIKATOR: GANZHEITLICHE ANALYSE VON DOKUMENTEN
Besondere Anforderungen an die Klassifikation stellen solche Dokumente, bei denen Bild- und Textteile gleichzeitig enthalten sind. Hierfür existieren aktuell zwei Verfahren, ein dualer und ein hybrider Ansatz. Das duale Verfahren separiert im ersten Schritt Bild- und Textteil des Eingangsdokuments. Anschließend werden diese Teile unabhängig voneinander von einem eigenständigen Bild- und einem eigenständigen Textklassifikator analysiert. Im letzten Schritt wird auf Grundlage der Ergebnisvektoren eine Klassifikationsentscheidung getroffen. Obwohl mit dieser Methode recht gute Ergebnisse erzielt werden können, führt sie zu Informationsverlusten, die bei einem einstufigen Verfahren ausgeschlossen werden.
Der neue, von Insiders Technologies entwickelte hybride kognitive Klassifikator analysiert ein Dokument in einem Schritt als Ganzes und vereint dabei die kognitiven Eigenschaften wie Erkennen von Bildern, Lesen, Sehen von Strukturen und Layout und kombiniert dies zusätzlich mit spezifischem Domänenwissen der Versicherungswirtschaft. Bei Formularen nutzt dieser Klassifikator zusätzliche Informationen wie Linien, Raster, Kästchen oder sonstige optische Indikatoren. Dieser innovative Klassifikator kombiniert verschiedene Verfahren und verbindet in einem intelligenten Mix die jeweiligen Stärken in einem Deep-Learning-Algorithmus. Dieser hybride Ansatz ist dem dualen Verfahren überlegen und erzielt die derzeit höchste Erkennungsqualität.
ERKENNUNGSQUALITÄT: EINE VERDOPPLUNG DER PRODUKTIVITÄT IST MÖGLICH
Im Benchmark ist der hybride kognitive Klassifikator bei Versicherungs- und Bankdokumenten leistungsstärker als alle anderen Verfahren. Bei Dokumenten, die ausschließlich Bilder beinhalten, ist er sogar stärker als spezialisierte Bildklassifikatoren, weil er über entsprechendes Domänenwissen verfügt. Bei gemischten Bild-/Textdokumenten ist er der Wettbewerbssoftware, auch der mit dualem Ansatz, deutlich überlegen. Bei reinen Textdokumenten schlägt er sogar die spezialisierten textbasierten Klassifikatoren infolge seiner zusätzlichen Fähigkeit der visuellen Mustererkennung.
Mit dem kognitiven Klassifikator ist nahezu eine Halbierung des manuellen Nacherfassungs-/Korrekturaufwandes bzw. eine Verdoppelung der Produktivität in diesem Tätigkeitsbereich möglich.
Insgesamt erreicht diese neue Technologie ein bisher nicht gekanntes Level im Inputmanagement.
VIELFÄLTIGE NEUE EINSATZFELDER
Über die zahlreichen Vorteile der hohen Erkennungsqualität hinaus bietet der hybride kognitive Klassifikator für Versicherungen auch neue Einsatzfelder. So kann mit ihm zum Beispiel die Spartentrennung der Eingangsdokumente umfassend automatisiert werden oder eine Segmentierung innerhalb einer Sparte vorgenommen werden. Im Übrigen kann dieser neuartige Klassifikator unabhängig vom bestehenden Inputmanagementsystem als ergänzendes Modul trainiert und in den bestehenden Prozess integriert werden. So besteht sehr einfach die Möglichkeit, das bestehende System zu optimieren, ohne gleich einen vollständigen Austausch vorzunehmen.
Der hybride Ansatz, bei dem unterschiedliche Technologiebausteine in einem innovativen kognitiven System zusammenarbeiten, bestätigt die alte orientalische Weisheit: „Wer alleine arbeitet, addiert. Wer zusammenarbeitet, multipliziert.“
Autoren: Karl-Josef Krechel-Mohr, Unternehmensberatung Scout4AI; und Dr. Darko Obradovic, Produktmanager KI-Technologien bei Insiders Technologies
Vielen Dank für die spannende Perspektive, auch wenn Grafiken der Algorithmusbeschreibung gut gestanden hätten 😉