Versicherungswirtschaft-heute

            Mobilsite

 

Data Science: Raus aus der Black Box

11.06.2018 – Digitalisierung, Big Data - quelle GDVDie digitalen Megatrends wie künstliche Intelligenz, humanoide Roboter und autonomes Fahren bestimmen in dieser Woche auch die Agenda der Technologiemesse Cebit, die heute in Hannover ihre Pforten für das Fach- und Privatpublikum öffnet. Wie vor allem die Versicherer die richtigen Schlüsse aus den Entwicklungen um Data Science, Maschinelles Lernen und KI ziehen können, beleuchtet Martin Spindler in einem exklusiven Fachbeitrag.

In den letzten Jahren hat sich Data Science als neues eigenständiges Fachgebiet entwickelt. Dabei handelt es sich um einen interdisziplinären Bereich, der Wissen aus der Informatik, Mathematik, Statistik und den jeweiligen Fachgebieten verknüpft.

Ausgangspunkt für die gegenwärtigen Entwicklungen ist die zunehmende Verfügbarkeit von großen, komplexen Datensätzen. Diese wird getrieben von der Digitalisierung. Digitalisierung senkt die Kosten der Datenerhebung und -verfügbarkeit. Durch die zunehmende Verbreitung von Smartphones, Tablets, Internetanwendungen und -diensten werden viele Informationen digital verfügbar.

Beispiele sind Vertragsdaten von Kunden, Korrespondenzen mit Kunden, elektronische Personalakten oder Daten über die Schadensregulierung. Diese Daten liegen häufig in unstrukturierter Form vor. Der erste Schritt, die Aufbereitung der Daten, kann bereits sehr aufwendig und zeitintensiv sein und den Einsatz von Informatikern und Ingenieuren erfordern.

Dabei müssen häufig Daten aus verschiedenen Quellen und unterschiedlichen Formaten zusammengeführt werden. Nach der Datenaufbereitung beginnt die Aufgabe der Statistiker: nun geht es darum, die richtigen Schlüsse aus den Daten zu ziehen. Dazu muss ein statistisches Modell aufgestellt werden.

Nach der Aufbereitung der Daten hat man für jede Beobachtungseinheit (z.B. Versicherungsnehmer) eine Beobachtung (n Beobachtungen insgesamt) und jede Beobachtung wiederum besteht aus mehreren Variablen (p Variablen). Beispielsweise besteht die Kundendatenbank eines Versicherers aus allen Verträgen und für jeden Vertrag sind Informationen bezüglich Alter, Geschlecht und Schadenhistorie des Versicherungsnehmers hinterlegt.

Zur Analyse solcher Daten sind maschinelle Lernmethoden sehr gut geeignet und in den letzten Jahren gab es hier auch große Fortschritte. Wir gehen davon aus, dass die Daten in aufbereiteter Form vorliegen und analysiert werden sollen. Bei der Analyse von Daten gibt es zwei Ziele bzw. unterschiedliche Aufgaben, die unterschiedliche Methoden benötigen: Vorhersage und kausale Inferenz.

Obwohl einige der Verfahren/Algorithmen schon vor längerer Zeit entwickelt wurden, ist es erst in den letzten Jahren gelungen, die theoretischen Grundlagen zu verstehen. Dieses Verständnis ermöglicht die Entwicklung von neuen, maßgeschneiderten Algorithmen für verschiedene Vorhersageprobleme.

Diese Verfahren funktionieren häufig gut bezüglich der Vorhersageergebnisse, aber der Zusammenhang zwischen den Input- und der Outputvariablen wird häufig als “Black Box” betrachtet. Das heißt, eine Interpretation der Ergebnisse oder eine Erklärung, wie die Vorhersageergebnisse zu Stande kommen, ist häufig nicht möglich. Das Ziel sind gute Vorhersagen.

Eine aktuelle Forschungsrichtung beschäftigt sich damit, die Unsicherheit, die mit der Vorhersage von ML-Methoden verbunden ist, zu quantifizieren. Dies ist beispielsweise unentbehrlich, wenn die Vorhersagen Grundlage für betriebliche Planungen bieten sollen.

Insgesamt lässt sich festhalten, dass maschinelle Lernverfahren und Künstliche Intelligenz sowohl für die Vorhersage als auch kausale Inferenz nützlich sind und häufig bessere Ergebnisse erzielen als klassische Methoden. Die theoretische Entwicklung von neuen Verfahren und die praktische Anwendung gehen dabei Hand in Hand.

Für Unternehmen im Versicherungsbereich ergeben sich viele, neue spannende Herausforderungen. Um sich im Wettbewerb behaupten zu können, ist es von zentraler Bedeutung, modernste Verfahren schnell zu adaptieren.

Den vollständigen Beitrag lesen Sie in der aktuellen Ausgabe der Versicherungswirtschaft.

Autor: Martin Spindler ist Professor für Statistik an der Universität Hamburg.

Bildquelle: GDV

- Anzeige -
- Anzeige -
- Anzeige -

 

VVW | Kontakt | AGB | Datenschutzerklärung | Impressum | Mediadaten