In den klassischen Beständen fehlen sie fast völlig: Freelancer mit unstetem Einkommen, häufigem Wohnortwechsel und unregelmäßigem Versicherungsverlauf. Um diese Zielgruppe zu verstehen und gezielt anzusprechen, setzt ein Versicherer auf synthetische Profile – künstlich erzeugte Daten, die typische Lebensmuster simulieren. Nicht erhoben, nicht gekauft, aber statistisch belastbar. Willkommen in der Welt synthetischer Daten.

Anzeige

Synthetische Daten gelten als Gamechanger der datengetriebenen Transformation. Sie eröffnen neue Wege – jenseits von Datenschutzgrenzen, jenseits verzerrter Altbestände, jenseits klassischer Datenlücken. Vor allem aber bieten sie eines: Freiheit – in der Modellbildung, in der Produktentwicklung und im Umgang mit regulatorischen Hürden wie dem Datenschutz. Ihr Potenzial reicht dabei weit über technische Effizienzgewinne hinaus.

Synthetische Daten als Wettbewerbsvorteil

Synthetische Daten können helfen, strukturelle Verzerrungen in historischen Daten zu erkennen und gezielt auszugleichen – etwa wenn bestimmte Kundengruppen bislang unterrepräsentiert waren oder implizit benachteiligt wurden. Die britische Finanzaufsicht FCA nennt diesen Effekt ausdrücklich: Durch die Ergänzung fehlender Datenpunkte oder den Einsatz von Reject Inference lassen sich KI-Modelle fairer und robuster gestalten. Das ist ein entscheidender Fortschritt für automatisierte Entscheidungen in sensiblen Bereichen wie Bonitätsprüfung, Tarifierung oder Schadenregulierung.

Zugleich unterstreicht der Tech Trend Radar 2025: Wer synthetische Daten nicht nur einsetzt, sondern souverän beherrscht, verschafft sich einen strategischen Vorsprung. Denn in einer Branche, die zunehmend von datenbasierter Dynamik geprägt ist, entscheidet der Zugang zu hochwertigen, kontrollierbaren und regulatorisch belastbaren Daten über Innovationskraft, Marktzugang und Wettbewerbsfähigkeit.

Ein Werkzeug mit strategischer Reichweite

Synthetische Daten geben Versicherern Werkzeuge an die Hand, mit denen sich bisher unzugängliche Felder erschließen lassen. Ob in der Produktentwicklung, beim Training von KI-Systemen oder zur internen Modellvalidierung: Künstlich erzeugte Daten schaffen neue Spielräume – gerade dort, wo reale Daten fehlen, unvollständig oder aus Datenschutzgründen nicht nutzbar sind.

Ein Unternehmen, das ein innovatives Tarifmodell plant, kann damit erstmals gezielt simulieren, wie bestimmte Parameter auf individuelle Lebensverläufe wirken – ohne dabei reale Kundendaten zu verwenden. Oder es testet mithilfe synthetischer Bestände die Auswirkungen regulatorischer Änderungen auf Risikoklassen oder Beitragslasten. Auch in der internen Prozesskontrolle lassen sich synthetische Fälle durchspielen, um Systeme auf seltene, aber potenziell gravierende Ereignisse vorzubereiten.

Anzeige

Besonders wertvoll sind synthetische Daten auch in der Betrugsprävention. Hier lassen sich Szenarien entwerfen, in denen Kriminelle mit bislang unbekannten Methoden arbeiten – etwa mit gefälschten Gesundheitsangaben, digital manipulierten Belegen oder systematisch erzeugten Fehlinformationen. So werden Erkennungssysteme auf Angriffe vorbereitet, bevor diese tatsächlich auftreten. Die große Stärke synthetischer Daten liegt dabei in ihrer Skalierbarkeit. Sie lassen sich exakt steuern, beliebig kombinieren und bedarfsgerecht anpassen – ohne dass Datenschutzvorgaben verletzt werden oder Daten aufwendig anonymisiert werden müssen.

Die Gefahr: Modellierung im Nebel

Doch so vielfältig die Möglichkeiten synthetischer Daten sind – ihre Anwendung ist kein Selbstläufer. Denn mit jeder neuen Gestaltungsfreiheit wächst auch die Gefahr, dass Ergebnisse falsch interpretiert, übergeneralisiert oder methodisch verzerrt werden. Was statistisch plausibel erscheint, muss noch lange nicht der realen Welt standhalten.

Wenn Muster trügen

Synthetische Daten basieren auf Mustern – nicht auf tatsächlich erlebten Ereignissen. Sie entstehen aus mathematischen Beziehungen, Wahrscheinlichkeiten und Modellannahmen. Das macht sie flexibel, aber auch anfällig für Trugschlüsse. Wenn etwa kausale Zusammenhänge fehlen, kulturelle Unterschiede verwischt werden oder bestimmte Gruppen im Ursprungssystem unterrepräsentiert sind, kann selbst ein plausibles Datenset zu irreführenden Schlussfolgerungen führen.

Anzeige

Der Tech Trend Radar warnt davor, dass die Komplexität und Nuancen realer Daten womöglich nicht vollständig erfasst werden. Die britische Finanzaufsicht FCA geht weiter und nennt konkrete Schwächen: Synthetische Daten können bestehende Verzerrungen aus den Originaldaten übernehmen – oder neue erzeugen, wenn etwa Modelle zu stark verallgemeinern oder zu wenige Kontrollmechanismen greifen.

Wenn synthetische Daten zur Entscheidungsbasis werden

Besonders kritisch wird es, wenn synthetische Daten zur Grundlage für Entscheidungen gemacht werden – etwa bei Prämienberechnung, Risikoklassifizierung oder Betrugserkennung. Ohne klare Validierung droht das Risiko, dass reale Kunden falsch eingestuft oder ungerecht behandelt werden. Die FCA spricht hier von einem Spannungsverhältnis zwischen Datenschutz, Nutzwert und Modelltreue – kurz: privacy, utility und fidelity. Werden diese Kriterien nicht systematisch geprüft, ist der Einsatz synthetischer Daten nicht nur ungenau, sondern potenziell unfair.

Die Expertengruppe der FCA betont deshalb, wie wichtig Expertise und Governance-Strukturen sind: Wer synthetische Daten einsetzt, muss in der Lage sein, deren Aussagekraft kritisch zu bewerten – auch in Bezug auf die jeweilige Zielgruppe und den konkreten Anwendungsfall. Notwendig sind „extensive Analyse und fachliche Expertise“, um sicherzustellen, dass Modelle auf Basis synthetischer Daten nachvollziehbare und faire Ergebnisse liefern. Ein zu vereinfachter Umgang birgt ebenso Risiken wie eine überkomplexe Modellierung, die keinen Raum mehr für menschliche Bewertung lässt. Entscheidend ist daher: Synthetische Daten sind kein Selbstzweck. Ihre verantwortungsvolle Nutzung verlangt gut abgestimmte Prozesse, nachvollziehbare Qualitätskriterien und vor allem eines – Menschen, die wissen, was sie tun. Die technische Generierung mag automatisiert sein, doch die Verantwortung für ihren Einsatz bleibt menschlich.

Für Versicherer heißt das: Wer synthetische Daten strategisch nutzen will, muss auch ihre Grenzen verstehen – und dafür sorgen, dass Modelle regelmäßig überprüft, Verfahren transparent dokumentiert und Entscheidungen erklärbar bleiben. Nur wenn diese Bedingungen erfüllt sind, lässt sich Innovation glaubwürdig mit Verantwortung verbinden.

Anzeige

Hintergrund: Der Beitrag basiert auf den Inhalten des Tech Trend Radar 2025, einer jährlich erscheinenden Trendanalyse von Munich Re und Ergo, die technologische Entwicklungen im Hinblick auf ihre Relevanz für die Versicherungswirtschaft bewertet. Synthetische Daten werden darin als eigenständiger Trend im Cluster „Data & AI“ geführt. Ergänzend wurde der Bericht „Using Synthetic Data in Financial Services“der britischen Finanzaufsicht FCA (März 2024) ausgewertet, der Potenziale, Risiken und regulatorische Anforderungen detailliert beschreibt.

Seite 1/2/