Image Source: Optimizely
Als einfaches Beispiel für abgeleitete Daten betrachten Sie zwei verschiedene Datensätze. Der erste Datensatz enthält grundlegende demografische Informationen über eine Gruppe von Kunden. Der zweite Datensatz enthält Kaufpräferenzen derselben Kunden. Durch die Kombination und Kreuzreferenzierung der beiden Datensätze können neue Erkenntnisse über Kaufpräferenzen nach Alter, Geschlecht und Bildungsniveau gewonnen werden. Diese detaillierteren Informationen sind abgeleitete Daten, die in keinem der ursprünglichen Datensätze erkennbar sind.
Daten können mit verschiedenen Algorithmen abgeleitet werden, darunter:
Das Kopieren, Neuformatieren oder Umpacken von Daten erzeugt keine abgeleiteten Daten, ebenso wenig wie das bloße Zusammenfassen vorhandener Daten. Abgeleitete Daten enthalten neue Informationen, die in den Originaldaten nicht vorhanden sind.
Welche verschiedenen Datentypen gibt es?
Forscher unterteilen Daten in vier Grundtypen: Beobachtungs-, Experimental-, Simulations- und abgeleitete Daten. Die ersten drei Datentypen werden manchmal als direkte Daten bezeichnet, die sich deutlich von abgeleiteten Daten unterscheiden.
-
Beobachtungsdaten
Beobachtungsdaten werden durch das Beobachten einer Aktivität oder durch Befragung einer Person zu einer Aktivität erfasst. Das Zählen von Kundenverkehr ist beispielsweise Beobachtungsdaten.
-
Experimentaldaten
Experimentaldaten werden gesammelt, wenn ein Forscher aktiv in eine bestimmte Aktivität eingreift und die resultierenden Veränderungen misst. Eine Studie, bei der einigen Probanden ein experimentelles Medikament und anderen ein Placebo verabreicht wird, ist beispielsweise Experimentaldaten.
-
Simulationsdaten
Simulationsdaten werden durch die Nachahmung eines realen Prozesses mithilfe von Testmodellen generiert. Das Ausführen einer Computersimulation von Belastungsniveaus an einem neuen Produkt ist beispielsweise Simulationsdaten.
-
Abgeleitete Daten
Wie Sie gelernt haben, werden abgeleitete Daten durch die Transformation bestehender Datenpunkte erstellt, um neue Erkenntnisse zu gewinnen. Das Kombinieren von Bevölkerungsdaten mit geografischen Daten zur Erstellung von Bevölkerungsdichtedaten gilt beispielsweise als abgeleitete Daten.
Abgeleitete Daten können aus jedem der anderen drei Datentypen extrahiert werden – sollten jedoch nicht aus anderen abgeleiteten Daten abgeleitet werden. Bei der Erstellung abgeleiteter Daten folgen Forscher einer Reihe von Best Practices , die die Eingabedaten, die Verarbeitung dieser Daten und die Genauigkeit der abgeleiteten Ergebnisse beschreiben.
Welche Probleme sind mit abgeleiteten Daten verbunden?
So nützlich abgeleitete Daten auch sind, bringen sie aufgrund der Art ihrer Entstehung eigene Probleme mit sich.
Genauigkeitsprobleme
Abgeleitete Daten werden aus vorhandenen Daten extrapoliert und sind daher nicht so genau wie die Rohdaten. Abfragen auf abgeleiteten Daten können weniger genaue Ergebnisse liefern als Abfragen auf den Originaldaten. Genauigkeit kann zu einem Problem werden, wenn abgeleitete Daten anschließend mit anderen abgeleiteten Daten verarbeitet werden, um eine neue Datenebene zu erstellen. Das Szenario ähnelt der Herausforderung, eine Kopie einer Kopie eines Fotos zu erstellen, die selten die Qualität des Originals beibehält. (Aus diesem Grund ist es ratsam, die Originaldaten anstelle von oder zusätzlich zu den abgeleiteten Daten zu speichern.)
Datenschutzprobleme
Da abgeleitete Daten häufig aus der Analyse vorhandener Daten extrahiert werden, die mit ausdrücklicher Genehmigung von Personen bereitgestellt wurden, sind diese Personen sich der in den abgeleiteten Daten enthüllten neuen Informationen in der Regel nicht bewusst. Es bleibt die Frage, ob die Erlaubnis zur Nutzung der Basisinformationen auch die Erlaubnis zur Nutzung von Daten impliziert, die aus den Originaldaten abgeleitet, aber nicht ausdrücklich darin enthalten sind.
Eigentümerschaftsprobleme
Parallel zu Datenschutz- und Nutzungsfragen stellt sich die Frage, wem die abgeleiteten Daten gehören. Die Originaldaten stammen in der Regel aus einer identifizierten Quelle, aber durch die Kombination und Transformation dieser Daten entstehen völlig neue Datensätze. Haben die ursprünglichen Dateneigentümer Eigentumsansprüche auf die abgeleiteten Daten, oder gehören die abgeleiteten Daten vollständig der Stelle, die die Originaldaten verarbeitet hat? Die Rechtslage ist in diesem Punkt nicht eindeutig.
Wie können Sie abgeleitete Daten in Ihrem Unternehmen nutzen?
Abgeleitete Daten liefern wichtige Erkenntnisse, die in den Originaldaten nicht sofort ersichtlich sind. Anstatt auf die statischen Beobachtungen direkter Daten beschränkt zu sein, gehen abgeleitete Daten über die Rohdaten hinaus, um neue Verbindungen herzustellen und neue Anwendungsfälle zu extrapolieren.
Die Nutzung abgeleiteter Daten verschafft Ihrem Unternehmen einen klaren Wettbewerbsvorteil gegenüber anderen Unternehmen, die traditionellere Datenmodelle verwenden. Die Nutzung abgeleiteter Daten kann Ihrem Unternehmen helfen:
-
Die Wünsche, Bedürfnisse und Kaufmuster Ihrer Kunden besser zu verstehen
-
Ihre wertvollsten Kunden zu identifizieren
-
Personalisierte Erlebnisse und Produkte für Ihre wertvollsten Kunden zu erstellen
-
Besseren Kundenservice zu bieten
-
Die Effizienz zu steigern und Kosten durch bessere Ausrichtung Ihrer Bemühungen zu senken
Kurz gesagt: Wenn Sie über die von Ihnen gesammelten Rohdaten hinausgehen möchten, nutzen Sie verfügbare Analysetechniken , um neue abgeleitete Daten zu synthetisieren. Diese abgeleiteten Daten liefern Ihrem Unternehmen fortgeschrittene Erkenntnisse über Ihre Kunden, Ihren Markt und Ihr Geschäft, die aus den Originaldaten nicht verfügbar sind.
Lassen Sie Optimizely Ihnen helfen, den Nutzen abgeleiteter Daten zu erschließen
Optimizelys Digital Experience Platform synthetisiert Ihre vorhandenen Daten, um abgeleitete Daten zu erstellen, die Ihr Unternehmen voranbringen. Dadurch entstehen verwertbare Erkenntnisse, die Sie nutzen können, um Ihre Zielgruppe besser zu definieren, personalisierte Kundenerlebnisse zu bieten und Ihre E-Commerce-Aktivitäten zu optimieren. Arbeiten Sie mit Optimizely zusammen, um das Beste aus all Ihren wertvollen Daten herauszuholen.