Abgeleitete Daten

Abgeleitete Daten sind neue Informationen, die durch die Verarbeitung und Kombination bestehender Rohdatensätze entstehen.

Was sind abgeleitete Daten?

Abgeleitete Daten sind neue Informationen, die durch die Verarbeitung und Kombination bestehender Rohdatensätze entstehen. Dieser Prozess beinhaltet die Kreuzreferenzierung verschiedener Datensätze und die Durchführung fortgeschrittener statistischer Analysen, wodurch Erkenntnisse gewonnen werden, die aus den Originaldaten nicht sofort ersichtlich sind. Abgeleitete Daten sind keine bloße Zusammenfassung oder Neuformatierung bestehender Daten – sie liefern völlig neue Einsichten. Durch die Kombination demografischer Informationen mit Kaufpräferenzen können Unternehmen beispielsweise neue Daten über das Kaufverhalten nach Alter, Geschlecht und Bildungsniveau ableiten. Abgeleitete Daten können aus Beobachtungs-, Experimental- oder Simulationsdaten stammen, jedoch nicht aus bereits abgeleiteten Daten. Obwohl sie wertvoll sind, bringen sie auch Herausforderungen in Bezug auf Genauigkeit, Datenschutz und Eigentümerschaft mit sich.

Warum sind abgeleitete Daten wertvoll? 

Wenn Sie ein Unternehmen führen, ist die Antwort entscheidend. Ihre vorhandenen Daten enthalten nützliche Informationen, aber Sie gewinnen weitere Erkenntnisse, wenn Sie diese mit anderen Informationen kombinieren, um abgeleitete Daten zu erstellen. Wie erstellen Sie also abgeleitete Daten und wie können Sie diese in Ihrem Unternehmen nutzen? 

Wichtige Erkenntnisse zu abgeleiteten Daten

  • Abgeleitete Daten sind neue Daten, die durch die Kombination und Verarbeitung bestehender Rohdaten entstehen

  • Abgeleitete Daten können aus Beobachtungs-, Experimental- und Simulationsdaten erstellt werden – jedoch nicht aus bereits abgeleiteten Daten

  • Abgeleitete Daten liefern neue Erkenntnisse, die aus bestehenden Daten nicht verfügbar sind – bringen aber eigene Herausforderungen in Bezug auf Genauigkeit, Datenschutz und Eigentümerschaft mit sich

Was sind abgeleitete Daten?

Statista schätzt, dass 79 Billionen Gigabyte an Daten im Jahr 2021 generiert wurden – und das sind nur die Rohdaten. Unternehmen und Forscher weltweit leiten aus diesen Rohinformationen noch mehr Daten ab – was wir als abgeleitete Daten bezeichnen. 

Abgeleitete Daten werden aus anderen vorhandenen Daten berechnet oder extrapoliert. Sie sind in der Regel das Ergebnis der Kreuzreferenzierung oder anderweitigen Synthese verschiedener Datensätze und der Durchführung fortgeschrittener statistischer Analysen des kombinierten Materials. Daher sind die in abgeleiteten Daten enthüllten Informationen bei der Betrachtung der Originaldaten nicht ohne Weiteres erkennbar. Sie existieren nicht, bis sie erstellt werden.

Diagramm, Venn-Diagramm

Image Source: Optimizely

Als einfaches Beispiel für abgeleitete Daten betrachten Sie zwei verschiedene Datensätze. Der erste Datensatz enthält grundlegende demografische Informationen über eine Gruppe von Kunden. Der zweite Datensatz enthält Kaufpräferenzen derselben Kunden. Durch die Kombination und Kreuzreferenzierung der beiden Datensätze können neue Erkenntnisse über Kaufpräferenzen nach Alter, Geschlecht und Bildungsniveau gewonnen werden. Diese detaillierteren Informationen sind abgeleitete Daten, die in keinem der ursprünglichen Datensätze erkennbar sind. 

Daten können mit verschiedenen Algorithmen abgeleitet werden, darunter:

  • Extraktion von Daten

  • Restrukturierung von Daten

  • Anreicherung von Daten

  • Ableitung neuer Erkenntnisse

  • Generierung von Modellen

Das Kopieren, Neuformatieren oder Umpacken von Daten erzeugt keine abgeleiteten Daten, ebenso wenig wie das bloße Zusammenfassen vorhandener Daten. Abgeleitete Daten enthalten neue Informationen, die in den Originaldaten nicht vorhanden sind.

Welche verschiedenen Datentypen gibt es?

Forscher unterteilen Daten in vier Grundtypen: Beobachtungs-, Experimental-, Simulations- und abgeleitete Daten. Die ersten drei Datentypen werden manchmal als direkte Daten bezeichnet, die sich deutlich von abgeleiteten Daten unterscheiden.

  1. Beobachtungsdaten

    Beobachtungsdaten werden durch das Beobachten einer Aktivität oder durch Befragung einer Person zu einer Aktivität erfasst. Das Zählen von Kundenverkehr ist beispielsweise Beobachtungsdaten.
  2. Experimentaldaten

    Experimentaldaten werden gesammelt, wenn ein Forscher aktiv in eine bestimmte Aktivität eingreift und die resultierenden Veränderungen misst. Eine Studie, bei der einigen Probanden ein experimentelles Medikament und anderen ein Placebo verabreicht wird, ist beispielsweise Experimentaldaten.
  3. Simulationsdaten

    Simulationsdaten werden durch die Nachahmung eines realen Prozesses mithilfe von Testmodellen generiert. Das Ausführen einer Computersimulation von Belastungsniveaus an einem neuen Produkt ist beispielsweise Simulationsdaten. 
  4. Abgeleitete Daten

    Wie Sie gelernt haben, werden abgeleitete Daten durch die Transformation bestehender Datenpunkte erstellt, um neue Erkenntnisse zu gewinnen. Das Kombinieren von Bevölkerungsdaten mit geografischen Daten zur Erstellung von Bevölkerungsdichtedaten gilt beispielsweise als abgeleitete Daten. 

    Abgeleitete Daten können aus jedem der anderen drei Datentypen extrahiert werden – sollten jedoch nicht aus anderen abgeleiteten Daten abgeleitet werden. Bei der Erstellung abgeleiteter Daten folgen Forscher einer Reihe von Best Practices , die die Eingabedaten, die Verarbeitung dieser Daten und die Genauigkeit der abgeleiteten Ergebnisse beschreiben.

Welche Probleme sind mit abgeleiteten Daten verbunden?

So nützlich abgeleitete Daten auch sind, bringen sie aufgrund der Art ihrer Entstehung eigene Probleme mit sich. 

Genauigkeitsprobleme

Abgeleitete Daten werden aus vorhandenen Daten extrapoliert und sind daher nicht so genau wie die Rohdaten. Abfragen auf abgeleiteten Daten können weniger genaue Ergebnisse liefern als Abfragen auf den Originaldaten. Genauigkeit kann zu einem Problem werden, wenn abgeleitete Daten anschließend mit anderen abgeleiteten Daten verarbeitet werden, um eine neue Datenebene zu erstellen. Das Szenario ähnelt der Herausforderung, eine Kopie einer Kopie eines Fotos zu erstellen, die selten die Qualität des Originals beibehält. (Aus diesem Grund ist es ratsam, die Originaldaten anstelle von oder zusätzlich zu den abgeleiteten Daten zu speichern.)

Datenschutzprobleme

Da abgeleitete Daten häufig aus der Analyse vorhandener Daten extrahiert werden, die mit ausdrücklicher Genehmigung von Personen bereitgestellt wurden, sind diese Personen sich der in den abgeleiteten Daten enthüllten neuen Informationen in der Regel nicht bewusst. Es bleibt die Frage, ob die Erlaubnis zur Nutzung der Basisinformationen auch die Erlaubnis zur Nutzung von Daten impliziert, die aus den Originaldaten abgeleitet, aber nicht ausdrücklich darin enthalten sind. 

Eigentümerschaftsprobleme

Parallel zu Datenschutz- und Nutzungsfragen stellt sich die Frage, wem die abgeleiteten Daten gehören. Die Originaldaten stammen in der Regel aus einer identifizierten Quelle, aber durch die Kombination und Transformation dieser Daten entstehen völlig neue Datensätze. Haben die ursprünglichen Dateneigentümer Eigentumsansprüche auf die abgeleiteten Daten, oder gehören die abgeleiteten Daten vollständig der Stelle, die die Originaldaten verarbeitet hat? Die Rechtslage ist in diesem Punkt nicht eindeutig. 

Wie können Sie abgeleitete Daten in Ihrem Unternehmen nutzen?

Abgeleitete Daten liefern wichtige Erkenntnisse, die in den Originaldaten nicht sofort ersichtlich sind. Anstatt auf die statischen Beobachtungen direkter Daten beschränkt zu sein, gehen abgeleitete Daten über die Rohdaten hinaus, um neue Verbindungen herzustellen und neue Anwendungsfälle zu extrapolieren.

Die Nutzung abgeleiteter Daten verschafft Ihrem Unternehmen einen klaren Wettbewerbsvorteil gegenüber anderen Unternehmen, die traditionellere Datenmodelle verwenden. Die Nutzung abgeleiteter Daten kann Ihrem Unternehmen helfen:

  • Die Wünsche, Bedürfnisse und Kaufmuster Ihrer Kunden besser zu verstehen

  • Ihre wertvollsten Kunden zu identifizieren

  • Personalisierte Erlebnisse und Produkte für Ihre wertvollsten Kunden zu erstellen

  • Besseren Kundenservice zu bieten

  • Die Effizienz zu steigern und Kosten durch bessere Ausrichtung Ihrer Bemühungen zu senken

Kurz gesagt: Wenn Sie über die von Ihnen gesammelten Rohdaten hinausgehen möchten, nutzen Sie verfügbare Analysetechniken , um neue abgeleitete Daten zu synthetisieren. Diese abgeleiteten Daten liefern Ihrem Unternehmen fortgeschrittene Erkenntnisse über Ihre Kunden, Ihren Markt und Ihr Geschäft, die aus den Originaldaten nicht verfügbar sind. 

Lassen Sie Optimizely Ihnen helfen, den Nutzen abgeleiteter Daten zu erschließen

Optimizelys Digital Experience Platform synthetisiert Ihre vorhandenen Daten, um abgeleitete Daten zu erstellen, die Ihr Unternehmen voranbringen. Dadurch entstehen verwertbare Erkenntnisse, die Sie nutzen können, um Ihre Zielgruppe besser zu definieren, personalisierte Kundenerlebnisse zu bieten und Ihre E-Commerce-Aktivitäten zu optimieren. Arbeiten Sie mit Optimizely zusammen, um das Beste aus all Ihren wertvollen Daten herauszuholen.