Härledd data

Härledd data är ny information som skapas genom att bearbeta och kombinera befintliga rådatauppsättningar.

Vad är härledd data?

Härledd data är ny information som skapas genom att bearbeta och kombinera befintliga rådatauppsättningar. Processen innebär korsreferering av olika datauppsättningar och avancerad statistisk analys, vilket avslöjar insikter som inte är omedelbart uppenbara från originaldata. Härledd data är inte bara en sammanfattning eller omformatering av befintlig data – den ger helt nya insikter. Genom att exempelvis kombinera demografisk information med köppreferenser kan företag härleda nya data om köpbeteenden utifrån ålder, kön och utbildningsnivå. Härledd data kan komma från observations-, experiment- eller simuleringsdata, men inte från tidigare härledd data. Även om den är värdefull medför den också utmaningar kopplade till noggrannhet, integritet och äganderätt.

Varför är härledd data värdefull? 

Om du äger ett företag är svaret avgörande. Din befintliga data innehåller användbar information, men du får ytterligare insikter när du kombinerar den med annan information för att skapa härledd data. Så hur skapar du härledd data och hur kan du använda den i ditt företag? 

Viktiga slutsatser om härledd data

  • Härledd data är nya data som skapas genom att kombinera och bearbeta befintlig rådata

  • Härledd data kan skapas från observations-, experiment- och simuleringsdata – men inte från tidigare härledd data

  • Härledd data ger nya insikter som inte finns tillgängliga i befintlig data – men medför egna utmaningar kring noggrannhet, integritet och äganderätt

Vad är härledd data?

Statista uppskattar att 79 biljoner gigabyte data genererades under 2021 – och det är bara rådata. Företag och forskare världen över härleder ännu mer data från denna råinformation – det vi kallar härledd data. 

Härledd data är beräknad eller extrapolerad från annan befintlig data. Den är vanligtvis resultatet av korsreferering eller annan syntetisering av olika datauppsättningar samt avancerad statistisk analys av det kombinerade materialet. Därför är informationen som avslöjas i härledd data inte direkt uppenbar vid granskning av originaldata. Den existerar inte förrän den skapas.

diagram, venndiagram

Bildkälla: Optimizely

Som ett enkelt exempel på härledd data kan vi betrakta två olika uppsättningar av dataanalys. Den första datauppsättningen innehåller grundläggande demografisk information om en grupp kunder. Den andra datauppsättningen innehåller köppreferenser om samma kunder. Genom att kombinera och korsreferera de två datauppsättningarna kan nya insikter om köppreferenser utifrån ålder, kön och utbildningsnivå avslöjas. Denna mer detaljerade information är härledd data som inte framgår av någon av de ursprungliga datauppsättningarna. 

Data kan härledas med flera olika algoritmer, bland annat:

  • Extrahering av data

  • Omstrukturering av data

  • Utökning av data

  • Härledning av nya insikter

  • Generering av modeller

Att kopiera, omformatera eller paketera om data skapar inte härledd data, och det handlar inte heller om att bara sammanfatta befintlig data. Härledd data innehåller ny information som inte finns i originaldata.

Vilka olika typer av data finns det?

Forskare grupperar data i fyra grundläggande typer: observations-, experiment-, simulerings- och härledd data. De tre första typerna kallas ibland för direktdata, vilket skiljer dem tydligt från härledd data.

  1. Observationsdata

    Observationsdata samlas in genom att observera en aktivitet eller genom att ställa frågor till en person om en aktivitet. Att exempelvis räkna kundtrafik är observationsdata.
  2. Experimentdata

    Experimentdata samlas in när en forskare aktivt ingriper i en given aktivitet och mäter de resulterande förändringarna. Exempelvis är en studie som ger ett experimentellt läkemedel till vissa försökspersoner och placebo till andra experimentdata.
  3. Simuleringsdata

    Simuleringsdata genereras genom att efterlikna en verklig process med hjälp av testmodeller. Att exempelvis köra en datorsimulering av stressnivåer på en ny produkt är simuleringsdata. 
  4. Härledd data

    Som du har lärt dig skapas härledd data genom att omvandla befintliga datapunkter för att skapa nya insikter. Att exempelvis kombinera befolkningsdata med geografisk data för att skapa befolkningstäthetsdata betraktas som härledd data. 

    Härledd data kan extraheras från vilken som helst av de andra tre datatyperna – men bör inte härledas från annan härledd data. När forskare skapar härledd data följer de en rad bästa praxis som beskriver indata, hur dessa data bearbetas och noggrannheten i de härledda resultaten.

Vilka problem är förknippade med härledd data?

Hur användbar härledd data än är, medför den unika problem som beror på hur den skapas. 

Noggrannhetsproblem

Härledd data extrapoleras från befintlig data och är därför inte lika exakt som rådata. Förfrågningar som görs på härledd data kan generera mindre exakta resultat än förfrågningar som görs på originaldata. Noggrannhet kan bli ett problem om härledd data sedan bearbetas med annan härledd data för att skapa en ny datanivå. Scenariot liknar utmaningen med att göra en kopia av en kopia av ett fotografi, som sällan bevarar originalets kvalitet. (Av denna anledning är det klokt att lagra originaldata i stället för eller utöver den härledda datan.)

Integritetsproblem

Eftersom härledd data ofta extraheras från analys av befintlig data som tillhandahållits med uttryckligt samtycke från individer, är dessa individer vanligtvis omedvetna om den nya informationen som avslöjas i den härledda datan. Frågan kvarstår om tillståndet att använda grundinformationen även innebär tillstånd att använda data som härletts från men inte uttryckligen finns i originaldata. 

Äganderättsproblem

Parallellt med integritets- och användningsfrågor finns frågan om vem som äger den härledda datan. Originaldata kommer vanligtvis från en identifierad källa, men kombinationen och omvandlingen av dessa data skapar helt nya datauppsättningar. Har de ursprungliga dataägarna äganderättsanspråk på den härledda datan eller ägs den härledda datan helt av den enhet som bearbetade originaldata? Lagstiftningen är inte tydlig på denna punkt. 

Hur kan du använda härledd data i ditt företag?

Härledd data ger kritiska insikter som inte är direkt uppenbara i originaldata. Istället för att begränsas till statiska observationer från direktdata går härledd data bortom rådata för att skapa nya kopplingar och extrapolera nya användningsfall.

Att använda härledd data ger ditt företag en tydlig konkurrensfördel gentemot andra företag som använder mer traditionella datamodeller. Användningen av härledd data kan hjälpa ditt företag att:

  • Bättre förstå dina kunders önskemål, behov och köpmönster

  • Identifiera dina mest värdefulla kunder

  • Skapa personaliserade upplevelser och produkter för dina mest uppskattade kunder

  • Ge bättre kundservice

  • Förbättra effektiviteten och minska kostnaderna genom bättre riktade insatser

Kort sagt, när du vill gå bortom den rådata du samlar in, använd tillgängliga analytiska tekniker för att syntetisera nya, härledda data. Denna härledda data ger ditt företag avancerade insikter om dina kunder, din marknad och din verksamhet som inte finns tillgängliga i originaldata. 

Låt Optimizely hjälpa dig dra nytta av härledd data

Optimizelys Digital Experience Platform syntetiserar din befintliga data för att skapa härledd data som driver din verksamhet framåt. Detta skapar handlingsbara insikter som du kan använda för att bättre definiera din målgrupp, erbjuda personaliserade kundupplevelser och finjustera dina e-handelsaktiviteter. Samarbeta med Optimizely för att få ut det mesta av all din värdefulla data.