Avledede data

Avledede data er ny informasjon som skapes ved å behandle og kombinere eksisterende rådatasett.

Hva er avledede data?

Avledede data er ny informasjon som skapes ved å behandle og kombinere eksisterende rådatasett. Denne prosessen innebærer kryssreferering av ulike datasett og avansert statistisk analyse, noe som avdekker innsikt som ikke er umiddelbart synlig i de opprinnelige dataene. Avledede data er ikke bare et sammendrag eller en omformatering av eksisterende data – de gir helt ny innsikt. For eksempel kan bedrifter ved å kombinere demografisk informasjon med kjøpspreferanser utlede nye data om kjøpsatferd basert på alder, kjønn og utdanningsnivå. Avledede data kan stamme fra observasjons-, eksperimentelle eller simuleringsdata, men ikke fra tidligere avledede data. Selv om avledede data er verdifulle, medfører de også utfordringer knyttet til nøyaktighet, personvern og eierskap.

Hvorfor er avledede data verdifulle? 

Hvis du eier en bedrift, er svaret avgjørende. De eksisterende dataene dine inneholder nyttig informasjon, men du får ytterligere innsikt når du kombinerer dem med annen informasjon for å skape avledede data. Så hvordan skaper du avledede data, og hvordan kan du bruke dem i bedriften din? 

Nøkkelpunkter om avledede data

  • Avledede data er nye data som skapes ved å kombinere og behandle eksisterende rådata

  • Avledede data kan skapes fra observasjons-, eksperimentelle og simuleringsdata – men ikke fra tidligere avledede data

  • Avledede data gir ny innsikt som ikke er tilgjengelig fra eksisterende data – men medfører egne utfordringer knyttet til nøyaktighet, personvern og eierskap

Hva er avledede data?

Statista anslår at 79 billioner gigabyte med data ble generert i 2021 – og det er bare rådataene. Selskaper og forskere over hele verden utleder enda mer data fra denne råinformasjonen – det vi kaller avledede data. 

Avledede data er beregnet eller ekstrapolert fra andre eksisterende data. De er vanligvis et resultat av kryssreferering eller annen syntese av ulike datasett, kombinert med avansert statistisk analyse av det sammenstilte materialet. Derfor er informasjonen som avdekkes i avledede data ikke umiddelbart synlig ved å observere de opprinnelige dataene. Den eksisterer ikke før den er skapt.

diagram, venndiagram

Bildekilde: Optimizely

Som et enkelt eksempel på avledede data, ta for deg to ulike sett med dataanalyse. Det første datasettet inneholder grunnleggende demografisk informasjon om en gruppe kunder. Det andre datasettet inneholder kjøpspreferanser for de samme kundene. Ved å kombinere og kryssreferere de to datasettene kan ny innsikt om kjøpspreferanser basert på alder, kjønn og utdanningsnivå avdekkes. Denne mer detaljerte informasjonen er avledede data som ikke er synlige i noen av de opprinnelige datasettene. 

Data kan utledes gjennom flere ulike algoritmer, blant annet:

  • Ekstraksjon av data

  • Restrukturering av data

  • Supplering av data

  • Utledning av ny innsikt

  • Generering av modeller

Kopiering, omformatering eller ompakking av data skaper ikke avledede data, og det gjør heller ikke enkel oppsummering av eksisterende data. Avledede data inneholder ny informasjon som ikke finnes i de opprinnelige dataene.

Hva er de ulike datatypene?

Forskere grupperer data i fire grunnleggende typer: observasjonsdata, eksperimentelle data, simuleringsdata og avledede data. De tre første datatypene omtales noen ganger som direkte data, noe som skiller dem tydelig fra avledede data.

  1. Observasjonsdata

    Observasjonsdata samles inn ved å observere en aktivitet eller ved å spørre en person om en aktivitet. For eksempel er telling av kundetrafikk observasjonsdata.
  2. Eksperimentelle data

    Eksperimentelle data samles inn når en forsker aktivt griper inn i en gitt aktivitet og måler de resulterende endringene. For eksempel er en studie der noen deltakere får et eksperimentelt legemiddel og andre en placebo, eksperimentelle data.
  3. Simuleringsdata

    Simuleringsdata genereres ved å etterligne en virkelig prosess ved hjelp av testmodeller. For eksempel er det å kjøre en datasimulering av belastningsnivåer på et nytt produkt simuleringsdata. 
  4. Avledede data

    Som du har lært, skapes avledede data ved å transformere eksisterende datapunkter for å avdekke ny innsikt. For eksempel regnes kombinering av befolkningsdata med geografiske data for å skape befolkningstetthetsdata som avledede data. 

    Avledede data kan ekstraheres fra hvilken som helst av de tre andre datatypene – men bør ikke utledes fra andre avledede data. Når forskere skaper avledede data, følger de en rekke beste praksiser som beskriver inndataene, hvordan dataene behandles, og nøyaktigheten av de avledede resultatene.

Hvilke utfordringer er knyttet til avledede data?

Så nyttige som avledede data er, medfører de sine egne unike utfordringer som følge av måten de skapes på. 

Nøyaktighetsutfordringer

Avledede data er ekstrapolert fra eksisterende data og er derfor ikke like nøyaktige som rådataene. Spørringer gjort på avledede data kan gi mindre presise resultater enn spørringer gjort på de opprinnelige dataene. Nøyaktighet kan bli et problem hvis avledede data deretter behandles sammen med andre avledede data for å skape et nytt datanivå. Scenarioet ligner utfordringen med å lage en kopi av en kopi av et fotografi, som sjelden bevarer kvaliteten til originalen. (Av denne grunn er det klokt å lagre de opprinnelige dataene i stedet for, eller i tillegg til, de avledede dataene.)

Personvernutfordringer

Siden avledede data ofte er ekstrahert fra analyser av eksisterende data som er levert med uttrykkelig samtykke fra enkeltpersoner, er disse personene vanligvis ikke klar over den nye informasjonen som avdekkes i de avledede dataene. Spørsmålet er om samtykket til å bruke grunnlagsinformasjonen innebærer samtykke til å bruke data som er utledet fra, men ikke eksplisitt inneholdt i, de opprinnelige dataene. 

Eierskapsutfordringer

I tillegg til personvern og bruksspørsmål kommer spørsmålet om hvem som eier de avledede dataene. De opprinnelige dataene kommer vanligvis fra en identifisert kilde, men selve handlingen med å kombinere og transformere disse dataene skaper helt nye datasett. Har de opprinnelige dataeierne eierskapskrav på de avledede dataene, eller eies de avledede dataene fullt ut av enheten som behandlet de opprinnelige dataene? Lovverket er ikke tydelig på dette punktet. 

Hvordan kan du bruke avledede data i bedriften din?

Avledede data gir kritisk innsikt som ikke er umiddelbart synlig i de opprinnelige dataene. I stedet for å begrenses til statiske observasjoner fra direkte data, går avledede data utover rådataene for å skape nye sammenhenger og ekstrapolere nye bruksområder.

Bruk av avledede data gir bedriften din et tydelig konkurransefortrinn overfor andre selskaper som bruker mer tradisjonelle datamodeller. Bruk av avledede data kan hjelpe bedriften din med å:

  • Forstå kundenes ønsker, behov og kjøpsmønstre bedre

  • Identifisere de mest verdifulle kundene dine

  • Skape personaliserte opplevelser og produkter for dine mest verdifulle kunder

  • Tilby bedre kundeservice

  • Forbedre effektiviteten og redusere kostnader ved å målrette innsatsen bedre

Kort sagt, når du ønsker å gå utover rådataene du samler inn, kan du bruke tilgjengelige analytiske teknikker for å syntetisere nye, avledede data. Disse avledede dataene gir selskapet ditt avansert innsikt om kundene, markedet og virksomheten din som ikke er tilgjengelig fra de opprinnelige dataene. 

La Optimizely hjelpe deg med å høste fordelene av avledede data

Optimizelys Digital Experience Platform syntetiserer de eksisterende dataene dine for å skape avledede data som bidrar til å drive virksomheten din fremover. Dette gir handlingsrettet innsikt du kan bruke til å bedre definere målgruppen din, tilby personaliserte kundeopplevelser og finjustere e-handelsaktivitetene dine. Samarbeid med Optimizely for å få mest mulig ut av alle dine verdifulle data.