Bildekilde: Optimizely
Som et enkelt eksempel på avledede data, ta for deg to ulike sett med dataanalyse. Det første datasettet inneholder grunnleggende demografisk informasjon om en gruppe kunder. Det andre datasettet inneholder kjøpspreferanser for de samme kundene. Ved å kombinere og kryssreferere de to datasettene kan ny innsikt om kjøpspreferanser basert på alder, kjønn og utdanningsnivå avdekkes. Denne mer detaljerte informasjonen er avledede data som ikke er synlige i noen av de opprinnelige datasettene.
Data kan utledes gjennom flere ulike algoritmer, blant annet:
-
Ekstraksjon av data
-
Restrukturering av data
-
Supplering av data
-
Utledning av ny innsikt
-
Generering av modeller
Kopiering, omformatering eller ompakking av data skaper ikke avledede data, og det gjør heller ikke enkel oppsummering av eksisterende data. Avledede data inneholder ny informasjon som ikke finnes i de opprinnelige dataene.
Hva er de ulike datatypene?
Forskere grupperer data i fire grunnleggende typer: observasjonsdata, eksperimentelle data, simuleringsdata og avledede data. De tre første datatypene omtales noen ganger som direkte data, noe som skiller dem tydelig fra avledede data.
-
Observasjonsdata
Observasjonsdata samles inn ved å observere en aktivitet eller ved å spørre en person om en aktivitet. For eksempel er telling av kundetrafikk observasjonsdata.
-
Eksperimentelle data
Eksperimentelle data samles inn når en forsker aktivt griper inn i en gitt aktivitet og måler de resulterende endringene. For eksempel er en studie der noen deltakere får et eksperimentelt legemiddel og andre en placebo, eksperimentelle data.
-
Simuleringsdata
Simuleringsdata genereres ved å etterligne en virkelig prosess ved hjelp av testmodeller. For eksempel er det å kjøre en datasimulering av belastningsnivåer på et nytt produkt simuleringsdata.
-
Avledede data
Som du har lært, skapes avledede data ved å transformere eksisterende datapunkter for å avdekke ny innsikt. For eksempel regnes kombinering av befolkningsdata med geografiske data for å skape befolkningstetthetsdata som avledede data.
Avledede data kan ekstraheres fra hvilken som helst av de tre andre datatypene – men bør ikke utledes fra andre avledede data. Når forskere skaper avledede data, følger de en rekke beste praksiser som beskriver inndataene, hvordan dataene behandles, og nøyaktigheten av de avledede resultatene.
Hvilke utfordringer er knyttet til avledede data?
Så nyttige som avledede data er, medfører de sine egne unike utfordringer som følge av måten de skapes på.
Nøyaktighetsutfordringer
Avledede data er ekstrapolert fra eksisterende data og er derfor ikke like nøyaktige som rådataene. Spørringer gjort på avledede data kan gi mindre presise resultater enn spørringer gjort på de opprinnelige dataene. Nøyaktighet kan bli et problem hvis avledede data deretter behandles sammen med andre avledede data for å skape et nytt datanivå. Scenarioet ligner utfordringen med å lage en kopi av en kopi av et fotografi, som sjelden bevarer kvaliteten til originalen. (Av denne grunn er det klokt å lagre de opprinnelige dataene i stedet for, eller i tillegg til, de avledede dataene.)
Personvernutfordringer
Siden avledede data ofte er ekstrahert fra analyser av eksisterende data som er levert med uttrykkelig samtykke fra enkeltpersoner, er disse personene vanligvis ikke klar over den nye informasjonen som avdekkes i de avledede dataene. Spørsmålet er om samtykket til å bruke grunnlagsinformasjonen innebærer samtykke til å bruke data som er utledet fra, men ikke eksplisitt inneholdt i, de opprinnelige dataene.
Eierskapsutfordringer
I tillegg til personvern og bruksspørsmål kommer spørsmålet om hvem som eier de avledede dataene. De opprinnelige dataene kommer vanligvis fra en identifisert kilde, men selve handlingen med å kombinere og transformere disse dataene skaper helt nye datasett. Har de opprinnelige dataeierne eierskapskrav på de avledede dataene, eller eies de avledede dataene fullt ut av enheten som behandlet de opprinnelige dataene? Lovverket er ikke tydelig på dette punktet.
Hvordan kan du bruke avledede data i bedriften din?
Avledede data gir kritisk innsikt som ikke er umiddelbart synlig i de opprinnelige dataene. I stedet for å begrenses til statiske observasjoner fra direkte data, går avledede data utover rådataene for å skape nye sammenhenger og ekstrapolere nye bruksområder.
Bruk av avledede data gir bedriften din et tydelig konkurransefortrinn overfor andre selskaper som bruker mer tradisjonelle datamodeller. Bruk av avledede data kan hjelpe bedriften din med å:
-
Forstå kundenes ønsker, behov og kjøpsmønstre bedre
-
Identifisere de mest verdifulle kundene dine
-
Skape personaliserte opplevelser og produkter for dine mest verdifulle kunder
-
Tilby bedre kundeservice
-
Forbedre effektiviteten og redusere kostnader ved å målrette innsatsen bedre
Kort sagt, når du ønsker å gå utover rådataene du samler inn, kan du bruke tilgjengelige analytiske teknikker for å syntetisere nye, avledede data. Disse avledede dataene gir selskapet ditt avansert innsikt om kundene, markedet og virksomheten din som ikke er tilgjengelig fra de opprinnelige dataene.
La Optimizely hjelpe deg med å høste fordelene av avledede data
Optimizelys Digital Experience Platform syntetiserer de eksisterende dataene dine for å skape avledede data som bidrar til å drive virksomheten din fremover. Dette gir handlingsrettet innsikt du kan bruke til å bedre definere målgruppen din, tilby personaliserte kundeopplevelser og finjustere e-handelsaktivitetene dine. Samarbeid med Optimizely for å få mest mulig ut av alle dine verdifulle data.