Posted april 22, 2022

6 kjennetegn ved sanntidsanalyse

Priyendra Deshwal
av Priyendra Deshwal
diagram

"Sanntid" er kanskje et av de mest utbredte begrepene i næringslivet i dag, og beskriver systemer og funksjoner som reagerer på hendelser mens de skjer. Med så mange mennesker som samhandler, handler og konsumerer innhold i sanntid, ønsker bedrifter analyser som hjelper dem med å forstå denne atferden og ta beslutninger i sanntid. Med oppdatert, handlingsrettet innsikt fra ferske data kan menneskene, prosessene og systemene i en organisasjon reagere på hendelser i den hastigheten kundene forventer - og raskere enn konkurrentene.

Sanntidsanalyse er helt avgjørende for virksomhetens smidighet. Ulike forretningskrav på tvers av bransjer har imidlertid skapt en del forvirring rundt dette begrepet. I denne artikkelen vil vi klargjøre begrepet ved å gi deg et rammeverk for å tenke på hva sanntidsanalyse bør bety for organisasjonen din.

Hva er sanntidsanalyse?

Gartner definerer sanntidsanalyse som "disiplinen som anvender logikk og matematikk på data for å gi innsikt som gjør det mulig å ta bedre beslutninger raskt". Innenfor denne kategorien finnes det to typer: sanntidsanalyse på forespørsel, der analysene leveres raskt når brukerne ber om dem, og kontinuerlig sanntidsanalyse, som proaktivt varsler brukerne og utløser respons på hendelser.

En vanlig misforståelse er at analyser bare er "sanntids" hvis systemet opererer med en viss hastighet - for eksempel svar på hendelser på under et sekund. Det finnes faktisk ingen enhetlig definisjon av hvor raskt man må være for å bli ansett som "sanntid". Hvis du er interessert i å bygge opp sanntidsanalyse, er det best å ikke fokusere utelukkende på tallene, men i stedet tenke på hvilke egenskaper systemet ditt må ha.

Hva kjennetegner et sanntidsanalysesystem?

Definisjonen fra Gartner er nyttig, men fra et forretningsperspektiv kan det være vanskelig å se for seg hvordan et sanntidsanalysesystem ser ut helt konkret. For å hjelpe deg har vi identifisert seks egenskaper som alle sanntidsanalysesystemer bør ha:

  1. Ferske data
  2. Dashbord med høy ytelse
  3. "Tankehastighet" ved spørring
  4. Direkte overvåking
  5. Varsling
  6. Øyeblikkelige handlinger

Du kan bruke disse egenskapene som et rammeverk for å tenke over hva sanntid betyr for deg og din rolle i organisasjonen. I hvert av avsnittene nedenfor har vi definert egenskapen, sammen med en beskrivelse av hvordan den fungerer ved hjelp av moderne datateknologi.

Ferske data

Konvensjonelle databehandlingsmetoder har en forsinkelse mellom innsamlingen av data og de analytiske operasjonene som til slutt gir nyttig innsikt. Data som skal analyseres, går vanligvis gjennom pipelines for utvinning, rensing og normalisering. Deretter lastes de inn i spesialiserte analyselagre. I mange bedrifter går det 24 timer eller mer fra nettdata samles inn til de er tilgjengelige for analyse.

Sanntidsanalyse betyr at du har ferskere data lett tilgjengelig - data som ble opprettet for minutter eller sekunder siden, ikke for flere timer siden.

Slik fungerer det:

Stadig mer data behandles kontinuerlig i strømming med systemer som Kafka. Cloud data lakes muliggjør effektiv lagring og behandling av alle rådata. Og det nye økosystemet med verktøy for spørringsbehandling direkte på toppen av datasjøen eliminerer behovet for dataflytting på tvers av flere systemer.

Dashbord med høy ytelse

Dashbord er en kritisk del av enhver organisasjons analysestack, og treg ytelse har vært en utfordring, slik at brukerne har måttet vente på at spørringer skal fullføres og data gjengis.

For å oppnå sanntidsanalyse er det avgjørende at dataingeniører hele tiden jobber for å optimalisere ytelsen på dashbordet for raskere gjengivelse.

Slik fungerer det:

Avhengig av hvordan dashbordet er implementert, kan bedre ytelse oppnås ved hjelp av moderne skybaserte systemer for spørringsbehandling, forhåndsberegnede kuber som betjener spesifikke dashbord, databaser i minnet eller indekserte systemer.

"Tankehastighet" ved spørring

Et typisk mønster for ad hoc-analyser innebærer å dele opp data i ulike dimensjoner interaktivt, enten ved hjelp av SQL eller et visuelt utforskningsverktøy. Når man jobber med store datamengder og komplekse skjemaer, er det vanlig å måtte vente på at systemet skal komme à jour, slik at man kan stille neste spørsmål.

God interaktiv spørringsytelse er nøkkelen til sanntidsanalyse, fordi det gjør det mulig for analytikere å utforske data i "tankens hastighet".

Slik fungerer det:

Mange av teknikkene som gjør det mulig å lage raskere dashbord, kan også brukes til å gjøre interaktive spørringer raskere. I tillegg kan systemer som tilbyr en integrert applikasjons- og dataplattform, optimalisere spørringsytelsen gjennom kjennskap til applikasjonens metadatamodell.

For å unngå å støte på spørsmål som ikke kan besvares med de dataene man har til rådighet, er det avgjørende at spørringsbehandlingsmotoren kan koble sammen og stille spørsmål på tvers av direktestrømmende data og statiske batchdata med full SQL-støtte. Merk: Dette er noe annet enn å behandle en datastrøm, skrive den til en database og deretter utstede batch-spørringer til databasen.

Direkte overvåking

Sanntidsanalysesystemer støtter kontinuerlig, direkte overvåking av viktige forretningsparametere. Operatører og analytikere må kunne se at disse dataene oppdateres etter hvert som de underliggende dataene endres, i stedet for å vente på at en batchprosess skal kjøres.

Slik fungerer det:

Live-overvåking krever effektiv beregning på backend. Systemet må kunne oppdatere målingene trinnvis, og beregne det minste behovet for ny beregning basert på de dataene som har endret seg siden forrige beregning. I tillegg må systemet kunne pushe oppdateringer kontinuerlig, i stedet for å basere seg på den tradisjonelle pull-modellen som venter på en brukerforespørsel.

Varsling

I travle driftsmiljøer er det ikke alltid brukerne ser på rapporter eller dashbord for å oppdage uregelmessigheter i virksomheten. Sanntidsanalysesystemer må ha en robust varslingsmekanisme som varsler brukerne umiddelbart om potensielle problemer og muligheter. Hvem som helst bør kunne sette opp et varsel, ikke bare en analyseekspert.

Slik fungerer det:

Varslingssystemer uten koderegler kan bidra til at forretningslogikken enkelt kan uttrykkes av forretningsbrukere. I tillegg kan maskinlæringsmodeller trenes opp til å oppdage avvikende data.

Øyeblikkelige handlinger

I tidskritiske forretningsmiljøer er det bare delvis nyttig å motta et varsel om et potensielt problem eller en mulighet. Hvordan kan du deretter handle på det?

For sanntidsanalyser er det avgjørende å lukke loopen med automatiserte eller halvautomatiserte handlinger. Disse handlingene kan være så enkle som å legge ut en melding i et samarbeidsverktøy, eller spesialiserte API-kall for å sette i gang bestemte arbeidsflyter eller prosesser.

Slik fungerer det:

På samme måte som varslene kan handlinger spesifiseres med regler uten kode av et system som modellerer arbeidsflyter og prosesser under panseret. Med maskinlæringsmodeller kan handlingene til og med læres og deretter automatiseres i fremtiden.

Kraften i én sentral plattform for sanntidsanalyse

De fleste virksomheter bygger opp sanntidsanalyse stykkevis og delt, ved å aktivere ulike deler av stakken med en rekke verktøy som kan oppfylle noen av egenskapene i dette rammeverket. Selv om dette gir fleksibilitet og gjør det mulig å ta på seg endringen gradvis, finnes det en annen måte som blir stadig mer populær: å ta i bruk ny plattformteknologi som kan gjøre alt.

I stedet for å tilføre sanntidsfunksjoner til bare én del av analysestakken, kombinerer nye plattformer for hendelsesstrømanalyse sanntidsanalyse med tradisjonell BI for å sikre at dataene er oppdaterte i hele stakken. De tilbyr dashbord med høy ytelse, interaktive spørringer og live-overvåking som forener data i bevegelse og data i ro. Disse plattformene kan inkludere ML-modeller for varsling og handling.

Warehouse-Native Analytics' nestegenerasjons plattform kan gi virksomheten din en moderne, skybasert ende-til-ende-løsning som er spesialbygget for hendelsesdataanalyse i sanntid og i stor skala.