6 definierande egenskaper för realtidsanalys


"Realtid" är kanske en av de mest allmänt förekommande termerna i dagens affärsvärld och beskriver system och funktioner som reagerar på händelser direkt när de inträffar. Med så många människor som interagerar, handlar och konsumerar innehåll i realtid vill företagen ha analyser som hjälper dem att förstå dessa beteenden och fatta beslut i realtid. Med aktuella och användbara insikter från färska data kan människor, processer och system i en organisation reagera på händelser i den takt som kunderna förväntar sig - och snabbare än konkurrenterna.
Realtidsanalys kan inte vara viktigare än så för en flexibel verksamhet. Men varierande affärskrav från olika branscher har skapat en viss förvirring kring denna term. I den här artikeln ska vi klargöra termen genom att ge dig ett ramverk för att fundera över vad realtidsanalys bör betyda för din organisation.
Vad är realtidsanalys?
Gartner definierar realtidsanalys som "den disciplin som tillämpar logik och matematik på data för att ge insikter som gör det möjligt att snabbt fatta bättre beslut". Inom den här kategorin finns det två typer: realtidsanalys på begäran, där analyser levereras snabbt när de begärs av användare, och kontinuerlig realtidsanalys, som proaktivt varnar användare och utlöser svar på händelser.
En vanlig missuppfattning är att analyser bara är "i realtid" om systemet arbetar med en viss hastighet - till exempel svar på händelser inom loppet av en sekund. Faktum är att det inte finns någon enhetlig definition av hur snabbt man måste vara för att det ska anses vara "realtid". Om du är intresserad av att bygga realtidsanalys är det bäst att inte bara fokusera på siffrorna, utan istället fundera på vilka egenskaper ditt system måste ha.
Vad är det som kännetecknar ett analyssystem i realtid?
Definitionen från Gartner är användbar, men ur ett affärsperspektiv kan det vara svårt att föreställa sig hur ett realtidsanalyssystem ser ut rent konkret. För att hjälpa till har vi identifierat sex egenskaper som alla realtidsanalyssystem bör ha:
- Färska data
- Högpresterande dashboards
- "Snabbhet i tanken"-förfrågningar
- Live-övervakning
- Varning
- Omedelbara åtgärder
Du kan använda dessa egenskaper som ett ramverk för att fundera över vad realtid betyder för dig och din roll i organisationen. I vart och ett av avsnitten nedan har vi definierat egenskapen tillsammans med en kommentar om hur den fungerar med hjälp av modern datateknik.
Färska data
Konventionella databehandlingsmetoder har en fördröjning mellan datainsamlingen och de analytiska operationer som så småningom ger handlingsbara insikter. Data för analys går vanligtvis genom pipelines för extrahering, rensning och normalisering. Därefter laddas den i specialiserade analyslager. I många företag är den totala tiden mellan datainsamlingen och när den är tillgänglig för analys 24 timmar eller mer.
Realtidsanalys innebär att du har färskare data till hands - data skapades för några minuter eller sekunder sedan, inte för flera timmar sedan.
Hur det fungerar:
Allt mer data bearbetas kontinuerligt i strömmande form med system som Kafka. Datasjöar i molnet möjliggör effektiv lagring och bearbetning av all rådata. Slutligen eliminerar det framväxande ekosystemet med verktyg för bearbetning av frågor direkt ovanpå datasjön behovet av dataförflyttning mellan flera system.
Högpresterande dashboards
Dashboards är en kritisk del av alla organisationers analysverktyg och långsam prestanda har varit en utmaning, vilket gör att användarna får vänta på att frågor ska slutföras och data visas.
För att uppnå realtidsanalys är det viktigt att datatekniker ständigt strävar efter att optimera dashboard-prestanda för snabbare rendering.
Hur det fungerar:
Beroende på hur dashboarden är implementerad kan bättre prestanda uppnås med moderna molntjänster för bearbetning av frågor, förberäknade kuber som betjänar specifika dashboards, minnesdatabaser eller indexerade system.
"Snabbhet i tanken"-förfrågningar
Ett typiskt mönster för ad hoc-analys innebär att data delas upp i olika dimensioner på ett interaktivt sätt, antingen med hjälp av SQL eller ett visuellt utforskningsverktyg. När man arbetar med stora datamängder och komplexa scheman är det vanligt att man måste vänta på att systemet ska komma ikapp så att man kan ställa nästa fråga.
Bra prestanda för interaktiva frågor är nyckeln till realtidsanalys eftersom det gör det möjligt för analytiker att utforska data med "tankens hastighet".
Upptäck varför Forrester utsett Optimizely till en ledare
Hur det fungerar:
Många av de tekniker som möjliggör snabbare dashboards kan också möjliggöra snabbare interaktiva frågor. Dessutom kan system som erbjuder en integrerad applikations- och dataplattform optimera frågeprestanda genom att känna till applikationens metadatamodell.
För att undvika att stöta på frågor som inte kan besvaras med den data som finns tillgänglig är det viktigt att motorn för frågebehandling kan delta i och ställa frågor om livestreamad data och statisk batchdata med fullt SQL-stöd. Observera: detta skiljer sig från att bearbeta en dataström, skriva den till en databas och sedan utfärda batchfrågor till databasen.
Övervakning i realtid
System för realtidsanalys stöder kontinuerlig övervakning i realtid av viktiga affärsmått. Operatörer och analytiker måste kunna se att dessa mätvärden uppdateras när de underliggande uppgifterna ändras, i stället för att vänta på att en batchprocess ska köras.
Så här fungerar det:
Liveövervakning kräver effektiva beräkningar på backend. Systemet måste kunna uppdatera mätvärdena stegvis och beräkna den minsta omräkning som behövs baserat på de data som har ändrats sedan den senaste beräkningen. Dessutom måste systemet kunna skicka uppdateringar kontinuerligt, i stället för att förlita sig på den traditionella pull-modellen som väntar på en användarfråga.
Varning
I operativa miljöer med högt tempo tittar användarna inte ständigt på rapporter eller dashboards för att upptäcka avvikelser i verksamheten. System för realtidsanalys måste ha en robust varningsmekanism som omedelbart meddelar användarna om potentiella problem och möjligheter. Vem som helst ska kunna skapa en varning, inte bara en analysexpert.
Så här fungerar det:
Varningssystem med regler utan kod kan bidra till att göra affärslogik lätt att uttrycka för affärsanvändare. Dessutom kan modeller för maskininlärning tränas för att upptäcka avvikande data.
Omedelbara åtgärder
I tidskritiska affärsmiljöer är det bara delvis användbart att få en varning om ett potentiellt problem eller en möjlighet. Hur agerar man sedan på det?
För realtidsanalys är det avgörande att sluta cirkeln med automatiserade eller halvautomatiserade åtgärder. Dessa åtgärder kan vara så enkla som att publicera ett meddelande i ett samarbetsverktyg eller specialiserade API-anrop för att initiera vissa arbetsflöden eller processer.
Hur det fungerar:
I likhet med varningar kan åtgärder specificeras med regler utan kod av ett system som modellerar affärsflöden och processer under huven. Med maskininlärningsmodeller kan åtgärder till och med läras in och sedan automatiseras i framtiden.
Kraften i en central plattform för realtidsanalys
För att bygga upp realtidsanalys följer de flesta företag en fragmentarisk väg: de aktiverar olika delar av sin stack med en rad olika verktyg som kan uppfylla några av egenskaperna i detta ramverk. Även om detta ger flexibilitet och gör att du kan ta dig an förändringen gradvis, finns det ett annat sätt som blir alltmer populärt: att använda ny plattformsteknik som kan göra allt.
I stället för att ge realtidsfunktioner till bara en del av din analysstack, konsoliderar nya plattformar för analys av händelseströmmar realtidsanalys med traditionell BI för att säkerställa att data är färska i hela din stack. De tillhandahåller högpresterande dashboards, interaktiva frågor och liveövervakning som förenar data i rörelse och data i vila. Dessa plattformar kan inkludera ML-modeller för varningar och åtgärder.
Warehouse-Native Analytics nästa generations plattform kan stärka ditt företag med en modern, molnbaserad end-to-end-lösning, specialbyggd för analys av händelsedata i realtid och i skala upp.