Introducing Optimizely Opal
an all-new AI platform. See how it works
Publicerad april 06, 2023

Lagerbaserad prestandaoptimering: sampling av frågor och tid

Priyendra Deshwal
av Priyendra Deshwal
3 min read time

Optimizely Warehouse-native Analytics Performance Pack gör det nu möjligt för Enterprise-användare att köra utforskningar över samplade data. Som man kan förvänta sig körs sådana utforskningar storleksordningar snabbare än deras icke-samplade varianter. Optimizely Warehouse-Native Analytics samplingsfunktion är implementerad för att säkerställa att resultaten som produceras av samplade undersökningar är statistiskt tillförlitliga och kan användas för att fatta kritiska affärsbeslut.

Bakgrund

Warehouse-native analytics ger kunderna en övertygande trio av fördelar:

  • Tillgång till all affärsdata: Kunderna behöver inte längre bestämma vilken delmängd av data som ska skickas till första generationens verktyg för produktanalys. All data i lagret är tillgänglig för analys, hela tiden.
  • Säkerhet och styrning: Ingen data lämnar någonsin kundens lager.
  • Kostnad & skala upp: Prissättningsmodellerna hos den första generationens leverantörer skalar upp dåligt med höga händelsevolymer. Warehouse-native analytics är betydligt billigare tack vare de elastiska prismodellerna för moderna datalager som bygger på att man betalar för det man använder.

Under dessa starka, omedelbart uppenbara fördelar lurar en underliggande fråga som alla tänker på.

Kommer mitt lager att ha tillräckligt med juice för att kunna stödja dessa frågor?

Och svaret är ja. Optimizely Warehouse-Native Analytics samlar en samling tekniker för att göra interaktiv warehouse-native analytics möjlig. Sampling vid frågetid är en sådan teknik.

Hur sampling fungerar

Många av de statistiska idéerna bakom sampling är välkända. På en hög nivå tittar du på ett urval av data (säg 20 %), beräknar resultatet och uppgraderar sedan resultatet med 5 gånger för att kompensera för urvalsfrekvensen på 20 %. Opinionsinstitut gör detta hela tiden när de genomför opinionsundersökningar på ett urval av befolkningen och förutspår valresultat. Precis som val handlar om att räkna människor som röstar på sina favoritkandidater, handlar produktanalys om att räkna användare som tillhör vissa kohorter, når vissa produktmilstolpar etc.

Det finns två viktiga regler att komma ihåg vid provtagning:

  1. Urvalet måste vara opartiskt. I valanalogin måste varje väljare ha lika stor chans att bli utvald. Åt sidan: Det är här som de flesta felaktigheterna i valprognoser kommer ifrån, men det är ett ämne för en annan dag.
  2. En användare måste antingen vara helt inkluderad eller helt exkluderad från urvalet. Det får inte vara så att en användares händelsehistorik bara delvis ingår i urvalet.

Optimizely Warehouse-Native Analytics implementering av urvalet uppfyller båda dessa krav. Det finns flera underliggande tekniska detaljer avseende datalayout, val av urvalsstorlek etc. som ligger utanför ramen för denna diskussion. Alla dessa detaljer samlas dock i en vacker användarupplevelse som är snabb och intuitiv.

Användaren behöver bara välja mellan tre alternativ:

  1. Aktiverad - Snabbare svar: Den här inställningen gynnar snabb exekvering av frågor framför exakta resultat. Detta är bra när man itererar över en fråga.
  2. Aktiverad - Högre precision: Frågor med den här inställningen är fortfarande betydligt snabbare än osamplade, men de gynnar resultatnoggrannhet framför snabb frågeexekvering.
  3. Inaktiverad: Detta inaktiverar sampling helt och hållet och frågor körs på normalt osamplat sätt.

För de flesta undersökningar innebär detta att det finns en hög grad av säkerhet (t.ex. 99 %) för att de verkliga resultaten ligger mycket nära (t.ex. inom 0,5 %) de samplade resultaten. Den här typen av stark statistisk garanti gör det möjligt för kunderna att fatta viktiga affärsbeslut baserat på samplade undersökningar.

En viktig detalj här är att Optimizely Warehouse-native Analytics inte samplar händelser vid ingångstiden. Detta skiljer sig markant från andra leverantörer där kunderna tvingas sampla händelser vid ingestion för att undvika höga kostnader för ingestion av händelser. En händelse som samplas vid inmatningstillfället går förlorad för alltid.

Med Optimizely Warehouse-native Analytics dikterar inte din samplingsstrategi din datastrategi.

I vår warehouse native-modell rekommenderar vi att kunderna lagrar varenda händelse i lagret och dynamiskt justerar samplingsförhållandet för att passa behoven i deras användningsfall.

Optimizely Warehouse-Native Analytics är uppbyggt på vårt egenutvecklade analytiska skriptspråk NetScript. Användare av Optimizely Warehouse-native Analytics interagerar med peka och klicka-undersökningar. Dessa utforskningar producerar NetScript som sammanställs till den SQL som skickas till lagret. NetScript har varit en viktig möjliggörare för vår samplingsmetod. Den nuvarande versionen av sampling fungerar från de flesta utforskningsmallar, inklusive tratt, väganalys, retention och segmentering av händelser. Nästa version av denna funktion kommer att kunna tillämpa sampling över en mycket bredare klass av frågor och ge ännu större kostnadsbesparingar för våra kunder.

  • Analys
  • Last modified: 2025-04-26 00:17:00