Men etter hvert som vi utviklet en statistisk modell som mer nøyaktig ville samsvare med hvordan Optimizelys kunder bruker eksperimentresultatene sine til å ta beslutninger (Stats Engine), ble det klart at den beste løsningen måtte blande elementer fra både frekventistiske og bayesianske metoder for å levere både påliteligheten til frekventistisk statistikk og hastigheten og smidigheten til bayesianske metoder.
Denne tilnærmingen er i tråd med en noe mindre kjent tredje tankeskole innen statistikk. Den kalles Empirisk Bayes og er basert på prinsippet om at statistiske metoder bør innlemme styrkene til både bayesianske og frekventistiske ideologier, samtidig som de reduserer svakhetene ved begge.
I likhet med brokonseptet kombinerer Empirisk Bayes begge tilnærmingene for å gi en innovativ løsning på spørsmålene, og kan bidra til å unngå vanskelighetene med å velge enten en buebro eller en hengebro alene.
Ved å kombinere det beste fra en bue- og opphengskonstruksjon skapes en gjennomgående buebro, som kan gi det beste resultatet for et gitt gap, slik man ser her med Sydney Harbour Bridge.
Faktisk inkorporerer Optimizelys Stats Engine en metode direkte fra Empirical Bayes' tankegang, slik at brukere kan teste mange mål- og variasjonskombinasjoner uten å ofre statistisk nøyaktighet.
Benjamini-Hochberg-tilnærmingen kontrollerer en type statistisk feil som kalles False Discovery Rates (FDR). FDR er en måling som tar for seg det faktum at du kan gjøre mange feil når du kjører flere A/B-tester samtidig. Dette er vanligvis et problem hvis du kjører multivariate eller A/B/n-eksperimenter med mange variasjoner, eller sporer mange mål i et eksperiment.
Vi beskriver hvordan denne tilnærmingen fungerer og hvorfor den presenterer den statistiske feilraten som bedrifter faktisk bryr seg om i blogginnlegget vårt om Stats Engine og mer detaljert teknisk beskrivelse. Vi har også nylig spilt inn et webinar med et eksempel på FDR i aksjon for A/B-testing.
Benjamini-Hochberg FDR-tilnærmingen for å kontrollere denne feilen har vist seg å være vellykket etter både frequentistiske og bayesianske standarder. Prosedyren innlemmer ikke bare data fra tidligere eksperimenter på en rimelig måte, men gir også resultatene og de statistiske garantiene for frekventisme du forventer, uansett hvilket perspektiv du tar.
Den raske og vidtrekkende aksepten av Benjamini-Hochberg-tilnærmingen i akademiske og medisinske miljøer kan tilskrives det faktum at metoden har overbevist både bayesianere og frekventister om dens fordeler.
Så mener vi at alle bør tenke som en frekventist? En bayesianer? En empirisk bayesianer? Overhodet ikke. Bør du skynde deg å innta fargene til en av disse leirene? Selvfølgelig ikke. Grunnen til at disse ideologiene vedvarer, er at de på et veldig grunnleggende nivå alle er gode måter å tenke på å lære av dataene dine.
Vi mener at for å være en kunnskapsrik A/B-tester, som en informert velger eller en effektiv bygningsingeniør, er det viktig å være kjent med valgene som er tilgjengelige for deg. Vi er begeistret for ikke bare å finne den beste statistikken som passer til måten du bruker data på til å ta beslutninger og iverksette tiltak, men også å gi deg muligheten til å bruke den.