Rapporten om agentbaserad AI-experimentering

Rapporten om agentbaserad AI-experimentering

900 företag. 47 000 interaktioner. En slutsats: AI:s påverkan är fast på individnivå

AI stjäl den första kontakten.

Köpare jämför alternativ i AI-verktyg. När någon väl landar på din webbplats är de redan informerade. Redo att köpa.

Det är därför varje upplevelse spelar roll – eftersom färre sökningar slutar med ett klick.

Men att förbättra de upplevelserna kräver arbete. Varje experiment kräver research, hypotesvalidering, variationsutveckling, exekvering, övervakning och analys. Varje steg väntar på någon.

Så du kompromissar. Testar bara de största idéerna. Låter mindre möjligheter samlas på hög. Väntar på konklusiva resultat.

Att AI kan hjälpa är ingen nyhet. Men du har förmodligen testat AI och stött på en utmaning vi ser hos varumärken överallt:

Hur får man AI att fungera tillförlitligt, i stor skala, och med ansvarighet och styrning?

För att hitta ett svar på problemet med att skala med AI analyserade vi data från 47 000 Optimizely Opal-interaktioner och 900 företag.

58,74%

av all agentanvändning är experimentering.

Om vår forskning

Våra insikter bygger på tre primära datakällor:

1

Intern Optimizely Opal-data: Analyserad användningsdata från 47 000 Optimizely Opal-interaktioner från kunder som anammade Optimizely Opal efter den publika lanseringen, med fokus på funktionsadoptionsmönster, användarbeteende och mätbara resultat.

2

Kundberättelser från tidiga användare: Förstahandsinsikter från nästan 900 Optimizely Opal-användare, som belyser deras implementeringserfarenheter, utmaningar de övervunnit och de konkreta effekterna de uppnått.

3

Branschforskning: Tredjepartsforskning och undersökningar från ledande företag som McKinsey och Gartner, som ger extern kontext kring bredare AI-adoptionstrender och omvandlingar inom marknadsföring.

900 företag. 47 000 Optimizely Opal-interaktioner.

Fungerar AI för experimentering?

Team som använder agenter genom hela livscykeln behöver inte längre kompromissa. De får båda. Fler experiment och högre andel vinnare.

+ 78,66% skapade experiment
+ 2,38% avslutade experiment
+ 24,05% skapade personaliseringskampanjer
+ 11,97% avslutade personaliseringskampanjer
+ 9,26% vinstandel
+ 1,38% konklusiv andel

Så, vad gör dessa team annorlunda?

De inser att den verkliga effekten av AI-experimentering ligger i att använda agenter genom hela experimenteringens livscykel för att förbättra slutförandet.

  • 6,8% sammanfattas av agenter.
  • 19,54% är uppföljningar drivna av agentrekommendationer

Skapandet ökar först. När team tar in AI-agenter i exekvering och analys följer avslutningsgrader och vinstandelar efter.

Så här arbetar de nu

  • Topp 10%: 60+ interaktioner
  • Topp 1%: 198+ interaktioner

Branscher: Detaljhandel (17,4%), Mjukvara (11,8%), Finansiella tjänster (9,6%). Även sjukvård, utbildning och försäkring.

Vilka gör detta: Det är inte enbart avancerade team med sofistikerade teknikstackar. 37% har medelmoget program. 12% är i tidig fas. De startade där du är nu.

Alla dessa fantastiska resultat och ändå kan varumärken inte skala AI-resultat. Här är varför.

De flesta team är ett arbetsflöde ifrån resultat som dessa, men utan rätt system förblir varje vinst en engångsföreteelse.

10,95%

av experiment startar med agentgenererade idéer

Alla har AI. Få har systemet för att skala det.

Nästan alla använder AI. Nästan ingen kan skala implementeringen.

80% sitter kvar i pilotfas eller har inte sett några betydande vinster. Bara 8% anser sig vara avancerade med AI.

De flesta team använder AI för enskilda uppgifter. Skriva utkast snabbare. Det hjälper individer men förändrar inte hur programmet drivs.

Mer användning = bättre slutförande, inte bara fler starter

Vår data visar att uppgångskurvan för avslutade experiment är brantare än för skapade experiment. Mer användning innebär inte bara fler tester som startas. Det innebär fler tester som når handlingsbara resultat.

Varför? Agenter hanterar de operativa stegen som får tester att stanna mitt i cykeln:

  • Omvandla idéer till strukturerade planer, så att tester inte väntar på att någon ska skriva ihop dem
  • Bygga variationer, så att tester inte ligger i utvecklingsköer
  • Sammanfatta resultat och rekommendera nästa steg, så att insikter inte dör i presentationer

Robinson Club byggde den här typen av system. Michael Richter tränade agenter att generera produktionsfärdiga landningssidor, granska innehåll för konsekvens och benchmarka konkurrenter – och förvandlade uppgifter som tog dagar till sekunder.

Resultatet: €4M+ i intäkter från experimentering, skalat över fem TUI-varumärken och tio språk. Inte genom att anställa fler. Genom att bädda in agenter genom hela livscykeln.

I samtal med de som använder agentbaserad AI insåg vi att de team som har svårt delar tre problem:

Teamen i den datan löste alla tre. De slutade behandla AI som ett verktyg och började bädda in det i hela arbetsflödet.

Så här ser det ut.

1

Ingen definierad process: Agenter utan arbetsflöden ger inkonsekventa resultat. Olika personer, olika resultat. Användningen beror på vem som råkar öppna verktyget.

2

Ingen orkestrering: Verktyg som inte hänger ihop skapar fler överlämningar, inte färre. Du sparar tid i ett steg, förlorar den i att koordinera nästa.

3

Ingen styrning: Kvaliteten varierar beroende på vem som promptar. Inga kontrollpunkter. Ledningen oroar sig för vad som faktiskt publiceras.

€4M+

i bevisade intäkter från experimentering

AI är fast på nivån för individuell produktivitet

En idé kommer in via ett formulär. Den går igenom genomförbarhetsbedömning. Prioriteras mot backloggen. Någon skriver experimentbriefet. Utveckling plockar upp det. QA kontrollerar. Det lanseras. Resultat kommer in. Någon analyserar. Bestämmer vad som händer härnäst.

Där det stannar upp:

  • Idéer väntar på den enda personen som skriver brief
  • Utveckling tar 2 sprintar per variation, plus 2 dagars ledtid bara för att bli prioriterad
  • Varje variation kräver 0,5 timmars manuell noggrannhetskontroll
  • Analys beror på vem som har tid den veckan
  • Uppföljningsidéer ligger i Slack-trådar

Om det ser bekant ut känner du förmodligen igen även dessa:

1

Godkännandeslingor: Samma leverans som skickas fram och tillbaka. Granskningskommentarer som motsäger förra veckans feedback.

2

Ägarskapsglapp: Idéer som flyter utan ägare. Resultat delas i Slack, uppföljningar skapas aldrig. Vinnande tester som inte skalas eftersom det inte är någons jobb att skala dem.

3

Inkonsekvens: Samma brief, olika resultat beroende på vem som tar sig an det.

4

Bristande förtroende: AI-modeller kan hallucinera, misstolka kontext och ändra beteende över tid. Agentbeslut är svåra att spåra, så det känns som en svart låda varje gång den körs.

Dessa ineffektiviteter är anledningarna till att AI förblir fast på individuell produktivitet istället för att förändra programmet.

För att lösa detta orkestrerar Optimizely Opal AI-agenter nu användningsfall genom dina arbetsflöden och skalar din påverkan utan att skala kostnaderna.

Steg Vad som hände Arbetsflödesagent
Idégenerering 5–10 idéer per månad, begränsat av en persons kapacitet Idéagenten genererar 2–5 testbara idéer per förfrågan
Brief Dagar för att skriva en strukturerad plan Planeringsagenten strukturerar på sekunder
Utveckling 2 sprintar + 2 dagars ledtid per variation Variationsagenten bygger utan kö
QA Manuell kontroll, 0,5 timmar per variation Granskningsagenten flaggar problem före lansering
Analys Väntan på att någon skriver ihop det Sammanfattningsagenten rekommenderar nästa steg
Utforskning SQL-frågor, analytikerberoende Datafrågaagenten svarar på vanlig svenska

Och så här kan du aktivera Optimizely Opal-agenter genom ditt arbetsflöde för upplevelseoptimering:

Bildkälla: Optimizely

När exekvering blir billig blir klarhet en bristvara

Greg Sherwin tillbringade tid före sin karriär inom experimentering i ett partikelfysiklabb. Han tänker på statistiskt brus och osäkerhet annorlunda än de flesta i den här branschen.

Vid vårt senaste webbinarium om AI inom optimering presenterade han en tankeställare värd att begrunda.

Brist försvinner inte. Den byter form.

Varje gång en flaskhals tas bort dyker en ny upp någon annanstans. AI gör samma sak med experimentering. Den första halvan av cykeln är i stort sett löst. Men trycket försvinner inte. Det flyttas nedströms.

Booking.com har kört tusentals experiment parallellt i åratal. Förra månaden publicerade de en artikel om det.

En slutsats stack ut80% av deras experiment saknade styrkeberäkning. Fyra av fem tester kördes utan att veta om de hade tillräckligt med data för att upptäcka något verkligt.

Beräkningen av urvalsstorlek som ingen gör. Metrikkontroll som hoppas över. Det är de första sakerna som faller bort när volymen ökar. Och det är de som avgör om något av det var värt att köra.

De program som ligger i framkant optimerar inte för vinster. De optimerar för lärande. Standardiserade mätvärden, förregistrerade hypoteser, beslutsloggar. Snabbhet utan den strukturen ger inte ränta-på-ränta-effekt. Den bara ackumuleras.

Det är precis det problem som arbetsflödesagenter är byggda för att lösa.

Vad som gör arbetsflödesagenter annorlunda

Du har använt AI för att formulera en hypotes. Sammanfatta ett resultat. Brainstorma idéer.

Föreställ dig att ett test avslutas. Agenten ser det. Sammanfattar resultatet. Identifierar mönstret. Genererar uppföljningsidéer grundade i din historiska data. Skapar planer i ditt format. Lägger dem i kö för granskning.

Du bad inte om det. Den bara körde.

En chattbot svarar när du promptar den. En arbetsflödesagent exekverar. En chattbot börjar om från noll varje gång. En arbetsflödesagent minns.

Agenter förlitar sig på två typer av minne:

  • Sessionskontext: Det aktuella testet. Senaste resultat. Vad du har delat.
  • Organisationskunskap: Dina ramverk. Tidigare lärdomar. Vad "bra" ser ut som för ditt team.

Bildkälla: Optimizely

Optimizely Opal har nu inbyggd experimenteringskontext. Den känner till dina befintliga experiment, mätvärden, feature flags och programhistorik.

"Jag tycker att Opal har all kontext inom Optimizely, vilket verkligen är till hjälp. Den vet vad experimentet är. Vi kan faktiskt mata den med vår webbplats, och den kan generera riktigt bra idéer om vilka tester vi borde köra."

Anonym, Digital Personalization Manager, Globalt detaljhandelskonglomerat, kläder och accessoarer

Det innebär att idéerna den genererar inte är generiska – de bygger på vad du redan har bevisat. Testplanerna den skapar följer ditt format. Insikterna den lyfter fram kopplar till mönster i hela ditt program, inte bara enstaka resultat.

Lär dig principerna för att designa arbetsflödesagenter

Utan kontext får du generiska resultat som kräver omfattande redigering. Med kontext får du resultat förankrade i din verksamhet. Konsekventa genom hela ditt team. Förbättras i takt med att mer arbete flödar igenom.

Upplevelseoptimering bygger på sammankopplade steg.

Och det är därför vi på Optimizely grundar vår metodik i Human Centered Design. Vi började med att kartlägga verkliga experimenteringsprocesser, identifiera genuina friktionspunkter och designa lösningar som kompletterar, inte stör, befintliga arbetsflöden.

Sedan lanseringen i maj 2025 har nästan 900 företag antagit Optimizely Opal för att bädda in AI i sina marknadsföringsarbetsflöden. Bland de främsta användarna finns Diligent, Robinson Club, Elite Hotels of Sweden och Road Scholar, som tillsammans representerar över 2 miljarder dollar i årliga intäkter.

"Som ett enpersonsteam räknas varje timme. Optimizely Opal sparar mig inte bara tid – hon levererar värdefulla insikter inom minuter. Med våra ramverk ger hon idéer och rekommendationer som passar perfekt med våra experimenteringsmål."

Michael Ritchter, Manager Conversion Optimization & UX | E-Commerce, TUI Hotel brands

Varför detta fungerar

Experimentkontext finns nu i Optimizely Opal. Inte bara tidigare resultat. Aktiva tester.

Vad som körs. Vad som inte har avslutats. Du kan fråga:

"Vilka tester har inte avslutats än?"

"Bör vi pausa det här?"

"Ge mig testidéer för den här sidan."

Optimizely Opal visar det du vill se. Dessutom har systemet kostnad, värde och förtroende inbyggt från start.

1

Kostnad: AI beter sig som infrastruktur, inte mjukvara. Användningen skalar, kostnaderna skalar. Optimizely Opal är byggt för att leverera värde värt beräkningskraften, inte dra på sig tokens för uppgifter som inte gör skillnad.

2

Värde: Snabbhet, automatisering och färre fel ger inte alltid värde. Att lösa rätt problem gör det. Optimizely Opal-agenter är kopplade till verkliga flaskhalsar i arbetsflödet för din upplevelseoptimering, inte generiska användningsfall. Om det inte sparar tid eller förbättrar resultat, lanseras det inte.

3

Förtroende: Modeller hallucinerar. Agenter fattar beslut som är svåra att spåra. Förtroende är inte en inställning du slår på. Det är skyddsräcken, verifiering och mänskliga kontrollpunkter inbyggda i systemet. Du väljer din nivå av autonomi. Du styr vad som publiceras. AI hanterar arbetet som tar dig dit.

Därför har vi designat våra arbetsflödesagenter för att behålla kontrollen hos dig.

Modell Hur det fungerar Använd när
Agentassisterad Agenten stödjer, du styr Utforskning av nya testområden
Human-in-the-loop Agenten slutför steget, väntar på godkännande Strategiska beslut, varumärkeskritiska tester
Human-on-the-loop Agenten kör, du övervakar Etablerade testmönster
Full automatisering Agenten hanterar hela processen Låg risk, hög volym (t.ex. grundläggande personaliseringsregler)

 

50%

mer output genom att använda arbetsflödesagenter (Optimizely Opal AI-rapport)

Arbetsflödesagenter i praktiken

De flesta AI-verktyg sitter utanför ditt arbetsflöde. Kopiera. Klistra in. Prompta. Kopiera. Klistra in.

Optimizely-agenter arbetar inuti de verktyg du redan använder. De känner till dina tidigare tester. Din prestandadata. Dina ramverk. När de producerar något finns det redan där det ska vara.

1. Agent för experimentidéer

Kör fler tester utan att anställa fler.

Den här agenten bygger på mönster från 127 000+ experiment. Klistra in en URL, dela dina mål, få idéer grundade i vad som fungerat.

18%

fler tester skapade. 33% snabbare körtider.

0:00 / 0:00

Det finns också Idea Builder. Den lever inne i experimentuppsättningen. Inget separat verktyg. Ingen prompt att skriva. Den läser sidan du bygger på och hämtar från ditt programs historik på egen hand. Öppna uppsättningsskärmen, och idéerna finns redan där.

2. Personaliseringsagent

Identifiera personaliseringsmöjligheter med högt värde per segment.

Den här agenten analyserar beteendemönster. Visar vilka målgrupper som reagerar på vad. Identifierar var targeting faktiskt förändrar resultat.

3. Experimentplaneringsagent

Från hypotes till lanseringsfärdig plan på sekunder med planeringsagenten.

Målgrupper. Primära och sekundära mätvärden. Skyddsräcken. Körtid till statistisk signifikans. Det som brukade ta en timme av samordning mellan analytiker, PM och utvecklare.

19%

snabbare att starta experiment. 25% snabbare till statistisk signifikans.

4. Agent för variationsutveckling

Sluta vänta på utvecklare. Din idé ligger i backloggen. Intäkter förblir otestade. Klicka på elementet. Beskriv vad du vill ha. Se den skriva koden.

0:00 / 0:00

Ingen kö. Inget beroende. Ingen väntan på nästa sprint med agenten för variationsutveckling.

5. Agent för experimentgranskning

Fånga upp uppsättningsproblem innan du slösar trafik.

Redo att lansera. Är targetingen rätt? Är mätvärdena korrekt konfigurerade? Agenten granskar din uppsättning i realtid. Flaggar problem. Föreslår åtgärder.

0:00 / 0:00

6. Agent för resultatsammanfattning

Resultaten är inne. Experimentsammanfattningsagenten granskar dina mätvärden. Genererar en sammanfattning. Rekommenderar nästa steg: lansera, förläng eller prova något nytt.

Inga fler insikter som ligger i dashboards och väntar på att någon ska skriva ihop dem.

7. AI-utforskningsgenerator

Ställ en fråga på vanlig svenska. Få din dashboard. 

Ingen SQL. Ingen väntan på analytikern. Bara svaret med AI inom analys.

0:00 / 0:00

Avslutande kommentarer

AI förändrar redan hur kunder hittar dig. De team som vinner blir de som optimerar upplevelser för varje besökare som faktiskt landar.

Team som bäddar in AI genom hela livscykeln kör 78% fler experiment och ser 9% bättre vinstandel. De kör inte bara fler tester. De lär sig snabbare än alla andra.

Du kan fortsätta använda AI för enstaka uppgifter. Eller kontakta oss för en personlig demo för att:

1

Kartlägga ditt AI-arbetsflöde och hitta flaskhalsarna

2

Matcha agenter med de steg som stannar upp

3

Börja där AI-effekten är hög och insatsen är låg