主頁 >  其他 > 從不均勻性角度淺析AB實驗

從不均勻性角度淺析AB實驗

2023-04-28 15:26:25 其他

作者:京東零售 路衛強

本篇的目的是從三個不均勻性的角度,對AB實驗進行一個認知的普及,最終著重講述AB實驗的一個普遍的問題,即實驗準確度問題,

一、AB實驗場景

在首頁中,我們是用紅色基調還是綠色基調,是采用門店小串列外+商品feed(左圖),還是采用門店大串列囊括商品feed(右圖),哪種更吸參考戶瀏覽下單呢,簡單來處理讓50%的用戶看到左圖效果,讓50%的用戶看到右圖效果,最終通過點擊量,單量等指標進行比對得出結論,這是典型的AB實驗場景

二、AB實驗的定義

A/B實驗就是針對想迭代的產品功能,提供兩種不同的備選解決方案,然后讓一部分用戶使用方案A,另一部分用戶使用方案B,最終通過實驗資料對比來確定最優方案,

從定義里我們就可以看出來,最直觀的一個概念,就是用戶的分流,此時就涉及到分流人數是否均勻的問題,即人數比例的均勻性,

三、AB中的三個不均勻

1、人數比例的不均勻

目前AB實驗的分流核心演算法是通過的哈希演算法,假設我們按用戶名做為分流因子,使用murmurhash演算法,以100桶制為例,確定一個人的位置的演算法就是

//將用戶名通過hash演算法計算出一個整數
int hashNum = MurmurHash3.murmurhash3_x86_32(useName)
//整數值對100取模
int bucket = hashNum % 100;

當我們定義一個實驗兩個策略的人數均為50%時,那么

bucket為0-49的用戶由AB系統標記為A,業務系統根據A標記,使得用戶使用方案A

bucket為50-99的用戶由AB系統標記為B,業務系統根據B標記,使得用戶使用方案B,

可是我們都知道哈希演算法并不是絕對均勻的,當100人時,基本上不會出現有50個人走A,50個人走B,但是1萬個人的時候,兩部分流量可能就接近了1:1,10萬人的時候可能更接近1:1,

之前有位運營的同學問過,為什么不能用一種很均勻的演算法,比如第一個人來了,放入A,第二個人來了放入B,第三個人來了放入A,第四個人來了放入B....,這樣一天1W個人來,5000個取A策略,5000個取B策略,

假設我們真的這么做了,第一天是OK的,第二天進A只來了4000人,這樣還是不均勻的,如果你第二天仍然按第一天的規則重新分配,這樣會有一部分人亂了策略,不符合我們固定人群走固定策略的實驗目的,

所以說這個不均勻是無解的,HASH演算法是目前最理想的解決方案,前提是你需要一定的流量,流量越大,分流相對就比較準確,

2、人群素質的不均勻

我們假設流量足夠大,人數比例很均勻了,但是還有個問題就是人群素質的均勻問題,這里的素質包括消費能力,活躍度,年齡等各種人群因素,

假設現在我們的活動統一采用的A策略(現狀),我們想驗證一下B策略(新策略)會不會帶來客單價的提升,就直接做了AB實驗,還按1:1比例來分流,發現使用A方案的人群客單價是100,使用客單價B的人群是96,此時我們能認為原有A方案優于B方案嗎?其實是不能的,怎樣確定這種人群素質的差異呢,可以采用AA實驗,就是兩部分人都走A,進行分開統計,可能會發現,位于0-49桶的人群本身客單價就是100,而位于50-99桶的人群可能只有94,這么看來B方案是能提升客單價的,因為位于50-99桶的人群本身指標就差一些,

當然AA不是必須的,可能你有整體的客單價指標,上了B策略后發現整體提升了,這種情況相當于灰度驗證了,但實際情況是比較復雜的,整體指標你是不清楚的(因為這里的整體可能只是你取的業務中的一部分流量),

所以解決素質不均勻的手段就是采用AA提前確定差異性,再在這個差異性基礎上看差異的變化,

3、實驗間影響的不均勻

這個不均勻性是最復雜的,一般做實驗我們走兩種極端:

第一種是完全不復用人群,每個實驗人群都是獨立的,這樣的話效果比較準確,但是弊端是,當所有流量都被用去后,不能有新實驗開始,必須等待有結束的實驗后才能繼續做,

第二種,所有實驗都用全部流量,此時我們認為實驗雖然互相之間有影響,但是這種影響是正交的,量大的時候應該是均勻的,如下圖所示,P實驗的兩個策略人群,到Q實驗時,對Q的兩個策略影響是均勻的,

這種可以滿足無限個實驗,想做多少實驗都可以,但弊端是,實驗太多,必然有影響不均勻的,且我們無法消除這種不均勻,

所以我們想能不能結合以上兩種情況來處理呢,結合google的Overlapping Experiment Infrastructure文章我們設計出分層的實驗管理模型

首先我們將總流量分成兩部分,正交域,垂直域(含對比區)

我們假設如圖取80%的流量用做正交閾,20%用作垂直域,垂直域中有5%用做對比區,

上圖正交域下4個層,層內實驗流量互斥,層間實驗流量正交,我們將可能會互相影響的實驗放到同一層內進行流量互斥,而影響不大的實驗可以放到不同層內,

垂直域中的實驗流量只能互斥,且不與任何實驗正交,可以理解用最純正的流量做實驗,可以I1和I2兩個策略間對比,也可以I1或I2和對比域(現狀)比對,

那此時有一個很重要的問題需要解決,我們怎么確定哪些實驗互相影響較大,需要放到同一層下,

有一些簡單標準,比如入口不一樣,目標不一樣等等,這種可以放到不同層,我們可以忽略正交不均勻的問題,反之就不行,

比如活動頁劵對單量提升度的實驗和會員頁面入會效果的實驗,就可以放到不同層,

而首頁上滿級訓動實驗對客單價提升的實驗和同樣首頁買贈活動對客單價提升的實驗,最好是不共用用戶,放到同層比較合適,

但對于很多實驗是不太容易通過簡單規則來確定的,需要大資料的同學和產品,甚至研發來共同決定實驗放到哪些層和哪些實驗互斥,這確實在實際的運作中是最難的點,

總之采用這種策略,可以復用流量的同時還可以降低不必要的互相影響,比較綜合考慮了流量和準確度問題,

四、總結

現在我們對以上問題進行總結,從問題到解決方案上來認識ab實驗

1、人群做不到絕對的均勻,只能通過HASH演算法,結合一定的流量來解決,

2、通過AA實驗,來提前確定人群素質的不均勻,最終的實驗資料結合AA實驗資料來確定最終效果,

3、設計出正交垂直域,正交閾內多個層,每個層內放可能相互影響的實驗,層內互斥,層間正交,保留垂直域,為要求精準的實驗留出流量,來解決實驗間相互影響的問題,

本篇從核心分流與實驗間相互影響角度講解ab實驗,希望能引起大家在做實驗前能有更多的思考,來更準確的驗證自己想要的效果,希望大家有興趣的可以留言討論,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/551439.html

標籤:其他

上一篇:安裝Amos結構方程模型分析軟體的方法

下一篇:返回列表

標籤雲
其他(158271) Python(38108) JavaScript(25396) Java(18011) C(15221) 區塊鏈(8260) C#(7972) AI(7469) 爪哇(7425) MySQL(7152) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5870) 数组(5741) R(5409) Linux(5334) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4565) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2432) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1964) Web開發(1951) HtmlCss(1928) python-3.x(1918) 弹簧靴(1913) C++(1912) xml(1889) PostgreSQL(1874) .NETCore(1857) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 從不均勻性角度淺析AB實驗

    本篇的目的是從三個不均勻性的角度,對AB實驗進行一個認知的普及,最終著重講述AB實驗的一個普遍的問題,即實驗準確度問題。 ......

    uj5u.com 2023-04-28 15:26:25 more
  • 安裝Amos結構方程模型分析軟體的方法

    本文介紹IBM SPSS Amos軟體的安裝方法。 Amos是IBM公司旗下一款強大的結構方程建模軟體。其捆綁在高級版的SPSS Statistics軟體中,但其它版本的SPSS Statistics中并不含Amos,需要單獨下載、安裝。 1 軟體下載 關于Amos軟體下載,由于其版本較多,大家自行 ......

    uj5u.com 2023-04-28 15:12:31 more
  • Docker獲取Let`s Encrypt SSL 證書

    文中的操作都是在CentOS Stream release 9下執行的,使用的是root用戶。 1. 安裝docker # 卸載原有的docker yum remove docker docker-client docker-client-latest docker-common docker-la ......

    uj5u.com 2023-04-28 15:01:39 more
  • 【Docker】鏡像制作和管理

    一、Docker鏡像說明 二、基于容器通過 docker commit 手動制作鏡像 1、基于容器手動制作鏡像步驟 1、下載官方系統鏡像 2、基于官方基礎鏡像啟動容器,并進入容器 3、在容器中進行配置操作 3.1、安裝基礎工具 3.2、配置運行環境 3.3、安裝并配置服務 3.4、存放業務程式代碼 ......

    uj5u.com 2023-04-28 10:33:47 more
  • Fastjson反序列化漏洞

    Fastjson反序列化漏洞 一、Fastjson介紹 1、什么是fastjson? fastjson是阿里巴巴的開源JSON決議庫,它可以決議JSON格式的字串,支持將JavaBean序列化為JSON字串,也可以從JSON字串反序列化到JavaBean。 2、fastjson的優點 速度快 ......

    uj5u.com 2023-04-28 10:33:25 more
  • Mac M1(arm 系列芯片)如何安裝 Chromium | Puppeteer

    最近寫個腳本用到 puppeteer,然后安裝 Chromium 出現一點問題,這里記錄一下解決方案。 Puppeteer 自動安裝失敗 在 Puppeteer 安裝時會自動安裝 Chromium,然而卻總是報錯 502 導致下載失敗,直接下載可以下載,命令列 wget 也可以,猜測是因為 Pupp ......

    uj5u.com 2023-04-28 10:31:43 more
  • 2022年,軟體測驗還能學嗎?別學了,軟體測驗崗位飽和了...

    8年前,我懵懂的選擇了軟體測驗這個行業,窮困潦倒的時候,爸媽給我付了2萬塊錢進入了一家培訓機構,我懷著感激和破釜沉舟的情緒開始學習軟體測驗。3個月的學習時間,住群租宿舍,吃盒飯,平時上課認真聽講,周末就跑自習室。在學了基礎課程之后,找作業的時候以比較優秀的成績通過了各種面試。那時候的軟體測驗要求很低... ......

    uj5u.com 2023-04-28 10:22:51 more
  • Selenium自動化測驗面試題

    1、什么是自動化測驗、自動化測驗的優勢是什么?
    2、什么樣的專案比較適合做自動化測驗,什么樣的不適合做自動化測驗?
    3、說一下開展自動化作業的主要流程是怎樣的?
    4、在制定自動化測驗計劃的時候一般要考慮哪些點?
    5、撰寫自動化腳本時的一些規范?
    6、你一般一天能撰寫多少個自動化腳本?
    7、做自動化測... ......

    uj5u.com 2023-04-28 10:16:37 more
  • 【動手學深度學習】第五章筆記:層與塊、引數管理、自定義層、讀寫

    為了更好的閱讀體驗,請點擊這里 由于本章內容比較少且以后很顯然會經常回來翻,因此會寫得比較詳細。 5.1 層和塊 事實證明,研究討論“比單個層大”但“比整個模型小”的組件更有價值。例如,在計算機視覺中廣泛流行的ResNet-152 架構就有數百層,這些層是由層組(groups of layers)的 ......

    uj5u.com 2023-04-28 10:16:11 more
  • Langchain框架 prompt injection注入

    Langchain框架 prompt injection注入 Prompt Injection 是一種攻擊技術,黑客或惡意攻擊者操縱 AI 模型的輸入值,以誘導模型回傳非預期的結果 Langchain框架 LangChain 是一個基于大語言模型進行應用開發的框架。 所謂大語言模型(Large La ......

    uj5u.com 2023-04-28 10:15:57 more