一圖講清因果推斷方法論，無法 AB 測驗時分析的萬能鑰匙-有解無憂

1. 背景

在產品快速迭代的程序中，資料分析師需要量化評估不同的市場營銷活動和產品迭代等事件實際影響業務指標的效果，探索產品和業務的因果關系，并從結果中學習來不斷驗證產品迭代方向，使其業務走向更加清晰，

但產品本身有自然增長趨勢，且具有較明顯的季節性、周期性波動，如何排除這類自然因素和其他干擾因素對產品的影響大小，互聯網行業通用方法為 AB 測驗；但對于某些指標的流量無法滿足或部分場景無法實作 AB 測驗時，統計學上的“因果推斷”方法正成為互聯網業務評估應用的新方向，通常用于行為科學研究中，以了解從觀察資料結果中的業務因果關系，

2. 效果量化評估方法

效果量化評估有兩個通用的研究設計方向：

一是 AB 測驗，在實驗研究中將用戶隨機分配到不同的實驗組和控制組中，然后計算達到實驗效果所需的樣本量，實驗滿足樣本量時計算實驗結果，因為隨機性控制了其他干擾變數的影響，所以實驗結果就是該實驗因子對結果變數的真實影響大小，

二是觀察研究，統計相關性并不意味著因果關系，甚至因果關系也無法直接倒推相關性成立，所以想找到真正影響到業務的因素并不容易，通用的 A/B Test 也有一定的局限性，需要占用足量的隨機流量，并且需要持續一段時間以收集資料，產品流量較小時，需要花一定的時間實作，比較耗費人力；鑒于 A/BTest 種種局限性，如何利用手邊已有的歷史資料進行 “因果推斷”分析，

3. 因果推斷方法和適用場景

觀察研究中的因果推斷利用的反事實理論就是和我們能夠觀測到的現實情況相反的一種狀態（Rubin 1980），因果推理（Causal inference）是根據影響發生的條件得出因果關系結論的程序，是研究如何更加科學地識別變數間的因果關系（Causality），在因果關系中，原因對結果負有部分責任，而結果又部分取決于原因，客觀事物普遍存在著內在的因果聯系，人們只有弄清事物發展變化的前因后果，才能全面地、本質地認識事物，基干事物發展的這種規律，在論證觀點時，有時就可以直接從事物本身的因果關系中進行推論，這就叫因果推理法，幾十年來，因果推理一直是統計學、計算機科學、教育學、公共政策和經濟學等許多領域的重要研究課題，總體而言，因果推論的見解可以幫助識別用戶痛點，為產品迭代提供方向，并提供更個性化的用戶體驗，

下圖匯總了目前解決各個分析場景的方法論框架：

這里介紹幾種方法的適用場景，雙重差分分析方法，推斷在進行干預前后實驗組與對照組之間的結果差異，方法的典型用例是在特定城市推廣營銷活動或新產品功能，比較推廣城市和未推廣城市在同一時間段上的結果差距，那么這個差距值即為該事件的真實效果，

另一種非常典型的因果推斷方法，稱為斷點回歸方法，該方法將一連續值進行分段，查看在斷點處是否有結果變數上的差異，例如研究定價的不同水平如何影響用戶購買決策，

傾向得分匹配法，產品經理在會上展示新加了某功能后的用戶復購資料，其中使用新功能的用戶群復購率比未使用的用戶群高20%，于是認為該功能提高了用戶復購率，想在產品上全面推廣該功能，作為資料分析師如何去評估分析該效果？資料主要包括三方面：用戶的特征變數、是否使用功能，是否發生復購，按照1:1的匹配比例，最終匹配上1116對用戶資料，其中處理組中的用戶復購率為24%，對照組為13%，兩組的差距顯著，因此從資料角度證明該功能確實能提高復購率，但是歸因為功能提高的復購率應該為11%，而不是20%，

匹配數量	1116
處理組（使用功能）復購率	0.24
對照組（未使用功能）復購率	0.13
均值差異	0.11***

再比如合成控制法和貝葉斯結構時間序列方法，原理在于干預事件發生前后結果變數時間序列資料是否有顯著變化，這種方法稱為中斷時間序列設計，這種方法通常用在產品復盤時指標分析，

目前關于因果推斷業務應用相關原創文章：

資料運營36計(二)：如何用合成控制法判斷策略實施效果

資料分析36計(七)：營銷增益模型(uplift model)如何識別營銷敏感用戶群，Python實作

資料運營36計(八)：斷點回歸(RDD)評估產品設計效果
資料分析36計(九)：傾向得分匹配法(PSM)量化評估效果分析
資料分析36計(12)：做不了AB測驗，如何量化評估營銷、產品改版等對業務的效果

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/221299.html

標籤：其他

上一篇：表面模糊濾鏡

下一篇：python 檔案路徑相關的函式