1 導引

在上一篇博客《圖資料挖掘：網路中的級聯行為》中介紹了用基于決策的模型來對級聯行為進行建模，該模型是基于效用(Utility)的且是是確定性的，主要關注于單個節點如何根據其鄰居的情況來做決策，需要大量和資料相關的先驗資訊，這篇博客就讓我們來介紹基于概率的傳播模型，這種模型基于對資料的觀測來構建，不過不能對因果性進行建模，

2 基于隨機樹的流行病模型

接下來我們介紹一種基于隨機樹的傳染病模型，它是分支程序（branching processes）的一種變種，在這種模型中，一個病人可能接觸\(d\)個其他人，對他們中的每一個都有概率\(q>0\)將其傳染，如下圖所示：

接下來我們來看當\(d\)和\(q\)取何值時，流行病最侄訓消失（die out），也即滿足

\[\lim _{h \rightarrow \infty} p_h=0 \]

這里\(p_h\)為在深度\(h\)處存在感染節點的概率（是關于\(q\)和\(d\)的函式），如果流行病會永遠流行下去，則上述極限應該\(>0\)，

\(p_h\)滿足遞回式：

\[p_h=1-\left(1-q \cdot p_{h-1}\right)^d \]

這里\(\left(1-q \cdot p_{h-1}\right)^d\)表示在距離根節點\(h\)深度處沒有感染節點的概率，

接下來我們通過對函式

\[f(x)=1-(1-q \cdot x)^d \]

進行迭代來得到\(\lim _{h \rightarrow \infty} p_h\)，我們從根節點\(x=1\)(因為\(p_1=1\))開始，依次迭代得到\(x_1=f(1), x_2=f(x_1),x_3=f(x_2)\)，事實上，該迭代最侄訓收斂到不動點\(f(x)=x\)，如下圖所示：

這里\(x\)是在深度\(h-1\)處存在感染節點的概率，\(f(x)\)是在深度為\(h\)處存在感染節點的概率，\(q\)為感染概率，\(d\)為節點的度，
如果我們想要傳染病最終消失，那么迭代\(f(x)\)的結果必須要趨向于\(0\)，也即不動點需要為0，而這也就意味著\(f(x)\)必須要在\(y=x\)下方，如下所示：

如何控制\(f(x)\)必須要在\(y=x\)下方呢？我們先來分析下\(f(x)\)的影像形狀，我們有以下結論：

\(f(x)\)是單調的：對\(0 \leq x, q \leq 1, d>1\)，\(f'(x)=q \cdot d(1-q x)^{d-1}>0\)，故\(f(x)\)是單調的，

\(f'(x)\)是非增的：\(f'(x)=q \cdot d(1-q x)^{d-1}\)會著\(x\)減小而減小，

而\(f(x)\)低于\(y=x\)，則需要滿足

\[f'(0)=q\cdot d<1 \]

綜上所述，我們有結論：

\[\lim _{h \rightarrow \infty} p_h=0 \text { when } q \cdot d<\mathbf{1} \]

這里\(R_0=q\cdot d\)表示每個被感染的個體在期望意義上所產生的新的病體數，我們將其稱為基本再生數（reproductive number），它決定了傳染病病是否會流行：

若\(R_0\geq 1\): 流行病永遠不會消失且感染人數會以指數速度上升，
若\(R_0\leq 1\): 流行病會以指數速度快速消失，

3 SIR與SIS流行病模型

3.1 模型范式

在病毒的傳播中，有兩個最基本的引數：

出生率\(\beta\) 被已感染鄰居攻擊的概率
死亡率\(\delta\) 已感染節點治愈的概率

網路中的節點可以在以下四個狀態（S+E+I+R）之間做轉移：

易感期(susceptible)：節點患病之前，處于容易被鄰居傳染的時期，也稱敏感期，
潛伏期(exposed)：節點已被感染，但是還沒具備能力去傳染別人，
傳染期(infectious)：節點已被感染，且能夠以一定的概率把疾病傳染給那些處于易感期的鄰居，也稱感染期，
移除期(removed)：當一個節點經歷了完整的傳染期，就不再被考慮了，因為它不會再受感染，也不會對其它節點構成威脅，也稱隔離期，

狀態轉移圖如下圖所示（圖中的\(Z\)表示人工免疫）：

其中狀態轉移的概率由我們前面提到的模型引數\(\beta\)和\(\delta\)控制，

3.2 SIR模型

在SIR模型中，節點經歷S-I-R三個階段：
遷移學習和多任務學習之間的區別
事實上，該模型可用于對水痘和鼠疫的建模，也即一旦我治愈了，那我就永遠不會再被感染了，

假設模型滿足完美混合（即網路是完全圖），則模型的動力方程為：

\[\begin{aligned} &\frac{d S}{d t}=-\beta S I \\ &\frac{d R}{d t}=\delta I \\ &\frac{d I}{d t}=\beta S I-\delta I \end{aligned} \]

處于\(S\)、\(I\)、\(R\)狀態的節點數量隨著時間變化曲線如下圖所示：
遷移學習和多任務學習之間的區別

3.3 SIS模型

SIS模型中節點只有S-I兩個階段，它假設已經治愈的節點會立即變為易感節點，節點的狀態轉移圖如下：

這里我們把\(s=\frac{\beta}{\delta}\)定義為病毒的“力量”（strength），

該模型可用于對流感的建模，也即已被感染的節點經過治愈后會重新回到易感狀態，

同樣我們假設模型滿足完美混合（即網路是完全圖），則模型的動力方程為：

\[\begin{aligned} &\frac{d S}{d t}=-\beta S I+\delta I \\ &\frac{d I}{d t}=\beta S I-\delta I \end{aligned} \]

處于\(S\)、\(I\)狀態的節點數量隨著時間變化曲線如下圖所示：
遷移學習和多任務學習之間的區別

3.4 傳染閾值

接下來我們考慮SIS模型中的傳染閾值(epidemic threshold)\(\tau\)，對于\(SIS\)模型而言，流行閾值可以是任意的，

我們設圖\(G\)的傳染閾值為\(\tau\)，如果病毒的“力量”\(s=\frac{\beta}{\delta} < \tau\)（這里\(\beta\)指病毒的死亡率，\(\delta\)指病毒的出生率），則疾病的流行就不會發生（它最侄訓消失），事實上，圖\(G\)的傳染閾值\(\tau\)可以表示為

\[\tau=\frac{1}{\lambda_{1, A}} \]

這里\(\lambda_{1, A}\)為圖\(G\)的鄰接矩陣最大的特征值，這個定理看起來非常神奇，因為我們只用\(\lambda_{1,A}\)就捕捉到了整個圖的屬性！

以下是在AS圖上，當\(s\)大于、小于或等于傳染閾值\(\tau\)時的感染節點數量隨時間變化圖：

如果我們再考慮不同的初始感染人數，則會得到以下的感染人數變化影像：

3.5 一個埃博拉的例子

在一個埃博拉的例子^[1]中，設定如下的轉換狀態：
遷移學習和多任務學習之間的區別

當設定\(R_0=1.5\text{-}2.0\)時，總死亡人數隨時間變化如下：

參考

[1] Gomes M F C, y Piontti A P, Rossi L, et al. Assessing the international spreading risk associated with the 2014 West African Ebola outbreak[J]. PLoS currents, 2014, 6.
[2] http://web.stanford.edu/class/cs224w/
[3] Easley D, Kleinberg J. Networks, crowds, and markets: Reasoning about a highly connected world[M]. Cambridge university press, 2010.
[4] Barabási A L. Network science[J]. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 2013, 371(1987): 20120375.

數學是符號的藝術，音樂是上界的語言，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/527855.html

標籤：其他

上一篇：全球名校AI課程庫（37）| 科羅拉多大學 · 應用深度學習(全知識點覆寫)課程『Applied Deep Learning』

下一篇：前綴和與差分prefix_sum and difference

圖資料挖掘：基于概率的流行病模型