對總體引數進行估計的方式多種多樣，為了評判估計量的優劣，我們需要借助一些評選標準，

這些亂七八糟的符號

　　我覺得引數估計總是人為地設計各種門坎，里面參雜著各種符號，一會兒是X，一會兒是x；一會兒是θ，一會兒是θ(X)；還有諸如“總體引數”、“待估計引數”這類名詞，究竟是幾個意思？

　　有必要先理清這些符號，

　　我們用全國18~50歲的男性身高為例，所有18~50歲的男性是總體，在概率統計中，當我們說到總體，就是指一個具有特定概率分布的隨機變數，這個隨機變數用X表示，X符合某某分布，n表示總體的數量，假設這些男性有3億，那么n就等于3億，在做統計的時候肯定不能普查所有人，這樣成本也太高了，因此才有抽樣，當然抽樣也有多種形式，比如均勻抽樣、拒絕抽樣等，這是另外的話題，在資料分析專欄中將陸續展開，

　　現在調查了100萬個符合條件的男性，這些男性就構成了“整體中的一個樣本”，用X₁, X₂, …, X_m表示，X_i表示樣本中的第i個男性，m是樣本的容量，m等于100萬，樣本中的每個男性都有特定的身高，是一個具體的數值，這個值用小寫的x表示，x₁₀ = 176cm表示樣本中的第10個資料的值是176cm，此時X₁₀= x-₁₀，這有點類似于P(X=x)的意思，X表示隨機變數本身，x表示某個特定的數值，

　　值得注意的是，如果用X₁, X₂, …, X_m表示樣本，則強調樣本是隨機的，是理論上的、尚未誕生的樣本，樣本中的每個資料都是一個隨機變數；如果用x₁, x₂, …, x_m表示樣本，則強調樣本中的隨機變數已經有了特定的取值，是已經擁有的樣本，

　　此外，n的值不一定很大，如果調查某個特定班級的平均身高，那么n的值就只是這個班級的學生數，比如n=60，n也不一定是個確定的值，比如從建國到現在全國人民一共消費了多少斤啤酒，沒有具體的數，只知道這個數大到沒邊，

　　現在我們知道18~50歲的男性身高符合某個均值為μ，方差為σ²的正態分布X~N(μ, σ²)，μ和σ²稱為“總體的引數”，正是這兩個值決定了分布的具體形態，用大Θ表示總體引數的集合，總體引數不止一個，這里的μ和σ²都是總體的引數，θ是總體中的某一個引數，它可以代表μ，也可以代表σ²，有點變數的意思，可能用x比用θ更好理解，但是x已經被占用了，此外，用表示樣本的均值，用S²表示樣本的方差，

　　現在θ的具體值是多少不知道，需要根據樣本X₁, X₂, …, X_m估計總體引數θ，具體估計量用表示，表示是由具體的樣本X₁, X₂, …, X_m估計出來的，僅僅是為了強調這一點，至于怎么估計是另一回事，這也有點類似于y = y(x)，第一個y是個具體的數值，這個數值是由x決定的，第二個y是一個映射關系，至于是什么映射關系是另一回事，有時候也把m個樣本記作X = {X₁, X₂, …, X_m}，因此有了，如果用θ表示μ，就有了，這里的X不再是總體，而是來自于總體中的樣本，至于X到底是總體還是樣本，需要根據背景關系確定，

多個引數產生的問題

　　已知總體的均值是μ，方差是σ²>0，但是不知道二者的具體數值，作為補償，我們擁有總體中m個資料樣本，X₁, X₂, ……,X_m，現在想要通過這些樣本估計總體的概率分布模型，即通過樣本估計μ和σ²的具體數值，

　　已知總體有期望和方差兩個數字特征，但不知道具體值，這比直接說啥也不知道強不了多少，

　　假設我們已經使用直方圖之類的工具分析過樣本，或直接咨詢過領域內的相關專家，得知總體應當符合正態分布，X~N(μ, σ²)，現在我們可以用多種方法估計μ和σ²？

　　點估計和連續性修正（概率統計17）中的介紹，樣本矩的估計量是：

　　一維正態分布的最大似然估計（概率11）中，最大似然估計也能得到類似的結論：

　　當m很大時，1/m和1/(m-1)的差距也很小，可以認為矩估計和最大似然估計的結論相等，我們能否因此得出一個結論，說兩種估計法在任何分布下得到的結論都相同？

　　還是估計總體的均值和方差，這次從樣本的分析中得知，總體可能符合X~[a, b]的均勻分布，

　　在再看大數定律（概率統計18）.中我們已經知道均勻分布的密度函式，從而求得均勻分布的均值和方差：

　　使用矩估計求得樣本的均值和方差時，我們將認為樣本矩等于總體矩，從而得到一個關于a和b的方程組，進而求得a和b的矩估計量：

　　這里也可以看出，矩估計的優點就是簡單，不管總體服從什么分布，樣本矩的計算方法都一樣，

　　現在來看均勻分布下樣本的最大似然估計，

　　用x_min和x_max表示樣本值中最小的和最大的，對于X~[a, b]來說，所有樣本的取值都在a,b之間，即x_min ≥ a，x_max ≤ b，似然函式是：

　　之后的目標是根據樣本找到L(x;a,b)最大時a,b的取值：

　　這個結果和矩估計明顯不同，

　　現在的問題是，我們分不出這兩個估計量的優劣，這就是我們要面對的新問題，

　　我們用和表示兩種方案的估計量，對于不同的估計量，與真實值的差誤差也不同，無法僅憑一個數值來評估估計量，而是使用一條曲線：

　　對于某些估計而言，對于另外一些則可能相反，這就好比兩個人的考試成績，甲的語文成績比較好，而乙的數學成績更優秀，能否找出一個全優的學生呢？也就是對于整體中的全部引數，我們都希望估得最佳結果，以使得根據樣本估計的分布接近整體分布，這是個美好的愿望，隨著待估計引數的增加，找到全優學生的難度也急劇增大，因此為了找出最優估計量，我們必須添加一些額外的評判規則，這就涉及到如何評估估計量的問題，較為常用的三個標準是無偏性、有效性和相合性，

無偏性

　　X₁, X₂, …, X_m-是來自于總體中的樣本，θ是總體分布的引數，θ∈Θ，根據樣本可以得到θ的估計量：

　　如果的數學期望存在，且：

　　如果對于整體中的任意θ，上式都成立，則稱是θ的無偏估計量，

　　這到底是啥意思？引數為什么能有期望？

無偏性的數學解釋

　　首先需要回顧第一節的內容，清楚地了解這些符號的真正含義，

　　設總體X的均值為μ，方差是σ²>0，它們都是整體分布的引數，且都是待估計的未知引數，既然μ和σ²都是和總體分布有關的引數，它們自然都可以用θ表示，作為估計量的也就代表了，在這個例子中，“是θ的無偏估計”意味著：

　　如果使用矩估計，則根據再看大數定律（概率統計18）中的內容，樣本均值的期望與方差是：

　　這表明樣本均值是整體均值的無偏估計，

　　樣本的方差是：

　　這里之所以用X_i而不是x_i，是為了強調樣本的隨機性，可以簡單地理解為計劃抽取一個隨機樣本，但還沒有真正開始抽取，

　　現在看看E[S²]是多少，

　　根據方差的性質：

　　對于樣本中的任意一個隨機變數來說，方差和期望都相等：

　　此外：

　　最終：

　　上面的結論表明，樣本方差S²也是總體方差的無偏估計，這也附帶說明了樣本方差的系數是1/(m-1)的原因，如果取1/m，則估計量無法確保無偏性，

　　從這個例子中也看出，無論總體符合什么分布，樣本均值都是整體均值的無偏估計，樣本方差也都是總體方差的無偏估計，

無偏性的意義

　　樣本X₁, X₂, …, X_m-是隨機的，因此根據這些樣本得出的估計量也是隨機的，我們已經多次重申過這一點，既然是隨機的，那么一個自然的結論是：根據樣本的不同，有些估計量可能偏大，有些可能偏小，反復將這一估計量使用多次，就“平均”來說其偏差為零，

　　在科學技術中稱為以作為θ估計的系統誤差，無偏估計的實際意義就是無系統誤差，

　　既然如此，是否意味著無偏估計一定好呢？通常來講是的，但也不盡然，比如下圖中，有偏的甲明顯更優于無偏的乙，

不同的無偏估計量

　　設總體X服從指數分布，概率密度為：

　　其中引數θ未知，X₁, X₂, …, X_m-是來自X的樣本，根據指數分布的性質：

　　因此樣本均值是引數θ的無偏估計量，

　　然而估計量不止一種，下面的mZ也是θ的無偏估計量：

　　Z具有概率密度：

　　可見一個未知引數可能有不同的無偏估計量，

有效性

　　同一個引數為什么會出現不同的無偏估計量呢？我們可以想象一個場景：任何人都可以估計明天的天氣，至于是否準確另當別論，同樣是估計天氣，氣象局的天氣預報顯然更準確，但就無偏性來說，普通人和天氣預報的平均偏差都為0，這就好比甲乙二人的射擊比賽，甲的成績明顯高于乙，但無偏性卻告訴我們二者的成績相同，這顯然是荒謬的：

　　對于上圖來說，誰的成績越接近靶心，誰的成績就越好，這也正是有效性的基本邏輯，對于引數θ的兩個無偏估計量，誰和θ更靠近，誰就越好，一種自然的方式是比較不同的無偏估計量與θ之差的絕對值，但是絕對值不易處理，于是使用平方誤差法，這也是一種常用的較為簡便的方式，如果對于整體中的任意θ，都有：

　　則稱比有效，

　　再次強調的是，都是隨機值，因此才通過期望來去掉隨機性，進而比較二者誰更有效：

　　另一個值得關注的問題是，有效性還強調了對于任意θ∈Θ都成立，如果總體引數θ中包含兩個待估計變數，只有當方案1的兩個估計量全部優于方案2時，才能說方案1比方案2更有效，

　　對于上節的指數分布來說：

　　因此比mZ更有效，

相合性

　　簡單而言，如果當樣本的容量增大時，估計量逐漸收斂于待估計引數的真實值，那么稱是θ的相合估計量，

　　相合性是對一個估計量的基本要求，如果估計量不具有相合性，那么無論樣本的容量有多大，都無法將引數估計得足夠準確，這種估計已經有點近似于胡亂猜測，

優化的策略

　　有了評選標準之后，我們就可以使用一些優化策略，找出最優估計量，

　　無偏性為估計量加上了限制，有了這條限制，大多數不太好的估計量會被排除，經過無偏性的篩選后，再使用有效性求得的最優解稱為最小方差無偏估計量（uniformly minimum variance unbiased estimate，UMVUE），

　　盡管我們可以通過減少候選項的方式找出最優解，但需要認清的事實是，找到任何情況下都適用的全能最優解絕非易事，既然如此，不妨改變策略，榷訓最優解的定義，只要滿足相合性和漸進有效性，就認為這個解是可以接受的，

　　漸進有效性：當樣本容量n→∞時，收斂于理論邊界，

　　最大似然估計就是這種策略下最常用的方案，

　　在最小方差無偏估計中，我們實際上是想找到總分最優的估計量，但這種方法假設所有引數都是平等的，并沒有為引數分配恰當的權重，貝葉斯估計采用了另一種思路應對這個問題，

　　無論最小方差無偏估計還是最大似然估計，我們都認為待估計引數θ是個確定的值，比如1949年10月1日中華人民共和國成立，這是一個明確的日期，而在貝葉斯估計中，把θ也看作一個變數，所求的是θ的分布，也就是后驗分布，如果后驗分布較窄，則可信度較高，否則可信度較低，這類似于估計1949年10月1日中華人民共和國成立的概率是多少，貝葉斯估計的難點在于后驗概率的計算較為復雜，關于更多先驗和后驗的問題將在后續章節陸續展開，

　　出處：微信公眾號 "我是8位的"

　　本文以學習、研究和分享為主，如需轉載，請聯系本人，標明作者和出處，非商業用途！

　　掃描二維碼關注作者公眾號“我是8位的”

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/21155.html

標籤：其他

上一篇：８．李さんは日本語で手紙を書きます

下一篇：Python股票量化選股操作不好用完結

概率統計20——估計量的評選標準