概率統計23——假設檢驗理論（2）-有解無憂

假設檢驗實際上是用反證法做出非對即錯的判斷：先假定原假設是對的，然后將抽樣資料代入相應的分布中去驗證，觀察原假設的數值是落在接受域還是拒絕域，由此做出是接受還是拒絕原假設的判斷，

值得注意的是，不同于以往嚴格的數學證明，假設檢驗是建立在小概率事件原理的基礎之上，由于小概率事件也有可能發生，因此并不能百分之百確定原假設一定不成立，也就是說，原假設也有判斷錯誤的時候，

兩種錯誤型別

假設檢驗有兩種判斷錯誤的型別，統計學家給出了專業的名稱：第一類錯誤和第二類錯誤，

第一類錯誤（false reject）：錯誤地拒絕，H₀是對的，卻拒絕了它，也就是說，計算結果落在拒絕域，但真實結果是在接受域，

第二類錯誤（false accept）：錯誤地接受，H₀是錯的，卻接受了它，也就是說，計算結果落在接受域，但真實結果是在拒絕域，

第一類錯誤也叫Ⅰ 型錯誤或棄真錯誤，第二類錯誤也叫Ⅱ 型錯誤或存偽錯誤，我覺得還是忘記這些文縐縐名稱，記住false reject和false accept即可，畢竟這兩個英文短語更直白，更容易理解，

假設檢驗的理想情況是能過做出與實際相符的正確斷言，但由于抽樣資料的隨機性，根據樣本計算的統計量必然會與整體的真實數值存在差異，這種差異可能導致出現四種判斷結果：

既然假設檢驗無法保證百分之百有效，那么我們就需要研究兩類錯誤出現的概率，由此將假設檢驗的功效數值化，

先來看第一類錯誤，

第一類錯誤是在H₀正確的時候錯誤地卻拒絕了它，這就意味著我們的判斷結果落在了拒絕域內：

結果落在拒絕域內的概率與顯著性水平一致，因此α的數值決定了出現第一類錯誤概率：

隨著α的減小，第一類錯誤出現的概率也隨之減小，當α=0時，第一類錯誤完全消失，也就是永遠不會拒絕H₀，這有點像過去的“守舊派”對于“法先王”的絕對擁護，無論時代怎么進步，“法先王”都必須服從，任何改革都視為大逆不道，

可以看出，由于α的值很小，所以犯第一類錯誤的幾率也很小，

再來看第二類錯誤，

第二類錯誤是在H₀錯誤的時候接受了它，一個本應落在拒絕域內的點卻落在了接受域內：

我們用β表示第二類錯誤出現的概率，只要α確定了，β也就確定了，一個草率的判斷是β=1-α，按照這種計算方式，β=0.95，這意味著第二類錯誤出現的概率高達95%！如果這樣，那么假設檢驗還有什么用？

實際上β的計算比α難得多，

我們延用產品元件的故事，μ₀是改善前總體的均值，μ₁是改善后總體的均值，改善前后的標準差一致，都是σ=6，

原假設H₀：改善前與改善后是同一個正態分布，μ₀=μ₁=600，

備擇假設H₁：改善前與改善后是不同的正態分布，μ₀=600< μ₁=603，

公司用新技術制造了大量元件，從中多次抽取容量是m（m≥30）的樣本進行檢驗，根據中心極限定理，樣本均值的分布服從均值為總體均值，方差為總體方差1/m的正態分布：

對樣本均值進行標準化處理：

使用0.05顯著性水平，在標準正態分布下，查表可知臨界值是1.645，

當Z₀ > 1.645時，將拒絕H₀假設，

再來看均值的逆運算：

也就是說，如果抽樣的均值大于601.802，就應該拒絕相信H₀，

現在可以計算出標準正態分布下β區域的臨界值：

結論是，如果改善后的功率均值是603，那么以此為條件，犯第二類錯誤的概率是β=0.137，通過β的計算程序可以看出，只有當H₁假設是一個固定的值時，才能計算出β，如果H₁假設不是固定，比如只給出了μ₁ > 603，那么將無法根據①計算出z₁，也就無法進一步求得β，

一個常見的問題是，既然一開始就知道了H₀和H₁的均值和方差，為什么還要使用標準化處理？直接計算臨界值豈不是更簡單？

我們的確可以直接通過計算機解求得X~(μ₀, σ²)時的臨界值，但這是總體分布下的臨界值，而我們的假設檢驗是基于抽樣，并非總體，此時用到的理論是中心極限定理，因此才大費周章地使用標準化形態，

　　出處：微信公眾號 "我是8位的"

　　本文以學習、研究和分享為主，如需轉載，請聯系本人，標明作者和出處，非商業用途！

　　掃描二維碼關注作者公眾號“我是8位的”

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/181847.html

標籤：其他