作者:張輝
https://blog.csdn.net/ctrip_tech/article/details/80125741
作為互聯網公司的資訊安全從業人員經常要處理撞庫掃號事件,產生撞庫掃號的根本原因是一些企業發生了資訊泄露事件,且這些泄露資料未加密或者加密方式比較弱,導致黑客可以還原出原始的用戶密碼,
目前已經曝光的資訊泄露事件至少上百起,其中包括多家一線互聯網公司,泄露總資料超過10億條,
要完全防止資訊泄露是非常困難的事情,除了防止黑客外,還要防止內部人員泄密,但如果采用合適的演算法去加密用戶密碼,即使資訊泄露出去,黑客也無法還原出原始的密碼(或者還原的代價非常大),
也就是說我們可以將作業重點從防止泄露轉換到防止黑客還原出資料,下面我們將分別介紹用戶密碼的加密方式以及主要的破解方法,
一、用戶密碼加密
用戶密碼保存到資料庫時,常見的加密方式有哪些,我們該采用什么方式來保護用戶的密碼呢?以下幾種方式是常見的密碼保存方式:
1、直接明文保存,比如用戶設定的密碼是“123456”,直接將“123456”保存在資料庫中,這種是最簡單的保存方式,也是最不安全的方式,但實際上不少互聯網公司,都可能采取的是這種方式,推薦閱讀:2019 年 10 個最爛的密碼,
2、使用對稱加密演算法來保存,比如3DES、AES等演算法,使用這種方式加密是可以通過解密來還原出原始密碼的,當然前提條件是需要獲取到密鑰,不過既然大量的用戶資訊已經泄露了,密鑰很可能也會泄露,當然可以將一般資料和密鑰分開存盤、分開管理,但要完全保護好密鑰也是一件非常復雜的事情,所以這種方式并不是很好的方式,

3、使用MD5、SHA1等單向HASH演算法保護密碼,使用這些演算法后,無法通過計算還原出原始密碼,而且實作比較簡單,因此很多互聯網公司都采用這種方式保存用戶密碼,曾經這種方式也是比較安全的方式,但隨著彩虹表技術的興起,可以建立彩虹表進行查表破解,目前這種方式已經很不安全了,

4、特殊的單向HASH演算法,由于單向HASH演算法在保護密碼方面不再安全,于是有些公司在單向HASH演算法基礎上進行了加鹽、多次HASH等擴展,這些方式可以在一定程度上增加破解難度,對于加了“固定鹽”的HASH演算法,需要保護“鹽”不能泄露,這就會遇到“保護對稱密鑰”一樣的問題,一旦“鹽”泄露,根據“鹽”重新建立彩虹表可以進行破解,對于多次HASH,也只是增加了破解的時間,并沒有本質上的提升,

5、PBKDF2演算法,該演算法原理大致相當于在HASH演算法基礎上增加隨機鹽,并進行多次HASH運算,隨機鹽使得彩虹表的建表難度大幅增加,而多次HASH也使得建表和破解的難度都大幅增加,
使用PBKDF2演算法時,HASH演算法一般選用sha1或者sha256,隨機鹽的長度一般不能少于8位元組,HASH次數至少也要1000次,這樣安全性才足夠高,一次密碼驗證程序進行1000次HASH運算,對服務器來說可能只需要1ms,但對于破解者來說計算成本增加了1000倍,而至少8位元組隨機鹽,更是把建表難度提升了N個數量級,使得大批量的破解密碼幾乎不可行,該演算法也是美國國家標準與技術研究院推薦使用的演算法,

6、bcrypt、scrypt等演算法,這兩種演算法也可以有效抵御彩虹表,使用這兩種演算法時也需要指定相應的引數,使破解難度增加,
下表對比了各個演算法的特性:

二、用戶密碼解密
用戶密碼解密需要針對具體的加密方式來實施,如果使用對稱加密,并且演算法足夠安全(比如AES),必須獲取到密鑰才能解密,沒有其它可行的解密方式,
如果采用HASH演算法(包括特殊HASH),一般使用彩虹表的方式來破解,彩虹表的原理是什么呢?
我們先來了解下如何進行HASH碰撞,推薦閱讀:為什么要重寫 hashcode 和 equals 方法?
單向HASH演算法由于不能進行解密運算,只能通過建表、查表的方式進行碰撞,即將常用的密碼及其對應的HASH值全計算出來并存盤,當獲取到HASH值是,直接查表獲取原始密碼,假設用MD5演算法來保護6位數字密碼,可以建如下表:

全表共100W條記錄,因為資料量不大,這種情況建表、查表都非常容易,但是當密碼并不是6位純數字密碼,而是數字、大小寫字母結合的10位密碼時,建立一個這樣的表需要(26+26+10)^ 10 ≈ 83億億(條記錄),存盤在硬碟上至少要占用2000W TB的空間,這么大的存盤空間,成本太大,幾乎不可行,有什么辦法可以減少存盤空間?一種方法是“預計算哈希鏈”,“預計算哈希鏈”可以大幅減少HASH表的存盤空間,但相應的增加了查表時的計算量,其原理大致如下:
建表程序如下:

先對原始資料“000000”進行一次HASH運算得到“670B1E”,再對HASH值進行一次R運算,R是一個定制的演算法可以將HASH值映射到明文空間上(這里我們的明文空間是000000~999999),R運算后得到“283651”,再對“283651”進行hash運算得到“1A99CD”,然后在進行R運算得到“819287”,如此重復多次,得到一條哈希鏈,然后再選用其它原始資料建立多條哈希鏈,最終僅將鏈頭和鏈尾保存下來,中間節點全都去掉,
查表程序:假設拿到了一條HASH值“670B1E”,首先進行一次R運算,得到了“283651”,查詢所有鏈尾是否有命中,如果沒有,則再進行一次HASH、一次R,得到了“819287”,再次所有鏈尾,可以得到看出已經命中,
這樣我們就可以基本確認“670B1E”對應的明文就在這條鏈上,然后我們把這條鏈的生成程序進行重新計算,計算程序中可以發現“000000”的HASH值就是“670B1E”,這樣就完成了整個查表程序,這種表就是“預計算哈希鏈”,這種方式存在一個問題,多條鏈之間可能存在大量的重復資料,如下圖所示:

為了解決這個問題,我們將R演算法進行擴展,一條鏈上的多次R運算采用不同的演算法,如下圖:

一條鏈上的每個R演算法都不一樣,就像彩虹的每層顏色一樣,因此取名的為彩虹表,
當然彩虹表除了可以用戶破解HASH演算法外,理論上還可以用于破解對稱加密演算法,比如DES演算法,由于DES演算法密鑰比較短,建立彩虹表破解是完全可行的;但對于AES演算法,由于密鑰比較長,建表幾乎不可行(需要耗時N億年),
三、小結
采用PBKDF2、bcrypt、scrypt等演算法可以有效抵御彩虹表攻擊,即使資料泄露,最關鍵的“用戶密碼”仍然可以得到有效的保護,黑客無法大批量破解用戶密碼,從而切斷撞庫掃號的根源,
當然,對于已經泄露的密碼,還是需要用戶盡快修改密碼,不要再使用已泄露的密碼,
推薦去我的博客閱讀更多:
1.Java JVM、集合、多執行緒、新特性系列教程
2.Spring MVC、Spring Boot、Spring Cloud 系列教程
3.Maven、Git、Eclipse、Intellij IDEA 系列工具教程
4.Java、后端、架構、阿里巴巴等大廠最新面試題
覺得不錯,別忘了點贊+轉發哦!
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/174985.html
標籤:Java
下一篇:maven 一些高級用法命令
