一種基于瀏覽記錄的反反爬蟲方法-有解無憂

最近寫專利時看到了一種基于瀏覽記錄的反爬蟲方法，該方法基于 “在前端頁面中以埋點或者提取頁面日志的方式，獲取用戶的前端瀏覽記錄，計算用戶行為指標并進行人機驗證” ，

用戶行為指標

用戶行為指標的計算基于前端瀏覽記錄中的瀏覽地址與瀏覽時間，

根據所述瀏覽時間和所述地址數量計算預設單位時長內訪問次數；
根據所述地址數量與所述總瀏覽時長計算每個瀏覽地址的平均瀏覽時長；
利用預設的指標函式對所述地址數量、總瀏覽時長、平均瀏覽時長和預設單位時長訪問次數進行計算，得到用戶行為指標，

在這里插入圖片描述
其中，f 為用戶行為指標，A為所述地址數量，B為所述總瀏覽時長，C為所述平均瀏覽時長，D為所述預設單位時長訪問次數，α、β、γ和θ為預設權重系數，

例如，用戶小明的在6點至7點的瀏覽地址為的www.xiaoshuo.com，在7點至9點瀏覽地址為www.gouwu.com，則確定用戶小明的地址數量為2，瀏覽總時長為3小時，用戶小明對每個瀏覽地址的平均瀏覽時長為1.5小時，當預設單位時長為3小時，預設單位時長內訪問次數為2，

由于非爬蟲用戶的作息方式較為固定，因此非爬蟲用戶的瀏覽習慣較為固定，該方法利用計算得到的用戶行為指標表示用戶為非爬蟲用戶的概率，并將用戶行為指標與預設閾值進行對比，當所述用戶行為指標大于預設閾值，確定該用戶為爬蟲，對所述用戶進行訪問限制，

然后根據所述反爬蟲驗證引數，構建所述用戶對所述目標網頁的訪問代價函式，并迭代所述訪問代價函式，得到訪問代價值，
所述訪問代價是指用戶通過用戶IP地址對資料進行訪問時，用戶IP地址對應的服務器的負載消耗，
所述訪問代價函式為：
在這里插入圖片描述
例如，用戶通過用戶IP地址對目標網頁進行訪問時，該用戶IP地址對應的服務器需要承擔每秒8000次的資料請求產生的負載消耗，則每秒8000次的資料請求產生的負載消耗即為用戶對所述目標網頁進行訪問的訪問代價，

所述對所述訪問代價函式進行迭代，是指利用所述訪問代價函式計算多個預設單位時長內，用戶通過用戶IP地址對資料進行訪問的單位訪問代價，并將該多個預設單位時長內單位訪問代價的均值作為所述訪問代價值，
判斷所述訪問代價值是否小于所述反爬蟲驗證引數，當所述訪問代價值小于所述反爬蟲驗證引數時，對所述用戶進行訪問限制，