我有一個用 Python 撰寫的 Discord 機器人,我想添加一個功能,讓它立即洗掉它找到的任何網路釣魚鏈接。
我查找了已知網路釣魚域的串列,并在 GitHub 上找到了這個串列。
然而問題是這是一個帶有一個大陣列的 JS 檔案,而我的機器人是 100% Python。
我可以復制這個串列,但是我失去了它不斷更新的優勢,所以如果可能的話,我想直接從 GitHub 讀取域。
我不確定如何獲取并將其決議為 Python 串列。
環顧 StackOverflow,人們建議將資料決議為 JSON,或使用正則運算式,但不幸的是我還沒有完全理解。
指導會有所幫助 - 或者也許您有更好的做事方式而不是這種方法!謝謝
uj5u.com熱心網友回復:
這是一種方法(容易失敗,絕對不是推薦的方法):
import requests
RAW_DATA_LINK = "https://raw.githubusercontent.com/nikolaischunk/discord-phishing-links/main/domain-list.js"
def get_data():
response = requests.get(RAW_DATA_LINK)
data = response.content.decode()
data = data.replace("const suspiciousDomains = ", "").replace(";", "") # or just data[26:-2]
return eval(data)
get_data()將為您提供該檔案中所有鏈接的串列。您還可以在發出請求時嘗試使用會話...
同樣,如果您可以控制該檔案,只需將其存盤為 json,如果您無法控制,則最好使用正則運算式。
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/388317.html
