寫在前面
微信群牛皮癬,指的是在微信群里面惡心群發小廣告的用戶,是微信群主最痛恨的一波人,如果熟悉早起的讀者可以知道我有一個技術交流群,但是自從建群以來就飽受小廣告的困擾,他們偽裝成正常人的樣子混進群然后不停的發送廣告轟炸,嚴重的打亂了群內的技術交流氣氛👇
或者是一聲不吭的去騷擾每一個群成員👇
雖然不清楚是什么能夠驅使他們這樣不折不扣的努力成為最強微信群牛皮癬(可能是鈔能力),但是在太多次的騷擾之后,我決定拿起Python消滅這些小廣告,
第一回合
其實實作思路很簡單,總共分兩步
-
1.識別廣告用戶
-
2.寫代碼移除之
但是這兩步,每一步都不簡單,先來說說第一步如何準確的識別這些用戶,網上沒有資料也沒有一個好的鑒別標準,只能用我的大腦完成特征識別,經過這幾個月,近百份發廣告用戶的樣本訓練,基本可以判斷一個非正常用戶至少滿足下面幾條中的三條以上:
-
沒有設定微信號
-
頭像為網紅女生
-
微信名為特殊符號或者表情
-
沒發過朋友圈
-
沒有朋友圈背景圖
-
通過后不會有除進群申請外的其他回復
并且根據歷史資料,符合1、3條的用戶有極大概率為小廣告愛好者,那么接下來要做的就是用Python寫代碼找出微信里面的這些人,在總結出這一規律后很樂觀的認為實作這一需求并不困難,因為我在幾年前就曾拿過Python研究微信好友,不論是wxpy還是itchat操作起來應該都不復雜,但是事實確證明我還是太年輕了
不知從何時起,雖然這些庫還能使用但是微信基本已經禁止了大部分人的網頁版微信登陸權限,因此當我使用多個微信號分別掃完登陸微信的二維碼之后,無一例外的提示我
<error><ret>1203</ret><message>
為了你的帳號安全,此微信號已不允許登錄網頁微信,
你可以使用Windows微信或Mac微信在電腦端登錄,
</message></error>
這就讓人頭疼了,總不能手動的去一個一個check我的幾千個微信好友吧,于是我開始思考是否有其他的解決辦法,
第二回合
如果你經常寫Python爬蟲,那么你會知道在有些情況下,與其使用Requests對付一些惡心的反爬措施,不如Selenium操作起來方便,所以在發現想使用基于微信API的思路失效后,我將目光轉向了相對笨一點的方法————pynput
pynput是一款使用Python來控制和監控電腦滑鼠、鍵盤的第三方庫,說到這里你大概明白我想怎么做了,直接用API取資料搞不定,那么我就像Selenium一樣,模擬點擊一個一個好友來實作我想要的操作,
下面簡單說一下這個庫,因為沒有太多依賴庫所以安裝起來很簡單,直接pip install pynput即可,使用起來也很簡單,對于滑鼠操作只依賴坐標,看個demo👇
就像上面GIF演示的一樣,先匯入pynput并實體一個滑鼠控制器,接著將微信在狀態欄的位置提交給mouse.position,這樣滑鼠就會移動到該位置,再使用mouse.press來模擬滑鼠點擊即可自動打開微信,那么問題來了,如何獲得我想要的位置的坐標?
pynput除了使可以使用Controller來控制滑鼠,也可以監控滑鼠,比如使用下面的代碼就可以記錄下程式啟動后滑鼠的每一個點擊操作所在的位置👇
from pynput import mouse
def on_move(x, y ):
print('滑鼠移動至 {0}'.format(
(x,y)))
def on_click(x, y , button, pressed):
print('{0} 在坐標 {1}'.format('滑鼠點擊' if pressed else '滑鼠釋放', (x, y)))
if not pressed:
return False
while True:
with mouse.Listener(on_move = on_move,on_click = on_click) as listener:
listener.join()
那么接下來的任務就簡單了,我們只需要保持微信視窗不移動,在記錄下每一個關鍵位置的坐標(微信圖示位置,群聊視窗位置,單個群成員頭像位置)之后,比如我們想對上面說的第一條規則進行判斷即獲取每一個群成員微信號是否設定,就可以按照模擬以下操作實作:
-
點擊微信app
-
點擊需要的群聊
-
依次點擊每一個群成員頭像
-
移動到微信號的位置
-
雙擊該微信號
-
復制該微信號判斷是否為初始微信號
在上面的程序中,值得說的是最后一步,復制我們可以使用pynput中的鍵盤控制器,在雙擊選中對應微信號之后通過下面的代碼實作模擬鍵盤輸入Command + C完成復制操作
from pynput.keyboard import Key
from pynput.keyboard import Controller as Controller1
keyboard = Controller1()
with keyboard.pressed(Key.cmd):
keyboard.press('c')
keyboard.release('c')
但是粘貼則不需要使用pynput通過模擬command+c來粘貼到另一個編輯中復雜程序,我們可以使用第三方庫pyperclip,直接通過下面兩行代碼即可將復制好的文字轉為字串
import pyperclip
pyperclip.paste()
在將群成員的微信號轉換為字串后,不論我們是通過判斷字串的長度還是用正則運算式或者是其他的方法都可以輕松的判斷該成員的微信號是否為初始微信號,實作規則1的判斷,下面的代碼與動態圖就是一次**完整的程序
from pynput.mouse import Button, Controller
import time
from pynput.keyboard import Key
from pynput.keyboard import Controller as Controller1
import pyperclip
mouse = Controller()
# 點擊微信
mouse.position = (1046.14453125, 4.546875)
time.sleep(2)
mouse.press(Button.left)
mouse.release(Button.left)
#點擊頭像
mouse.position = (1194.140625, 441.05859375)
time.sleep(1)
mouse.press(Button.left)
mouse.release(Button.left)
# 點擊選中文本
mouse.position = (965.60546875, 284.0390625)
time.sleep(1)
mouse.click(Button.left, 2)
keyboard = Controller1()
with keyboard.pressed(Key.cmd):
keyboard.press('c')
keyboard.release('c')
time.sleep(1)
wechatid = pyperclip.paste()
print(f"微信號{wechatid}疑似廣告號" if len(wechatid) > 20 else f"微信號{wechatid}不是廣告號")

可以看到成功將早小起的微信從廣告號中排除 那么接下來只需要記錄下每兩個群成員之間間隔的坐標距離,之后回圈去模擬滾動或者下拉來實作上述程序,就可以將群里所有成員的微信號根據規則1進行判斷,找到例外的那些成員單獨進行判斷,
可以看到最終是找到了6個疑似廣告號的微信,接下來通過其他規則的手動判斷最終將兩個用戶判定為廣告高風險用戶并移除,
寫在最后
通過上面的操作,雖然成功的踢出了兩個疑似廣告號,但是依舊很難去判斷是否真的踢對了人,如果踢錯了,那么則粉絲-1,同時也可以發現想用Python準確找到群里的牛皮癬還是非常困難的,使用pynput最多可以完成微信號及頭像(使用識圖API)的判斷,但是更多的資訊卻很難提取挖掘,
同時pynput有著和selenium同樣的缺點,那就是由于模擬真人操作而導致的速度慢,并且它的定位方式僅支持坐標,所以還需要保證在操作的程序中微信視窗不可以被移動,否則之前記錄的元素將全部失效(建議開發者可以支持更多的定位方式)
如果你有好的思路可以在留言區和我交流,今天的文章就到這里,為了維護良好的群內交流環境,對抗小廣告的路還在繼續,拜拜~
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/12994.html
標籤:其他
上一篇:「資訊安全-密碼與隱藏技術」凱撒密碼與仿射密碼 (CPP 實作)
下一篇:java多執行緒面試點
