沒錯,我標題黨了,只是為了引起重視
臘月二十八,還有 3 天就過年了,程式員們估計都放假了,
就在這么一個普通的早晨,橡皮擦發現了一個神奇的事情,
原計劃反饋一下運營就好了,但是總感覺非常氣憤,畢竟那一個個 10W+ 粉絲的大佬都是橡皮擦努力的目標,
今天產生了目標崩塌的感覺,
先說一下結論:
我發現了 9 位博主,被 CSDN 相同用戶批量關注,該 9 位博主除一位粉絲 5W+,其余在 CSDN 粉絲數目都超過了 13W+,屬于擁有海量粉絲群的博主,
資料并沒有打碼,希望涉及到的博主見諒,
故事的背景
大家先看幾張圖片,圖片來源 2021 年 2 月 9 日早 7:00,重點注意下面的粉絲名,截圖在同一時間間隔內,如果不是因為出現零星的不同,橡皮擦會以為這是一個普通的資料 BUG,
如果大家好奇,我想現在去訪問下列博主的主頁,在關注選項卡也能看到相似的資料,





從關注者入手,追蹤被關注的名單
找了幾個關注者例子,例如下述 1 名注冊 1 天的新賬號,查看他的關注串列,
該用戶關注人地址為:https://blog.csdn.net/m0_55258826?type=sub&subType=watch

查看他的關注串列,獲取到了 9 位博主名單,與我上面的名單一致,此時可以猜測,這 9 名博主應該是被關注的范圍用戶,

接下來就到了橡皮擦熟悉的領域了,通過一些資料挖掘的方式獲取這些大佬的粉絲,然后比對看有哪些人同時關注了這 9 人,尋找例外資料,
批量獲取各位博主的最新 10000 粉絲
上述名單中每位大佬的粉絲資料,我都獲取了一遍(資料可以聯系橡皮擦獲取),每個大佬獲取 10000+ 粉絲,

接著我直接將資料放到了 EXCEL 里面,對其進行比對篩選,判斷是否存在一個人同時關注 9 個人的情況,畢竟一個【真人】能同時注意到這 9 個人,這種概率屬于小概率事件,只有可能是機器操作,

運行效果如下,然后在篩選出現數字 8 的總數(為何選擇 8,因為比對我使用的是最后一列,統計的數字要減 1)

最終得到 10000 人中,同時關注 9 人的有 4300+人,也就是說,可能有 4 成粉絲存在問題,為橡皮擦這一發現鼓掌,同時你會發現關注 6 人或 7 人的比例也極高,這個就需要 CSDN 技術人員自行排查了,

備注:查詢程序中存在一些例外資料,忽略即可,

對關注者的碼齡進行篩選
關注 0 年碼齡的關注者,咦哈,這個數字和剛才那個擬合了,十分接近,而且注意核對數字會發現每位博主關注者的碼齡分布出奇的一致,

最后的總結
抽樣檢查了其他的一些 1 天小號,關注的名單是一致的,集中在上述 9 人,而大佬們的粉絲都突破了 10W+,抽樣 10000人,得到的相同資料占比 40%,四舍五入不也就 5W 人嗎,不多,不多~
啥也不說了,好氣哦~,看到大佬們 15W+的粉絲,本來想學習一下,結果學到了,就這?
難道,粉絲 20W+ 的大佬其實都是虛幻的,由于 BUG 或者邏輯問題 dun dun dun 漲上去的,
目前的資料并未擴大到大佬們的全部粉絲,希望 CSDN 工程師自行查詢吧,
寫在后面的一些小結論:
- 第一種可能:有人批量注冊 CSDN 賬號,然后對以上 9 人進行批量關注;
- 第二種可能:產品邏輯問題,存在一個一鍵關注的入口,從資料來看,該入口被推薦博主名單應該是固定的(但并不僅僅是 0 年碼齡的新用戶產生了該問題,具體希望能進行篩查)
讓大佬們知道自己的粉絲是這么增長上去的,情何以堪,┭┮﹏┭┮ ,
你可以點開如下頁面進行查看,切換到關注頁即可,
- https://blog.csdn.net/qq_35190492/
- https://blog.csdn.net/qing_gee/
- https://blog.csdn.net/tefuirnever
相關閱讀
想學習爬蟲技術與資料分析技術,可以訂閱技術專欄
- Python 爬蟲 100 例教程,超棒的爬蟲教程,立即訂閱吧
- Python 爬蟲小課,精彩 9 講
如果你想跟博主建立親密關系,可以關注博主公眾號 “
非本科程式員”,了解非本科程式員如何成長,
博主 ID:夢想橡皮擦,希望大家點贊、評論、收藏,
CSDN認證博客專家
高級產品經理
互聯網從業者
業余編程愛好者
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/258502.html
標籤:AI
