前言
最近,歪嘴戰神血洗b站,靠著“耐克式微笑"成功出圈,迷倒眾生,
這次,爬取了10萬條相關彈幕,從資料分析的角度,扒一扒歪嘴戰神那該死的狷狂魅力,
歪嘴戰神 何方神圣?
歪嘴戰神,是一系列爽文改編的視頻小廣告主角,這些視頻套路簡單,短小精悍,演員不換,土到極致透著一股雅致:
前期20秒,主角背景介紹,手眼通天是常態,牛逼到玉帝見了都想拜把子,
中期30秒,主角(被豬油蒙了心)拋家舍業,非要上趕著當倒插門女婿,因為隱瞞了身份,所以在妻家飽受羞辱,據我統計,這30秒至少會被推倒在地1.5次,被3個人嘲諷3次,順便挨3個大嘴巴子,
后期10秒,小弟滑跪戳破身份,中期有眼不識泰山的人紛紛磕頭如搗蒜,最后,戰神從兜里掏出結婚證撕個稀里嘩啦,然后露出標志性的歪嘴笑,留給觀眾無盡的遐想,
歪嘴戰神只是他一個身份,他!
時而是手握太乙玄針包治百病的神醫
時而是為戰死北疆108位兄弟隱姓埋名的修羅王
時而是百億訂單說送就送的帝都龍王
千變萬化的牛X身份背后,是不變的歪嘴笑
歪嘴一笑百媚生,b站鬼畜無顏色
戰神到底有多火?
我爬取了b站“歪嘴戰神”關鍵詞下50頁(最多只能爬這么多)視頻,截至8月14日,累計播放量已經高達8207萬
播放量還在以每天2000萬的速度飛跑....
通過每天上傳視頻數量和平均播放量資料可以發現:
7月22日,是歪嘴戰神在b站的生日,這一天UP主“Bullet蛋蛋”上傳了標題為“歪嘴戰神”的視頻,實作小范圍引爆,
26日,“李子alt”奉上“最強贅婿”佳作,再一次擴散歪嘴風采,
隨后,關于歪嘴戰神的創作熱情也開始高漲,最近每天有超過100位UP主入場,用創作能力來致敬歪嘴奧義,
再看歪嘴戰神和中年實力炸子雞沈騰的百度指數對比,結果更一目了然,(點擊可看大圖)
世界上本沒有歪嘴戰神,搜的人多了,也便有了戰神,
8月5日“歪嘴戰神”作為一個詞條被收錄,當天旱地拔蔥,搜索指數從0飆升到2795,之后是波浪式飆升,
6天之后,搜索指數超過了沈騰叔叔,還在持續昂揚,
照這個趨勢和斜率
流量鮮肉,彈指可破!
歪嘴頂流,指日可待!
簡單的劇情 是彈幕的狂歡
一哥們說他已經20刷了,根本停不下來....
看上去沙雕無比的劇情,為什么讓這么多人沉迷其中無法自拔?
難道人類的本質不止是復讀機,還是沙雕?
我決定從彈幕入手,基于爬取的10萬條彈幕,提取關鍵資訊做了個詞云圖:
彈幕大體分三層:
第一層,哈哈怪,用“哈哈哈”、“炫炫炫”和“???”三把神劍打遍天下無敵手,
第二層,歪嘴死忠粉,戰神最后歪嘴一笑,用漫天的彈幕“√”來模擬龍王微笑的幅度,
第三層,劇情復讀機,緊跟劇情,被嘲諷時狂發《loser》和《隱忍》,戰神翻身時《家主有令》和《別后悔》,戰神歸位后《有眼無珠》、《彈指可滅》,
三類彈幕的加持下,歪嘴戰神更加所向披靡,
Why 歪嘴戰神
爽文和改編的小廣告,套路都非常簡單,無非是先抑后揚
而歪嘴戰神格外出圈
靠的是恰到好處的浮夸演技,取材于成語大全的鏗鏘臺詞,
沙雕到全是破綻但就是好笑的人物設定和千篇一律演員不換的魔幻劇情,
當然,最最最重要的,還是每一集末尾,戰神最后的歪嘴一笑,
這是一個無敵的視覺錘,每一捶都砸在觀眾的癢點,讓人欲罷不能,
這一笑,看似簡單,實則不然,我模仿了不下百次,還是四不像
后來看了本尊“管云鵬”(本尊已入b站)的親自講解,才知道想要身形具備,必須嚴格遵守
“一是轉頭果斷,二是眼神堅定,三是嘆氣帶笑”的歪嘴定律
你學會了嗎?
太魔性了,我要繼續去刷歪嘴戰神系列,沒錯,連喜羊羊都已經歪嘴化了....
最后,奉上b站爬取核心代碼,邏輯并不復雜,有機會拎出來展開講講:
import pandas as pd import os import requests from lxml import etree import random import time #根據搜索關鍵字按點擊量爬取視頻資料 def get_target(url,num = 10): result = pd.DataFrame() for i in range(1,num + 1): headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'} html = requests.get(url.format(i),headers = headers) bs = etree.HTML(html.text) for sig in bs.xpath('//li[@class = "video-item matrix"]'): title = sig.xpath('div[@class = "info"]/div/a/@title')[0] click = sig.xpath('div[@class = "info"]/div[3]/span[1]')[0].xpath('string(.)').strip('\n ') danmu = sig.xpath('div[@class = "info"]/div[3]/span[2]')[0].xpath('string(.)').strip('\n ') date = sig.xpath('div[@class = "info"]/div[3]/span[3]')[0].xpath('string(.)').strip('\n ') up = sig.xpath('div[@class = "info"]/div[3]/span[4]')[0].xpath('string(.)').strip('\n ') df = pd.DataFrame({'標題':[title],'播放量':[click],'彈幕':[danmu],'日期':[date],'UP主':[up]}) result = pd.concat([result,df]) time.sleep(random.random() + 0.5) print('已經完成b站第 {} 頁爬取'.format(i)) return result #爬取單集單日彈幕 def get_one_day(url,headers,cookies): lst = [] html = requests.get(url,headers,cookies = cookies) bs = etree.HTML(html.text.encode('utf8')) for i in bs.xpath('//d'): dm = i.text.encode('iso-8859-9').decode('utf8') lst.append(dm) df = pd.DataFrame({'彈幕':lst}) df['日期'] = url[-10:] df['oid'] = url[url.find('oid=') + 4:url.find('&date')] time.sleep(1 + random.random()) return df
PS:如有需要Python學習資料的小伙伴可以加下方的群去找免費管理員領取
可以免費領取原始碼、專案實戰視頻、PDF檔案等
本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,著作權歸原作者所有,如有問題請及時聯系我們以作處理,
作者:Python極客專欄
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/33687.html
標籤:Python
上一篇:Python資料分析實戰講解
下一篇:requests模塊
