本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯系我們以作處理,
以下文章來源于CSDN,作者CAD資料分析師
前言
最近開播的國綜里面,熱度最高的一定是《演員請就位》了,從第一季起這部綜藝就話題不斷,金句頻出,前有李誠儒老師的“如坐針氈,如芒刺背,如鯁在喉”;這一季,李誠儒老師再出金句,“味同嚼蠟,味如雞肋,如此乏味”一度刷爆網路,
《演員請就位2》導師方面,除了上一季的陳凱歌、趙薇、郭敬明,還有這季加入的爾冬升導演,陣容上就十分有看點,參加的演員方面也有胡杏兒、黃奕、婁藝瀟等熟悉的身影,
《演員2》一開播就熱搜話題不斷,無論是李誠儒老師、爾冬升導演的犀利點評,郭敬明給演技小白何昶希發S卡都能引起大量的討論,
我們今天就用Python分析了《演員2》的視頻彈幕,看看大家都在吐槽些什么,
豆瓣6.5分 《演員2》為啥差強人意?
《演員請就位》目前為止已經播出了兩季,第一季在豆瓣為6.8分,共有4萬余人評分,
而目前正在播出的第二季,已有1萬9千多人評分,分數為6.5分,比上一季還低了0.3分,
分數占比
我們用Python分析了豆瓣的500條熱評資料,從評分分布可以看到:
分數占比方面,37%的人給出1星,20.8%的人給出2星,給出5星好評的僅有5%,
豆瓣短評
那么短評中都在說些什么呢?
從評價詞云圖中可見,話題主要集中在郭敬明、爾冬升、陳凱歌、李誠儒幾位嘉賓上,這也是《演員2》被詬病的一點,嘉賓導師比參賽的演員更出圈,更有話題,此外,"節目"、"演技"、"點評"等也是短評中常出現的,
導演提及
幾位嘉賓導師中,誰被提到的次數最多呢?
進一步分析可見,郭敬明占據著最高的話題度,其次是爾冬升和陳凱歌,
導演評價
在對導演和主持嘉賓的評價也十分有意思,對郭敬明的差評達到60.66%,超過的半數,好評僅為14.22%,這與爾冬升的評價差距很大,后者的差評僅為28.83%,好評度也是最高的,達到了29.73%,而有趣的是,作為主持人的大鵬差評度居然比郭敬明還高,達到了67.27%,
分析45萬條彈幕資料,看看大家都在吐槽什么
我們使用Python獲取并分析了《演員請就位2》的騰訊彈幕資料,分析了目前播放的前五期,
- 彈幕資料獲取
- 資料讀入和資料預處理
- 資料可視化
1.1 資料讀入
首先匯入所需庫,
# 匯入庫 import os import jieba import numpy as np import pandas as pd from pyecharts.charts import Bar, Pie, Line, WordCloud, Page from pyecharts import options as opts from pyecharts.globals import SymbolType, WarningType WarningType.ShowWarning = False import stylecloud from IPython.display import Image # 用于在jupyter lab中顯示本地圖
使用pandas回圈讀取資料,
# 讀入資料 data_list = os.listdir('../data/') df_all = pd.DataFrame() for i in data_list: # print(i) df_one = pd.read_csv(f'../data/{i}', engine='python', encoding='utf-8', index_col=0) df_all = df_all.append(df_one, ignore_index=False) df_all.info() <class 'pandas.core.frame.DataFrame'> Int64Index: 449762 entries, 0 to 44317 Data columns (total 7 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 episodes 449762 non-null object 1 comment_id 449762 non-null int64 2 oper_name 183066 non-null object 3 vip_degree 449762 non-null int64 4 content 449762 non-null object 5 time_point 449762 non-null int64 6 up_count 449762 non-null int64 dtypes: int64(4), object(3) memory usage: 27.5+ MB
共獲取了前五期449762條彈幕資料,欄位主要包括:期數、評論id、用戶名、vip等級、評論內容、評論時間點和點贊數,資料預覽如下:
df_all.head()
1.2 資料預處理
# 洗掉彈幕角色 df_all['content'] = df_all['content'].str.replace('(.*?:)', '') df_all.head()
1.3 資料可視化
彈幕走勢圖
先看到視頻彈幕走勢圖,從數量上可以看到,彈幕數量前三的分別是:第一期上、第三期上、第五期上,而第一期下和第五期下的彈幕較少,
df_epinum = df_all['episodes'].value_counts().reset_index() df_epinum['num'] = [1, 5, 3, 7, 6, 8, 4, 9, 2, 10] df_epinum = df_epinum.sort_values('num') df_epinum
x_data = https://www.cnblogs.com/hhh188764/p/df_epinum['index'].tolist() y_data = df_epinum['episodes'].tolist() # 條形圖 bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px')) bar1.add_xaxis(xaxis_data=x_data) bar1.add_yaxis('', y_axis=y_data) bar1.set_global_opts(title_opts=opts.TitleOpts(title='前五期的彈幕數走勢圖'), visualmap_opts=opts.VisualMapOpts(max_=60000, is_show=False) ) bar1.render()
人物彈幕詞云
我們接著再分別看到幾位導演導師的彈幕詞云,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/210993.html
標籤:Python
上一篇:技術點8:jsp頁面
下一篇:app脫殼后多個dex合并成一個
