主頁 >  其他 > Pandas 進階

Pandas 進階

2021-09-19 08:30:52 其他

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['STFangsong']
plt.rcParams['axes.unicode_minus'] = False
%config InlineBackend.figure_format = 'svg'

資料分析的一般流程

  1. 提取資料(篩選)

    • 布爾索引
    • query():相當于布爾索引
    • drop():洗掉指定的行或列
    • rename():重命名行或列索引
    • reset_index():重置索引(將索引變成普通列)
    • set_index():設定索引(將一個列或多個列指定為索引)
    • reindex():調整行或列索引的順序(還可以做花式索引)
  2. 整合和重塑

    • merge():實作兩個DataFrame物件的內連接或外連接(適用于兩張表有關聯),
    • concat():將兩個或多個DataFrame的資料拼接到一起(適用于多張表結構一致),
  3. 資料清洗(缺失值、重復值、例外值)

    • 缺失值:

      • dropna():洗掉空值
      • fillna():填充空值 <— 均值、中位數、眾數
      • isnull() / notnull():判斷空值
    • 重復值:

      • duplicated():判斷是否重復
      • drop_duplicates():洗掉重復值
    • 例外值:

      • 例外值 / 極端值 / 離群值
      • drop():洗掉
      • replace():替換
    • 預處理:

      • apply():將函式作用到資料上,需要指定在哪個軸上執行
      • transform():將(多個)函式作用到資料上
      • applymap():對每個元素使用指定的函式進行映射,相當于Series上的map()方法 —> elementwise

    注意:這三個方法都是高階函式的用法,apply()方法接受的函式,可以是帶歸約性質的函式(聚合函式),也可以是沒有歸約性質的函式,transform()方法接受的函式不能是帶歸約功能的函式,只能是對資料做變換的函式,簡單的說就是函式的執行不會減少資料的量,

  4. 資料透視(排序、分組、聚合)

    • 透視表:根據A統計B(根據A列對資料進行分組,再對B列上聚合函式)
    • groupby() —> sum() / mean() / max() / …
    • pivot_table() —> 專門生成透視表的函式
    • cut() —> 資料離散化(分箱)
  5. 資料可視化(統計圖表)

  6. 資料的洞察(發現問題給出建議)

Example 1

df = pd.read_csv('../files/data/bilibili.csv',encoding = 'GBK')
df
titleurlwatchnumdmuptimeupname
0阿里云大學課程(云計算、中間件、大資料、云安全)//www.bilibili.com/video/BV1Lv411s7wu?from=search295442021/1/21韭菜滾雪球
1視覺傳達設計專業的小朋友大學課程有哪些,強度怎么樣,需要什么技能?學姐給新生的解答與建議//www.bilibili.com/video/BV1Ea4y1a7CX?from=search352682020/7/25鏵仔仔兒的奮斗史
2CAP:適合高中生的大學課程(上大學之前提前學習大學的課程)同濟大學《微積分CAP》//www.bilibili.com/video/BV1X4411Y7u8?from=search5597172019/5/11愚甘雜貨鋪
3干貨!論文讀寫系列|寫作風格:例文決議(1)|人文社科|教育學|大學課程、知識//www.bilibili.com/video/BV1VC4y1b7ZA?from=search1.1萬292020/7/26cici西西熙熙
4《用戶體驗與心理-第1期》大學課程//www.bilibili.com/video/BV1r7411M7gY?from=search137392020/2/24Luka老師
.....................
1902【中國石油大學】構造地質學(第1-2章) ——主講:李理老師//www.bilibili.com/video/BV1Y4411x7sE?from=search409752019/5/2點點滴滴Super
1903【模電】模擬電子技識訓礎【四】//www.bilibili.com/video/BV1sb411v7E6?from=search5997112019/3/8干脆的非洲鼓
1904【模電】模擬電子技識訓礎【三】//www.bilibili.com/video/BV1Rb411i7yo?from=search471382019/3/5干脆的非洲鼓
1905結構化學-東北大學-王軍//www.bilibili.com/video/BV1yb411t7Mb?from=search583522019/2/28萬萬萬萬不能慫
1906《結構化學》南開大學-孫宏偉 重點難點決議//www.bilibili.com/video/BV1yt411t7UG?from=search528762019/1/28阿bu愛學習

1907 rows × 6 columns

def handle_num(n):
    if n[-1] == '萬':
        return int(float(n[:-1]) * 10000)
    return int(n)

df['watchnum'] = df.watchnum.map(handle_num)
df['dm'] = df.dm.map(handle_num)
df
titleurlwatchnumdmuptimeupname
0阿里云大學課程(云計算、中間件、大資料、云安全)//www.bilibili.com/video/BV1Lv411s7wu?from=search295442021/1/21韭菜滾雪球
1視覺傳達設計專業的小朋友大學課程有哪些,強度怎么樣,需要什么技能?學姐給新生的解答與建議//www.bilibili.com/video/BV1Ea4y1a7CX?from=search352682020/7/25鏵仔仔兒的奮斗史
2CAP:適合高中生的大學課程(上大學之前提前學習大學的課程)同濟大學《微積分CAP》//www.bilibili.com/video/BV1X4411Y7u8?from=search5597172019/5/11愚甘雜貨鋪
3干貨!論文讀寫系列|寫作風格:例文決議(1)|人文社科|教育學|大學課程、知識//www.bilibili.com/video/BV1VC4y1b7ZA?from=search11000292020/7/26cici西西熙熙
4《用戶體驗與心理-第1期》大學課程//www.bilibili.com/video/BV1r7411M7gY?from=search137392020/2/24Luka老師
.....................
1902【中國石油大學】構造地質學(第1-2章) ——主講:李理老師//www.bilibili.com/video/BV1Y4411x7sE?from=search409752019/5/2點點滴滴Super
1903【模電】模擬電子技識訓礎【四】//www.bilibili.com/video/BV1sb411v7E6?from=search5997112019/3/8干脆的非洲鼓
1904【模電】模擬電子技識訓礎【三】//www.bilibili.com/video/BV1Rb411i7yo?from=search471382019/3/5干脆的非洲鼓
1905結構化學-東北大學-王軍//www.bilibili.com/video/BV1yb411t7Mb?from=search583522019/2/28萬萬萬萬不能慫
1906《結構化學》南開大學-孫宏偉 重點難點決議//www.bilibili.com/video/BV1yt411t7UG?from=search528762019/1/28阿bu愛學習

1907 rows × 6 columns

from datetime import datetime

# 將表中上傳時間(字串)轉換為時間型別
# pd.to_datetime(字串時間)
df['uptime'] = pd.to_datetime(df.uptime)
df.uptime   # dtype: datetime64[ns]
0      2021-01-21
1      2020-07-25
2      2019-05-11
3      2020-07-26
4      2020-02-24
          ...    
1902   2019-05-02
1903   2019-03-08
1904   2019-03-05
1905   2019-02-28
1906   2019-01-28
Name: uptime, Length: 1907, dtype: datetime64[ns]
df.uptime >= datetime(2021,1,1)   # 布爾資料系列
0        True
1       False
2       False
3       False
4       False
        ...  
1902    False
1903    False
1904    False
1905    False
1906    False
Name: uptime, Length: 1907, dtype: bool
[df.uptime >= datetime(2021,1,1)] # 布爾下標
temp = df[(df.uptime >= datetime(2021,1,1)) & (df.watchnum > 1000)]  #發布時間為2021年播放量大于1000的帖子
temp.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 92 entries, 0 to 1425
Data columns (total 6 columns):
 #   Column    Non-Null Count  Dtype         
---  ------    --------------  -----         
 0   title     92 non-null     object        
 1   url       92 non-null     object        
 2   watchnum  92 non-null     int64         
 3   dm        92 non-null     int64         
 4   uptime    92 non-null     datetime64[ns]
 5   upname    92 non-null     object        
dtypes: datetime64[ns](1), int64(2), object(3)
memory usage: 5.0+ KB
# 通過運算式篩選
# obj.query(篩選條件)
df.query('watchnum >= 1000 and uptime >="2021-1-1"').info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 92 entries, 0 to 1425
Data columns (total 6 columns):
 #   Column    Non-Null Count  Dtype         
---  ------    --------------  -----         
 0   title     92 non-null     object        
 1   url       92 non-null     object        
 2   watchnum  92 non-null     int64         
 3   dm        92 non-null     int64         
 4   uptime    92 non-null     datetime64[ns]
 5   upname    92 non-null     object        
dtypes: datetime64[ns](1), int64(2), object(3)
memory usage: 5.0+ KB
# 根據播放量排序
# obj.sort_values(by=[列1,列2...],ascending = True/False) 默認為True升序
temp.sort_values(by=['watchnum','dm'],ascending=False)
titleurlwatchnumdmuptimeupname
459【公開課】復旦大學:資本論 王德峰(全28講)//www.bilibili.com/video/BV1Vp4y1x7F9?from=search109900042992021-01-19農夫CC
486【公開課】北京大學:中國經濟 林毅夫(全12講)//www.bilibili.com/video/BV1hK4y157dt?from=search2350005612021-01-14農夫CC
403【公開課】溫鐵軍:中國經濟研究(8講)//www.bilibili.com/video/BV1kp4y1W7u8?from=search1060005232021-01-27農夫CC
448【公開課】溫鐵軍:中國經濟研究(8講)//www.bilibili.com/video/BV1kp4y1W7u8?from=search1060005232021-01-27農夫CC
396【公開課】加州大學洛杉磯分校:親密關系(全17講)//www.bilibili.com/video/BV1xU4y147hJ?from=search65000792021-01-21農夫CC
.....................
811【芝加哥大學】 理解全球經濟 全11講//www.bilibili.com/video/BV1nr4y1M7Fd?from=search118902021-01-24學習黨加油站
9232021年小黑老師計算機二級最新考點----替換考點匯總//www.bilibili.com/video/BV1UU4y1s7Tq?from=search117302021-02-01愛家伙的小學習
1220編程課堂:按鍵的前世今生學不會,不存在的,//www.bilibili.com/video/BV1nK4y1W7bU?from=search115732021-01-12三月課堂
20【生活篇】UCLA本科生帶你了解加州大學課程設定與畢業要求//www.bilibili.com/video/BV1qt4y1r7Y3?from=search110782021-01-09未必存在的真理
1425【文學批評的方法與實踐】華中師范大學 胡亞敏(合6講)//www.bilibili.com/video/BV1jr4y1M7Hd?from=search100302021-01-27語文教學助手

92 rows × 6 columns

temp1 = temp.drop(columns='upname')
temp1
titleurlwatchnumdmuptime
0阿里云大學課程(云計算、中間件、大資料、云安全)//www.bilibili.com/video/BV1Lv411s7wu?from=search295442021-01-21
20【生活篇】UCLA本科生帶你了解加州大學課程設定與畢業要求//www.bilibili.com/video/BV1qt4y1r7Y3?from=search110782021-01-09
374【公開課】南開大學:中華詩詞 葉嘉瑩(20講)//www.bilibili.com/video/BV1Vo4y1d7Pe?from=search493742021-02-10
384【公開課】南開大學:中華詩詞 葉嘉瑩(20講)//www.bilibili.com/video/BV1Vo4y1d7Pe?from=search493742021-02-10
387【公開課】啟功:中華書法(全4講)//www.bilibili.com/video/BV1FV411i7fV?from=search9777122021-02-11
..................
1299蘇德礦教授談如何學好微積分—礦爺在丹青有約2021.1.7直播//www.bilibili.com/video/BV1dh41117yy?from=search119602021-01-07
1412【中英字幕】曼徹斯特大學Advanced Microeconomics 課程//www.bilibili.com/video/BV1bX4y1K799?from=search842922021-01-19
1417《數字無線電系統基礎》32講-電子科技大學-陳祝明【通信專題】//www.bilibili.com/video/BV1Ci4y1F7tU?from=search3958142021-01-05
1422西安交通大學《電路》趙進全100講//www.bilibili.com/video/BV1Z54y1x7ZK?from=search220532021-01-11
1425【文學批評的方法與實踐】華中師范大學 胡亞敏(合6講)//www.bilibili.com/video/BV1jr4y1M7Hd?from=search100302021-01-27

92 rows × 5 columns

# 判斷是否存在重復值
# temp.duplicated('url')
# 去重
temp.drop_duplicates('url')
titleurlwatchnumdmuptimeupname
0阿里云大學課程(云計算、中間件、大資料、云安全)//www.bilibili.com/video/BV1Lv411s7wu?from=search295442021-01-21韭菜滾雪球
20【生活篇】UCLA本科生帶你了解加州大學課程設定與畢業要求//www.bilibili.com/video/BV1qt4y1r7Y3?from=search110782021-01-09未必存在的真理
374【公開課】南開大學:中華詩詞 葉嘉瑩(20講)//www.bilibili.com/video/BV1Vo4y1d7Pe?from=search493742021-02-10農夫CC
387【公開課】啟功:中華書法(全4講)//www.bilibili.com/video/BV1FV411i7fV?from=search9777122021-02-11農夫CC
392所以你記住物價這個詞了嘛!//www.bilibili.com/video/BV1f54y1Y7JY?from=search214002021-02-25大阪外語學院
.....................
1299蘇德礦教授談如何學好微積分—礦爺在丹青有約2021.1.7直播//www.bilibili.com/video/BV1dh41117yy?from=search119602021-01-07穩及閣大學士
1412【中英字幕】曼徹斯特大學Advanced Microeconomics 課程//www.bilibili.com/video/BV1bX4y1K799?from=search842922021-01-19楊浦區老實人
1417《數字無線電系統基礎》32講-電子科技大學-陳祝明【通信專題】//www.bilibili.com/video/BV1Ci4y1F7tU?from=search3958142021-01-05成電電子科協
1422西安交通大學《電路》趙進全100講//www.bilibili.com/video/BV1Z54y1x7ZK?from=search220532021-01-11物語終焉2021
1425【文學批評的方法與實踐】華中師范大學 胡亞敏(合6講)//www.bilibili.com/video/BV1jr4y1M7Hd?from=search100302021-01-27語文教學助手

83 rows × 6 columns

def normalize_url(url):
    if not url.startswith('https'):
        return 'https:' + url
    return url
df['url'] = df['url'].apply(normalize_url)
df
titleurlwatchnumdmuptimeupname
0阿里云大學課程(云計算、中間件、大資料、云安全)https://www.bilibili.com/video/BV1Lv411s7wu?fr...295442021-01-21韭菜滾雪球
1視覺傳達設計專業的小朋友大學課程有哪些,強度怎么樣,需要什么技能?學姐給新生的解答與建議https://www.bilibili.com/video/BV1Ea4y1a7CX?fr...352682020-07-25鏵仔仔兒的奮斗史
2CAP:適合高中生的大學課程(上大學之前提前學習大學的課程)同濟大學《微積分CAP》https://www.bilibili.com/video/BV1X4411Y7u8?fr...5597172019-05-11愚甘雜貨鋪
3干貨!論文讀寫系列|寫作風格:例文決議(1)|人文社科|教育學|大學課程、知識https://www.bilibili.com/video/BV1VC4y1b7ZA?fr...11000292020-07-26cici西西熙熙
4《用戶體驗與心理-第1期》大學課程https://www.bilibili.com/video/BV1r7411M7gY?fr...137392020-02-24Luka老師
.....................
1902【中國石油大學】構造地質學(第1-2章) ——主講:李理老師https://www.bilibili.com/video/BV1Y4411x7sE?fr...409752019-05-02點點滴滴Super
1903【模電】模擬電子技識訓礎【四】https://www.bilibili.com/video/BV1sb411v7E6?fr...5997112019-03-08干脆的非洲鼓
1904【模電】模擬電子技識訓礎【三】https://www.bilibili.com/video/BV1Rb411i7yo?fr...471382019-03-05干脆的非洲鼓
1905結構化學-東北大學-王軍https://www.bilibili.com/video/BV1yb411t7Mb?fr...583522019-02-28萬萬萬萬不能慫
1906《結構化學》南開大學-孫宏偉 重點難點決議https://www.bilibili.com/video/BV1yt411t7UG?fr...528762019-01-28阿bu愛學習

1907 rows × 6 columns

Example 2

df1 = pd.read_csv('../files/data/lagou.csv',encoding = 'utf-8',index_col='no')
df1.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3140 entries, 0 to 3139
Data columns (total 51 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   _id                    3140 non-null   object 
 1   adWord                 3140 non-null   int64  
 2   appShow                3140 non-null   int64  
 3   approve                3140 non-null   int64  
 4   businessZones          1544 non-null   object 
 5   city                   3140 non-null   object 
 6   companyFullName        3140 non-null   object 
 7   companyId              3140 non-null   int64  
 8   companyLabelList       3140 non-null   object 
 9   companyLogo            3139 non-null   object 
 10  companyShortName       3140 non-null   object 
 11  companySize            3140 non-null   object 
 12  createTime             3140 non-null   object 
 13  deliver                3140 non-null   int64  
 14  district               3133 non-null   object 
 15  education              3140 non-null   object 
 16  explain                0 non-null      float64
 17  financeStage           3140 non-null   object 
 18  firstType              3140 non-null   object 
 19  formatCreateTime       3140 non-null   object 
 20  gradeDescription       0 non-null      float64
 21  hitags                 260 non-null    object 
 22  imState                3140 non-null   object 
 23  industryField          3140 non-null   object 
 24  industryLables         3140 non-null   object 
 25  isHotHire              3140 non-null   int64  
 26  isSchoolJob            3140 non-null   int64  
 27  jobNature              3140 non-null   object 
 28  lastLogin              3140 non-null   object 
 29  latitude               3133 non-null   float64
 30  linestaion             2403 non-null   object 
 31  longitude              3133 non-null   float64
 32  pcShow                 3140 non-null   int64  
 33  plus                   0 non-null      float64
 34  positionAdvantage      3140 non-null   object 
 35  positionId             3140 non-null   int64  
 36  positionLables         3140 non-null   object 
 37  positionName           3140 non-null   object 
 38  promotionScoreExplain  0 non-null      float64
 39  publisherId            3140 non-null   int64  
 40  resumeProcessDay       3140 non-null   int64  
 41  resumeProcessRate      3140 non-null   int64  
 42  salary                 3140 non-null   object 
 43  score                  3140 non-null   int64  
 44  secondType             3140 non-null   object 
 45  skillLables            3140 non-null   object 
 46  stationname            2403 non-null   object 
 47  subwayline             2403 non-null   object 
 48  thirdType              3140 non-null   object 
 49  workYear               3140 non-null   object 
 50  job_detail             1513 non-null   object 
dtypes: float64(6), int64(13), object(32)
memory usage: 1.2+ MB
pd.set_option('max_columns', None)
df1.head()
_idadWordappShowapprovebusinessZonescitycompanyFullNamecompanyIdcompanyLabelListcompanyLogocompanyShortNamecompanySizecreateTimedeliverdistricteducationexplainfinanceStagefirstTypeformatCreateTimegradeDescriptionhitagsimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginlatitudelinestaionlongitudepcShowpluspositionAdvantagepositionIdpositionLablespositionNamepromotionScoreExplainpublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesstationnamesubwaylinethirdTypeworkYearjob_detail
no
05de5e75734e608e63026c1bc901['亦莊']北京達疆網路科技(上海)有限公司32836['年底雙薪', '績效獎金', '崗位晉升', '定期體檢']i/image2/M01/AF/7F/CgotOV3kqOqAZvWrAAAaonXDCck...達達-京東到家2000人以上2019-12-02 20:38:250大興區本科NaND輪及以上產品|需求|專案類1天前發布NaN['免費班車', '新婚紅包', '定期調薪', '電腦補貼', '生子紅包', '地鐵周邊...today消費生活[]00全職2019-12-03 10:33:0739.795747亦莊線_萬源街;亦莊線_榮京東街116.5104420NaN成長快、氛圍好、領導好6638350['BI', '資料分析']資料分析崗NaN7855636110015k-30k0資料分析['BI', '資料分析']萬源街亦莊線BI3-5年1 、負責o2o電商日常運營資料的統計, 監控, 梳理指標體系;||2、基于海量用戶行為資料...
15de5e75734e608e63026c1bd001NaN北京北京音娛時光科技有限公司286568['年底雙薪', '績效獎金', '帶薪年假', '免費健身']i/image2/M01/8B/9A/CgotOV15uyKAMCL3AAAvAzXIrFw...音娛時光50-150人2019-12-03 11:23:350海淀區本科NaNA輪產品|需求|專案類11:23發布NaNNaNtoday移動互聯網[]00全職2019-12-03 11:23:3839.97755510號線_知春路;10號線_西土城;13號線_大鐘寺;13號線_知春路116.3521450NaN技術大牛多;免費餐飲;氛圍好;6263661['SQL', 'BI', 'SPSS']資料分析NaN12147286110010k-18k0資料分析['SQL', 'BI', 'SPSS']知春路10號線資料分析1-3年職責描述:||1. 完善業務資料監控體系,進行新功能指標埋點邏輯設計,搭建分析框架,...
25de5e75734e608e63026c1be001['西北旺']北京北京千喜鶴餐飲管理有限公司278964[]i/image2/M00/15/70/CgotOVn0PGWACXyxAAA4aF7GFgk...千喜鶴2000人以上2019-12-03 10:35:090海淀區本科NaN未融資產品|需求|專案類10:35發布NaNNaNtoday消費生活['移動互聯網', '視頻', 'SQL']00全職2019-12-03 11:08:3440.06675716號線_永豐;16號線_永豐南116.2495810NaN福利好,五險一金,住房補助6660141['移動互聯網', '視頻', 'SQL']資料分析NaN64368580020k-30k0資料分析['SQL', '資料分析']永豐16號線資料分析3-5年作業職責:||1.負責根據業務目標,制定并執行產品或業務的運營資料監控與分析機制,||2.完...
35de5e75734e608e63026c1bf000NaN北京吉林省海生電子商務有限公司399744[]images/logo_default.png吉林省海生電子商務有限公司少于15人2019-12-03 10:35:560朝陽區本科NaN不需要融資產品|需求|專案類10:35發布NaNNaNtoday電商['其他']00全職2019-12-03 10:30:3740.042254NaN116.2910270NaN五險一金6660148['其他']資料分析NaN109787490033k-50k0資料分析['資料分析']NaNNaN資料分析3-5年1.基于對業務的支持和理解,搭建出可以準確反映業務運作狀況的資料指標體系;||2.商業嗅覺靈...
45de5e75734e608e63026c1c0000['大望路', '建外大街', '南磨房']北京韋博網訊科技(北京)有限公司580170[]i/image2/M01/41/6C/CgoB5lz3eJGAYy2MAACd7SzHgKw...WPIC50-150人2019-12-03 12:10:220朝陽區本科NaN未融資產品|需求|專案類12:10發布NaNNaNtoday電商,軟體開發['電商']00全職2019-12-03 11:54:2239.9070881號線_國貿;1號線_大望路;10號線_國貿;14號線東段_大望路116.4763900NaN待遇優厚 ,良好的發展前景6590101['電商']資料分析NaN132131010010k-15k0資料分析['資料分析']國貿1號線產品|需求|專案類1-3年職責描述:||1. 調研作業以客戶需求為主導;||2. 根據市場調研計劃,進行市場資訊的收集...
df1.dropna(axis = 1,inplace=True)
df1
_idadWordappShowapprovecitycompanyFullNamecompanyIdcompanyLabelListcompanyShortNamecompanySizecreateTimedelivereducationfinanceStagefirstTypeformatCreateTimeimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginpcShowpositionAdvantagepositionIdpositionLablespositionNamepublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesthirdTypeworkYear
no
05de5e75734e608e63026c1bc901北京達疆網路科技(上海)有限公司32836['年底雙薪', '績效獎金', '崗位晉升', '定期體檢']達達-京東到家2000人以上2019-12-02 20:38:250本科D輪及以上產品|需求|專案類1天前發布today消費生活[]00全職2019-12-03 10:33:070成長快、氛圍好、領導好6638350['BI', '資料分析']資料分析崗7855636110015k-30k0資料分析['BI', '資料分析']BI3-5年
15de5e75734e608e63026c1bd001北京北京音娛時光科技有限公司286568['年底雙薪', '績效獎金', '帶薪年假', '免費健身']音娛時光50-150人2019-12-03 11:23:350本科A輪產品|需求|專案類11:23發布today移動互聯網[]00全職2019-12-03 11:23:380技術大牛多;免費餐飲;氛圍好;6263661['SQL', 'BI', 'SPSS']資料分析12147286110010k-18k0資料分析['SQL', 'BI', 'SPSS']資料分析1-3年
25de5e75734e608e63026c1be001北京北京千喜鶴餐飲管理有限公司278964[]千喜鶴2000人以上2019-12-03 10:35:090本科未融資產品|需求|專案類10:35發布today消費生活['移動互聯網', '視頻', 'SQL']00全職2019-12-03 11:08:340福利好,五險一金,住房補助6660141['移動互聯網', '視頻', 'SQL']資料分析64368580020k-30k0資料分析['SQL', '資料分析']資料分析3-5年
35de5e75734e608e63026c1bf000北京吉林省海生電子商務有限公司399744[]吉林省海生電子商務有限公司少于15人2019-12-03 10:35:560本科不需要融資產品|需求|專案類10:35發布today電商['其他']00全職2019-12-03 10:30:370五險一金6660148['其他']資料分析109787490033k-50k0資料分析['資料分析']資料分析3-5年
45de5e75734e608e63026c1c0000北京韋博網訊科技(北京)有限公司580170[]WPIC50-150人2019-12-03 12:10:220本科未融資產品|需求|專案類12:10發布today電商,軟體開發['電商']00全職2019-12-03 11:54:220待遇優厚 ,良好的發展前景6590101['電商']資料分析132131010010k-15k0資料分析['資料分析']產品|需求|專案類1-3年
..................................................................................................................
31355de5ea1134e608e63026cdfb001天津清博津商(天津)教育科技有限公司260578[]清博津商15-50人2019-11-13 15:55:550不限不需要融資運營|編輯|客服類2019-11-13overSevenDays資料服務,教育[]01兼職2019-11-13 15:55:450大資料行業優勢,作業氛圍好6579749['審核', '內容審核', '資訊']審核實習生(春節短期)8913003001k-2k0審核['審核', '內容審核', '資訊']資訊審核應屆畢業生
31365de5ea1134e608e63026cdfc001天津上海禮紫股權投資基金管理有限公司264817[]禮紫股權投資500-2000人2019-11-04 09:02:040不限未融資運營|編輯|客服類2019-11-04overSevenDays金融['社交', '運營']00全職2019-11-14 16:23:360旅游團建、內部晉升、待遇優厚、提供住宿6270749['社交', '運營']運營助理9535048006k-8k0運營['運營']運營助理|專員不限
31375de5ea1134e608e63026cdfd001天津北京達佳互聯資訊技術有限公司1880['股票期權', '彈性作業', '定期體檢', '崗位晉升']快手2000人以上2019-12-03 10:16:280本科D輪及以上運營|編輯|客服類10:16發布today文娛丨內容[]00全職2019-12-03 10:01:370五險一金,績效獎金,餐補,房補5051153['運營', '用戶運營']運營編輯團隊leader10506720008k-15k0運營['運營', '用戶運營']用戶運營3-5年
31385de5ea1134e608e63026cdfe001天津北京河貍家資訊技術有限公司25854['高配福利', '彈性時間', 'BAT¥', '逗逼伙伴']河貍家500-2000人2019-12-02 17:03:540不限C輪運營|編輯|客服類1天前發布today移動互聯網['電商', '商家運營']00全職2019-12-03 11:25:100五險一金6624059['電商', '商家運營']商家運營-天津14725914316k-8k0運營['商家運營']商家運營不限
31395de5ea1134e608e63026cdff001天津北京河貍家資訊技術有限公司25854['高配福利', '彈性時間', 'BAT¥', '逗逼伙伴']河貍家500-2000人2019-12-02 17:03:560本科C輪運營|編輯|客服類1天前發布today移動互聯網['移動互聯網']01全職2019-12-03 11:25:100轉正機會6633633['移動互聯網']運營實習生-天津14725914312k-4k0運營[]運營助理|專員應屆畢業生

3140 rows × 37 columns

df1.drop(columns = ['_id','adWord','appShow','approve','deliver'],inplace=True)
df1
citycompanyFullNamecompanyIdcompanyLabelListcompanyShortNamecompanySizecreateTimeeducationfinanceStagefirstTypeformatCreateTimeimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginpcShowpositionAdvantagepositionIdpositionLablespositionNamepublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesthirdTypeworkYear
no
0北京達疆網路科技(上海)有限公司32836['年底雙薪', '績效獎金', '崗位晉升', '定期體檢']達達-京東到家2000人以上2019-12-02 20:38:25本科D輪及以上產品|需求|專案類1天前發布today消費生活[]00全職2019-12-03 10:33:070成長快、氛圍好、領導好6638350['BI', '資料分析']資料分析崗7855636110015k-30k0資料分析['BI', '資料分析']BI3-5年
1北京北京音娛時光科技有限公司286568['年底雙薪', '績效獎金', '帶薪年假', '免費健身']音娛時光50-150人2019-12-03 11:23:35本科A輪產品|需求|專案類11:23發布today移動互聯網[]00全職2019-12-03 11:23:380技術大牛多;免費餐飲;氛圍好;6263661['SQL', 'BI', 'SPSS']資料分析12147286110010k-18k0資料分析['SQL', 'BI', 'SPSS']資料分析1-3年
2北京北京千喜鶴餐飲管理有限公司278964[]千喜鶴2000人以上2019-12-03 10:35:09本科未融資產品|需求|專案類10:35發布today消費生活['移動互聯網', '視頻', 'SQL']00全職2019-12-03 11:08:340福利好,五險一金,住房補助6660141['移動互聯網', '視頻', 'SQL']資料分析64368580020k-30k0資料分析['SQL', '資料分析']資料分析3-5年
3北京吉林省海生電子商務有限公司399744[]吉林省海生電子商務有限公司少于15人2019-12-03 10:35:56本科不需要融資產品|需求|專案類10:35發布today電商['其他']00全職2019-12-03 10:30:370五險一金6660148['其他']資料分析109787490033k-50k0資料分析['資料分析']資料分析3-5年
4北京韋博網訊科技(北京)有限公司580170[]WPIC50-150人2019-12-03 12:10:22本科未融資產品|需求|專案類12:10發布today電商,軟體開發['電商']00全職2019-12-03 11:54:220待遇優厚 ,良好的發展前景6590101['電商']資料分析132131010010k-15k0資料分析['資料分析']產品|需求|專案類1-3年
...................................................................................................
3135天津清博津商(天津)教育科技有限公司260578[]清博津商15-50人2019-11-13 15:55:55不限不需要融資運營|編輯|客服類2019-11-13overSevenDays資料服務,教育[]01兼職2019-11-13 15:55:450大資料行業優勢,作業氛圍好6579749['審核', '內容審核', '資訊']審核實習生(春節短期)8913003001k-2k0審核['審核', '內容審核', '資訊']資訊審核應屆畢業生
3136天津上海禮紫股權投資基金管理有限公司264817[]禮紫股權投資500-2000人2019-11-04 09:02:04不限未融資運營|編輯|客服類2019-11-04overSevenDays金融['社交', '運營']00全職2019-11-14 16:23:360旅游團建、內部晉升、待遇優厚、提供住宿6270749['社交', '運營']運營助理9535048006k-8k0運營['運營']運營助理|專員不限
3137天津北京達佳互聯資訊技術有限公司1880['股票期權', '彈性作業', '定期體檢', '崗位晉升']快手2000人以上2019-12-03 10:16:28本科D輪及以上運營|編輯|客服類10:16發布today文娛丨內容[]00全職2019-12-03 10:01:370五險一金,績效獎金,餐補,房補5051153['運營', '用戶運營']運營編輯團隊leader10506720008k-15k0運營['運營', '用戶運營']用戶運營3-5年
3138天津北京河貍家資訊技術有限公司25854['高配福利', '彈性時間', 'BAT¥', '逗逼伙伴']河貍家500-2000人2019-12-02 17:03:54不限C輪運營|編輯|客服類1天前發布today移動互聯網['電商', '商家運營']00全職2019-12-03 11:25:100五險一金6624059['電商', '商家運營']商家運營-天津14725914316k-8k0運營['商家運營']商家運營不限
3139天津北京河貍家資訊技術有限公司25854['高配福利', '彈性時間', 'BAT¥', '逗逼伙伴']河貍家500-2000人2019-12-02 17:03:56本科C輪運營|編輯|客服類1天前發布today移動互聯網['移動互聯網']01全職2019-12-03 11:25:100轉正機會6633633['移動互聯網']運營實習生-天津14725914312k-4k0運營[]運營助理|專員應屆畢業生

3140 rows × 32 columns

# 找出熱招崗位
df1[df1.isHotHire == 1]
citycompanyFullNamecompanyIdcompanyLabelListcompanyShortNamecompanySizecreateTimeeducationfinanceStagefirstTypeformatCreateTimeimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginpcShowpositionAdvantagepositionIdpositionLablespositionNamepublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesthirdTypeworkYear
no
# 融資階段D輪及以上的招聘崗位
# 判斷某字串中是否含有某字符(模糊查詢)
df1[df1.financeStage.str.contains('D')]
citycompanyFullNamecompanyIdcompanyLabelListcompanyShortNamecompanySizecreateTimeeducationfinanceStagefirstTypeformatCreateTimeimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginpcShowpositionAdvantagepositionIdpositionLablespositionNamepublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesthirdTypeworkYear
no
0北京達疆網路科技(上海)有限公司32836['年底雙薪', '績效獎金', '崗位晉升', '定期體檢']達達-京東到家2000人以上2019-12-02 20:38:25本科D輪及以上產品|需求|專案類1天前發布today消費生活[]00全職2019-12-03 10:33:070成長快、氛圍好、領導好6638350['BI', '資料分析']資料分析崗7855636110015k-30k0資料分析['BI', '資料分析']BI3-5年
10北京貝殼找房(北京)科技有限公司55446['股票期權', '帶薪年假', '績效獎金', '扁平管理']貝殼2000人以上2019-12-03 10:29:26本科D輪及以上開發|測驗|運維類10:29發布today房產家居['房產服務', '本地生活', '資料挖掘', '資料分析', '資料處理']00全職2019-12-03 10:29:230福利好,成長高6217427['房產服務', '本地生活', '資料挖掘', '資料分析', '資料處理']資料分析經理97529401530k-50k0資料開發['資料挖掘', '資料分析', '資料處理']資料分析5-10年
13北京貝殼找房(北京)科技有限公司55446['股票期權', '帶薪年假', '績效獎金', '扁平管理']貝殼2000人以上2019-12-03 10:29:28本科D輪及以上開發|測驗|運維類10:29發布today房產家居[]00全職2019-12-03 10:29:230福利好,成長高6186927['資料分析', '資料處理']資深資料分析師97529401530k-50k0資料開發['資料分析', '資料處理']資料分析5-10年
14北京達疆網路科技(上海)有限公司32836['年底雙薪', '績效獎金', '崗位晉升', '定期體檢']達達-京東到家2000人以上2019-12-02 20:38:25本科D輪及以上產品|需求|專案類1天前發布today消費生活[]00全職2019-12-03 10:33:070成長快、氛圍好、領導好6638350['BI', '資料分析']資料分析崗7855636110015k-30k0資料分析['BI', '資料分析']BI3-5年
18北京達疆網路科技(上海)有限公司32836['年底雙薪', '績效獎金', '崗位晉升', '定期體檢']達達-京東到家2000人以上2019-12-02 20:38:25本科D輪及以上產品|需求|專案類1天前發布today消費生活[]00全職2019-12-03 10:33:070成長快、氛圍好、領導好5828609['BI', 'SQL', 'SPSS']資料分析師7855636110020k-30k0資料分析['BI', 'SQL', 'SPSS']資料分析3-5年
...................................................................................................
3091天津北京小唱科技有限公司5026['節日禮物', '股票期權', '帶薪年假', '員工海外游']唱吧-手機里的KTV150-500人2019-11-29 13:32:23大專D輪及以上運營|編輯|客服類2019-11-29today移動互聯網,游戲[]00全職2019-12-03 11:12:180年終獎 福利好 彈性作業時間6647762['質檢']質檢專員495421405k-7k0客服['質檢']客服不限
3104天津天津鏈家寶業房地產經紀有限公司北城街店496665[]天津鏈家地產2000人以上2019-11-29 17:01:27本科D輪及以上銷售類2019-11-29today其他['房產服務', '大資料', '客戶代表', '區域銷售', '電話銷售', '市場拓展']00全職2019-12-02 19:04:590底薪5000 全國連鎖企業 發展前景大5546662['房產服務', '大資料', '客戶代表', '區域銷售', '電話銷售', '市場拓展']高級經紀人12344930006k-12k0銷售['客戶代表', '區域銷售', '電話銷售', '市場拓展']銷售顧問不限
3120天津北京每日優鮮電子商務有限公司39934['六險一金', '股票期權', '快速晉升', '年度體檢']每日優鮮2000人以上2019-11-13 21:25:02本科D輪及以上貿易|批發|零售|租賃業2019-11-13sevenDays移動互聯網,電商['電商', '移動互聯網']00全職2019-11-26 21:04:530五險一金,帶薪年假,餐補,節日禮品6484735['電商', '移動互聯網']天津商品采購11702595110015k-25k0采購[]買手3-5年
3121天津北京每日優鮮電子商務有限公司39934['六險一金', '股票期權', '快速晉升', '年度體檢']每日優鮮2000人以上2019-11-13 21:25:02本科D輪及以上貿易|批發|零售|租賃業2019-11-13sevenDays移動互聯網,電商['移動互聯網', '本地生活']00全職2019-11-26 21:04:530五險一金,帶薪年假,餐補,節日禮品6484666['移動互聯網', '本地生活']天津商品采購(果蔬、食材、食品)11702595110015k-20k0采購[]買手3-5年
3137天津北京達佳互聯資訊技術有限公司1880['股票期權', '彈性作業', '定期體檢', '崗位晉升']快手2000人以上2019-12-03 10:16:28本科D輪及以上運營|編輯|客服類10:16發布today文娛丨內容[]00全職2019-12-03 10:01:370五險一金,績效獎金,餐補,房補5051153['運營', '用戶運營']運營編輯團隊leader10506720008k-15k0運營['運營', '用戶運營']用戶運營3-5年

235 rows × 32 columns

# 資料分析崗位
temp1 = df1[df1.positionName.str.contains('資料分析')]
temp1
citycompanyFullNamecompanyIdcompanyLabelListcompanyShortNamecompanySizecreateTimeeducationfinanceStagefirstTypeformatCreateTimeimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginpcShowpositionAdvantagepositionIdpositionLablespositionNamepublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesthirdTypeworkYear
no
0北京達疆網路科技(上海)有限公司32836['年底雙薪', '績效獎金', '崗位晉升', '定期體檢']達達-京東到家2000人以上2019-12-02 20:38:25本科D輪及以上產品|需求|專案類1天前發布today消費生活[]00全職2019-12-03 10:33:070成長快、氛圍好、領導好6638350['BI', '資料分析']資料分析崗7855636110015k-30k0資料分析['BI', '資料分析']BI3-5年
1北京北京音娛時光科技有限公司286568['年底雙薪', '績效獎金', '帶薪年假', '免費健身']音娛時光50-150人2019-12-03 11:23:35本科A輪產品|需求|專案類11:23發布today移動互聯網[]00全職2019-12-03 11:23:380技術大牛多;免費餐飲;氛圍好;6263661['SQL', 'BI', 'SPSS']資料分析12147286110010k-18k0資料分析['SQL', 'BI', 'SPSS']資料分析1-3年
2北京北京千喜鶴餐飲管理有限公司278964[]千喜鶴2000人以上2019-12-03 10:35:09本科未融資產品|需求|專案類10:35發布today消費生活['移動互聯網', '視頻', 'SQL']00全職2019-12-03 11:08:340福利好,五險一金,住房補助6660141['移動互聯網', '視頻', 'SQL']資料分析64368580020k-30k0資料分析['SQL', '資料分析']資料分析3-5年
3北京吉林省海生電子商務有限公司399744[]吉林省海生電子商務有限公司少于15人2019-12-03 10:35:56本科不需要融資產品|需求|專案類10:35發布today電商['其他']00全職2019-12-03 10:30:370五險一金6660148['其他']資料分析109787490033k-50k0資料分析['資料分析']資料分析3-5年
4北京韋博網訊科技(北京)有限公司580170[]WPIC50-150人2019-12-03 12:10:22本科未融資產品|需求|專案類12:10發布today電商,軟體開發['電商']00全職2019-12-03 11:54:220待遇優厚 ,良好的發展前景6590101['電商']資料分析132131010010k-15k0資料分析['資料分析']產品|需求|專案類1-3年
...................................................................................................
3065天津北京達佳互聯資訊技術有限公司1880['股票期權', '彈性作業', '定期體檢', '崗位晉升']快手2000人以上2019-12-03 10:16:29本科D輪及以上產品|需求|專案類10:16發布today文娛丨內容['視頻', '直播', '資料分析', '資料運營', '可視化']00全職2019-12-03 10:01:370福利待遇 平臺發展 公司規模5605166['視頻', '直播', '資料分析', '資料運營', '可視化']資料分析專員10506720008k-10k0資料分析['資料分析', '資料運營', '可視化']資料分析1-3年
3069天津林之尚沃(天津)國際貿易有限公司195673[]林之尚沃15-50人2019-12-03 09:37:31本科不需要融資產品|需求|專案類09:37發布today醫療丨健康['大資料', '工具軟體', '資料分析', '資料運營', 'BI', '資料庫']00全職2019-12-03 09:31:300節假日福利 團建活動 零食飲料6654011['大資料', '工具軟體', '資料分析', '資料運營', 'BI', '資料庫']資料分析專員92080742786k-10k0資料分析['資料分析', '資料運營', 'BI', '資料庫']資料分析1-3年
3070天津林之尚沃(天津)國際貿易有限公司195673[]林之尚沃15-50人2019-12-03 09:37:31本科不需要融資產品|需求|專案類09:37發布today醫療丨健康['新零售', '資料運營', '資料分析']00兼職2019-12-03 09:31:300節假日福利 團建活動 零食飲料6485218['新零售', '資料運營', '資料分析']資料分析實習生92080742782k-4k0資料分析['資料運營', '資料分析']商業不限
3071天津西安格蒂電力有限公司45678['技能培訓', '帶薪年假', '績效獎金', '崗位晉升']格蒂電力500-2000人2019-12-03 07:19:26大專未融資開發|測驗|運維類07:19發布today企業服務[]00全職2019-12-03 07:18:230上市公司,福利待遇優厚,職業發展空間廣闊6635415['資料分析', 'Oracle', 'ETL', '資料挖掘']ETL/大資料/資料分析/實施15229043136k-12k0資料開發['資料分析', 'Oracle', 'ETL', '資料挖掘']ETL3-5年
3088天津谷川聯行有限公司36984['年底雙薪', '技能培訓', '帶薪年假', '績效獎金']谷川聯行150-500人2019-11-26 08:42:40本科不需要融資開發|測驗|運維類2019-11-26today軟體開發,企業服務['大資料', 'MySQL', '資料倉庫', '資料分析', 'ETL']00全職2019-12-03 11:15:170發展空間大 福利待遇高 周末雙休6638504['大資料', 'MySQL', '資料倉庫', '資料分析', 'ETL']BI工程師/資料分析師(天津)65172611008k-12k0資料開發['MySQL', '資料倉庫', '資料分析', 'ETL']BI工程師不限

1515 rows × 32 columns

df1['year'] = pd.to_datetime(df1['createTime']).dt.year
df1['month'] = pd.to_datetime(df1['createTime']).dt.month
df1['day'] = pd.to_datetime(df1['createTime']).dt.day
df1['weekday'] = pd.to_datetime(df1['createTime']).dt.weekday  # 0 - 星期一
df1
citycompanyFullNamecompanyIdcompanyLabelListcompanyShortNamecompanySizecreateTimeeducationfinanceStagefirstTypeformatCreateTimeimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginpcShowpositionAdvantagepositionIdpositionLablespositionNamepublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesthirdTypeworkYearyearmonthdayweekday
no
0北京達疆網路科技(上海)有限公司32836['年底雙薪', '績效獎金', '崗位晉升', '定期體檢']達達-京東到家2000人以上2019-12-02 20:38:25本科D輪及以上產品|需求|專案類1天前發布today消費生活[]00全職2019-12-03 10:33:070成長快、氛圍好、領導好6638350['BI', '資料分析']資料分析崗7855636110015k-30k0資料分析['BI', '資料分析']BI3-5年20191220
1北京北京音娛時光科技有限公司286568['年底雙薪', '績效獎金', '帶薪年假', '免費健身']音娛時光50-150人2019-12-03 11:23:35本科A輪產品|需求|專案類11:23發布today移動互聯網[]00全職2019-12-03 11:23:380技術大牛多;免費餐飲;氛圍好;6263661['SQL', 'BI', 'SPSS']資料分析12147286110010k-18k0資料分析['SQL', 'BI', 'SPSS']資料分析1-3年20191231
2北京北京千喜鶴餐飲管理有限公司278964[]千喜鶴2000人以上2019-12-03 10:35:09本科未融資產品|需求|專案類10:35發布today消費生活['移動互聯網', '視頻', 'SQL']00全職2019-12-03 11:08:340福利好,五險一金,住房補助6660141['移動互聯網', '視頻', 'SQL']資料分析64368580020k-30k0資料分析['SQL', '資料分析']資料分析3-5年20191231
3北京吉林省海生電子商務有限公司399744[]吉林省海生電子商務有限公司少于15人2019-12-03 10:35:56本科不需要融資產品|需求|專案類10:35發布today電商['其他']00全職2019-12-03 10:30:370五險一金6660148['其他']資料分析109787490033k-50k0資料分析['資料分析']資料分析3-5年20191231
4北京韋博網訊科技(北京)有限公司580170[]WPIC50-150人2019-12-03 12:10:22本科未融資產品|需求|專案類12:10發布today電商,軟體開發['電商']00全職2019-12-03 11:54:220待遇優厚 ,良好的發展前景6590101['電商']資料分析132131010010k-15k0資料分析['資料分析']產品|需求|專案類1-3年20191231
...............................................................................................................
3135天津清博津商(天津)教育科技有限公司260578[]清博津商15-50人2019-11-13 15:55:55不限不需要融資運營|編輯|客服類2019-11-13overSevenDays資料服務,教育[]01兼職2019-11-13 15:55:450大資料行業優勢,作業氛圍好6579749['審核', '內容審核', '資訊']審核實習生(春節短期)8913003001k-2k0審核['審核', '內容審核', '資訊']資訊審核應屆畢業生201911132
3136天津上海禮紫股權投資基金管理有限公司264817[]禮紫股權投資500-2000人2019-11-04 09:02:04不限未融資運營|編輯|客服類2019-11-04overSevenDays金融['社交', '運營']00全職2019-11-14 16:23:360旅游團建、內部晉升、待遇優厚、提供住宿6270749['社交', '運營']運營助理9535048006k-8k0運營['運營']運營助理|專員不限20191140
3137天津北京達佳互聯資訊技術有限公司1880['股票期權', '彈性作業', '定期體檢', '崗位晉升']快手2000人以上2019-12-03 10:16:28本科D輪及以上運營|編輯|客服類10:16發布today文娛丨內容[]00全職2019-12-03 10:01:370五險一金,績效獎金,餐補,房補5051153['運營', '用戶運營']運營編輯團隊leader10506720008k-15k0運營['運營', '用戶運營']用戶運營3-5年20191231
3138天津北京河貍家資訊技術有限公司25854['高配福利', '彈性時間', 'BAT¥', '逗逼伙伴']河貍家500-2000人2019-12-02 17:03:54不限C輪運營|編輯|客服類1天前發布today移動互聯網['電商', '商家運營']00全職2019-12-03 11:25:100五險一金6624059['電商', '商家運營']商家運營-天津14725914316k-8k0運營['商家運營']商家運營不限20191220
3139天津北京河貍家資訊技術有限公司25854['高配福利', '彈性時間', 'BAT¥', '逗逼伙伴']河貍家500-2000人2019-12-02 17:03:56本科C輪運營|編輯|客服類1天前發布today移動互聯網['移動互聯網']01全職2019-12-03 11:25:100轉正機會6633633['移動互聯網']運營實習生-天津14725914312k-4k0運營[]運營助理|專員應屆畢業生20191220

3140 rows × 36 columns

# 捕獲薪資欄位以獲取工資上下限
temp = df1.salary.str.extract(r'(\d+)[kK]?-(\d+)[kK]?')
# 將DataFrame中的str映射成int
temp = temp.applymap(int)
# 沿1軸計算均值
# axis = 1,表示對所有的列的每一行進行操作
df1['msal'] = temp.mean(axis = 1)
df1
citycompanyFullNamecompanyIdcompanyLabelListcompanyShortNamecompanySizecreateTimeeducationfinanceStagefirstTypeformatCreateTimeimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginpcShowpositionAdvantagepositionIdpositionLablespositionNamepublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesthirdTypeworkYearyearmonthdayweekdaymsal
no
0北京達疆網路科技(上海)有限公司32836['年底雙薪', '績效獎金', '崗位晉升', '定期體檢']達達-京東到家2000人以上2019-12-02 20:38:25本科D輪及以上產品|需求|專案類1天前發布today消費生活[]00全職2019-12-03 10:33:070成長快、氛圍好、領導好6638350['BI', '資料分析']資料分析崗7855636110015k-30k0資料分析['BI', '資料分析']BI3-5年2019122022.5
1北京北京音娛時光科技有限公司286568['年底雙薪', '績效獎金', '帶薪年假', '免費健身']音娛時光50-150人2019-12-03 11:23:35本科A輪產品|需求|專案類11:23發布today移動互聯網[]00全職2019-12-03 11:23:380技術大牛多;免費餐飲;氛圍好;6263661['SQL', 'BI', 'SPSS']資料分析12147286110010k-18k0資料分析['SQL', 'BI', 'SPSS']資料分析1-3年2019123114.0
2北京北京千喜鶴餐飲管理有限公司278964[]千喜鶴2000人以上2019-12-03 10:35:09本科未融資產品|需求|專案類10:35發布today消費生活['移動互聯網', '視頻', 'SQL']00全職2019-12-03 11:08:340福利好,五險一金,住房補助6660141['移動互聯網', '視頻', 'SQL']資料分析64368580020k-30k0資料分析['SQL', '資料分析']資料分析3-5年2019123125.0
3北京吉林省海生電子商務有限公司399744[]吉林省海生電子商務有限公司少于15人2019-12-03 10:35:56本科不需要融資產品|需求|專案類10:35發布today電商['其他']00全職2019-12-03 10:30:370五險一金6660148['其他']資料分析109787490033k-50k0資料分析['資料分析']資料分析3-5年2019123141.5
4北京韋博網訊科技(北京)有限公司580170[]WPIC50-150人2019-12-03 12:10:22本科未融資產品|需求|專案類12:10發布today電商,軟體開發['電商']00全職2019-12-03 11:54:220待遇優厚 ,良好的發展前景6590101['電商']資料分析132131010010k-15k0資料分析['資料分析']產品|需求|專案類1-3年2019123112.5
..................................................................................................................
3135天津清博津商(天津)教育科技有限公司260578[]清博津商15-50人2019-11-13 15:55:55不限不需要融資運營|編輯|客服類2019-11-13overSevenDays資料服務,教育[]01兼職2019-11-13 15:55:450大資料行業優勢,作業氛圍好6579749['審核', '內容審核', '資訊']審核實習生(春節短期)8913003001k-2k0審核['審核', '內容審核', '資訊']資訊審核應屆畢業生2019111321.5
3136天津上海禮紫股權投資基金管理有限公司264817[]禮紫股權投資500-2000人2019-11-04 09:02:04不限未融資運營|編輯|客服類2019-11-04overSevenDays金融['社交', '運營']00全職2019-11-14 16:23:360旅游團建、內部晉升、待遇優厚、提供住宿6270749['社交', '運營']運營助理9535048006k-8k0運營['運營']運營助理|專員不限201911407.0
3137天津北京達佳互聯資訊技術有限公司1880['股票期權', '彈性作業', '定期體檢', '崗位晉升']快手2000人以上2019-12-03 10:16:28本科D輪及以上運營|編輯|客服類10:16發布today文娛丨內容[]00全職2019-12-03 10:01:370五險一金,績效獎金,餐補,房補5051153['運營', '用戶運營']運營編輯團隊leader10506720008k-15k0運營['運營', '用戶運營']用戶運營3-5年2019123111.5
3138天津北京河貍家資訊技術有限公司25854['高配福利', '彈性時間', 'BAT¥', '逗逼伙伴']河貍家500-2000人2019-12-02 17:03:54不限C輪運營|編輯|客服類1天前發布today移動互聯網['電商', '商家運營']00全職2019-12-03 11:25:100五險一金6624059['電商', '商家運營']商家運營-天津14725914316k-8k0運營['商家運營']商家運營不限201912207.0
3139天津北京河貍家資訊技術有限公司25854['高配福利', '彈性時間', 'BAT¥', '逗逼伙伴']河貍家500-2000人2019-12-02 17:03:56本科C輪運營|編輯|客服類1天前發布today移動互聯網['移動互聯網']01全職2019-12-03 11:25:100轉正機會6633633['移動互聯網']運營實習生-天津14725914312k-4k0運營[]運營助理|專員應屆畢業生201912203.0

3140 rows × 37 columns

# 排序和TopN
df1.sort_values(by = 'msal',ascending=False)
citycompanyFullNamecompanyIdcompanyLabelListcompanyShortNamecompanySizecreateTimeeducationfinanceStagefirstTypeformatCreateTimeimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginpcShowpositionAdvantagepositionIdpositionLablespositionNamepublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesthirdTypeworkYearyearmonthdayweekdaymsal
no
2084武漢北京一一萬物科技有限公司132108['年底雙薪', '午餐補助', '彈性作業', '扁平管理']伴伴50-150人2019-12-03 11:00:12不限不需要融資運營|編輯|客服類11:00發布today移動互聯網,社交['移動互聯網']00兼職2019-12-03 10:57:200時間自由、作業環境好、薪資待遇高6660359['移動互聯網']應用商店維護實習生4515587149100k-200k0運營[]網路推廣不限20191231150.0
2547西安西安嗅鏈資訊技術有限公司117426867[]嗅鏈資訊50-150人2019-12-02 22:37:11本科未融資綜合職能|高級管理1天前發布today區塊鏈['企業服務', '合伙人', '區域管理', '事業部管理']00全職2019-12-03 08:26:160年薪百萬6659442['企業服務', '合伙人', '區域管理', '事業部管理']總監157291790045k-90k0高級管理職位['合伙人', '區域管理', '事業部管理']COO3-5年2019122067.5
2542西安西安嗅鏈資訊技術有限公司117426867[]嗅鏈資訊50-150人2019-12-02 22:37:11本科未融資綜合職能|高級管理1天前發布today區塊鏈['企業服務', '合伙人', '區域管理', '事業部管理']00全職2019-12-03 08:26:160年薪百萬6659442['企業服務', '合伙人', '區域管理', '事業部管理']總監157291790045k-90k0高級管理職位['合伙人', '區域管理', '事業部管理']COO3-5年2019122067.5
1072深圳維沃移動通信有限公司19875['年終分紅', '帶薪年假', '年度旅游', '崗位晉升']vivo2000人以上2019-11-20 17:19:04本科不需要融資產品|需求|專案類2019-11-20sevenDays硬體['移動互聯網']00全職2019-11-29 10:34:390股票期權,精英團隊,彈性作業5505916['移動互聯網']商業資料分析師40367820050k-80k0資料分析[]資料分析3-5年20191120265.0
1074深圳維沃移動通信有限公司19875['年終分紅', '帶薪年假', '年度旅游', '崗位晉升']vivo2000人以上2019-11-20 17:19:04本科不需要融資產品|需求|專案類2019-11-20sevenDays硬體['移動互聯網']00全職2019-11-29 10:34:390彈性作業,股票期權,大資料平臺 千萬用戶5948719['移動互聯網']商業資料分析師 (003969)40367820050k-80k0資料分析[]資料分析3-5年20191120265.0
..................................................................................................................
3135天津清博津商(天津)教育科技有限公司260578[]清博津商15-50人2019-11-13 15:55:55不限不需要融資運營|編輯|客服類2019-11-13overSevenDays資料服務,教育[]01兼職2019-11-13 15:55:450大資料行業優勢,作業氛圍好6579749['審核', '內容審核', '資訊']審核實習生(春節短期)8913003001k-2k0審核['審核', '內容審核', '資訊']資訊審核應屆畢業生2019111321.5
1169廣州網易(杭州)網路有限公司329['節日禮物', '技能培訓', '免費班車', '帶薪年假']網易2000人以上2019-12-01 16:30:07本科上市公司市場|商務類2天前發布disabled電商[]01實習2019-12-03 11:20:240平臺好 、導師制、包三餐5808948['資料分析']資料分析實習生2620312621k-2k0市場|營銷['資料分析']商業資料分析應屆畢業生201912161.5
507上海宜家(中國)投資有限公司560057['年底雙薪', '帶薪年假', '定期體檢', '彈性作業']宜家2000人以上2019-12-03 10:20:51本科不需要融資產品|需求|專案類10:20發布today消費生活[]00全職2019-12-03 11:26:310員工餐廳 企業年金 超長年假 外企福利6046040['資料分析', '可視化', 'SQL']高級資料分析師58832821171k-2k0資料分析['資料分析', '可視化', 'SQL']資料分析5-10年201912311.5
996深圳九章天璇投資咨詢(深圳)有限公司543962[]九章天璇少于15人2019-11-23 10:07:43本科未融資產品|需求|專案類2019-11-23today金融,資料服務['互聯網金融', '大資料', '資料分析']01實習2019-12-02 18:29:300金融 AI 大資料6514680['互聯網金融', '大資料', '資料分析']資料分析實習生1070113811001k-2k0資料分析['資料分析']資料分析應屆畢業生2019112351.5
915深圳中國平安人壽保險股份有限公司140014['績效獎金', '帶薪年假', '定期體檢', '節日禮物']平安人壽2000人以上2019-12-03 00:00:12本科上市公司產品|需求|專案類00:00發布disabled金融['金融']00全職2019-12-02 10:01:280五險一金,績效獎金,節日福利,定期體檢6095621['金融']0222JM-資料分析師7915574001k-1k0資料分析[]其他資料分析1-3年201912311.0

3140 rows × 37 columns

df1.nlargest(10,'msal')
citycompanyFullNamecompanyIdcompanyLabelListcompanyShortNamecompanySizecreateTimeeducationfinanceStagefirstTypeformatCreateTimeimStateindustryFieldindustryLablesisHotHireisSchoolJobjobNaturelastLoginpcShowpositionAdvantagepositionIdpositionLablespositionNamepublisherIdresumeProcessDayresumeProcessRatesalaryscoresecondTypeskillLablesthirdTypeworkYearyearmonthdayweekdaymsal
no
2084武漢北京一一萬物科技有限公司132108['年底雙薪', '午餐補助', '彈性作業', '扁平管理']伴伴50-150人2019-12-03 11:00:12不限不需要融資運營|編輯|客服類11:00發布today移動互聯網,社交['移動互聯網']00兼職2019-12-03 10:57:200時間自由、作業環境好、薪資待遇高6660359['移動互聯網']應用商店維護實習生4515587149100k-200k0運營[]網路推廣不限20191231150.0
2542西安西安嗅鏈資訊技術有限公司117426867[]嗅鏈資訊50-150人2019-12-02 22:37:11本科未融資綜合職能|高級管理1天前發布today區塊鏈['企業服務', '合伙人', '區域管理', '事業部管理']00全職2019-12-03 08:26:160年薪百萬6659442['企業服務', '合伙人', '區域管理', '事業部管理']總監157291790045k-90k0高級管理職位['合伙人', '區域管理', '事業部管理']COO3-5年2019122067.5
2547西安西安嗅鏈資訊技術有限公司117426867[]嗅鏈資訊50-150人2019-12-02 22:37:11本科未融資綜合職能|高級管理1天前發布today區塊鏈['企業服務', '合伙人', '區域管理', '事業部管理']00全職2019-12-03 08:26:160年薪百萬6659442['企業服務', '合伙人', '區域管理', '事業部管理']總監157291790045k-90k0高級管理職位['合伙人', '區域管理', '事業部管理']COO3-5年2019122067.5
1072深圳維沃移動通信有限公司19875['年終分紅', '帶薪年假', '年度旅游', '崗位晉升']vivo2000人以上2019-11-20 17:19:04本科不需要融資產品|需求|專案類2019-11-20sevenDays硬體['移動互聯網']00全職2019-11-29 10:34:390股票期權,精英團隊,彈性作業5505916['移動互聯網']商業資料分析師40367820050k-80k0資料分析[]資料分析3-5年20191120265.0
1074深圳維沃移動通信有限公司19875['年終分紅', '帶薪年假', '年度旅游', '崗位晉升']vivo2000人以上2019-11-20 17:19:04本科不需要融資產品|需求|專案類2019-11-20sevenDays硬體['移動互聯網']00全職2019-11-29 10:34:390彈性作業,股票期權,大資料平臺 千萬用戶5948719['移動互聯網']商業資料分析師 (003969)40367820050k-80k0資料分析[]資料分析3-5年20191120265.0
978深圳深圳依時貨拉拉科技有限公司41178['技能培訓', '專項獎金', '績效獎金', '扁平管理']貨拉拉2000人以上2019-11-25 16:55:07本科D輪及以上產品|需求|專案類2019-11-25today移動互聯網,消費生活[]00全職2019-12-03 10:56:450發展空間大6069939['BI', '商業', '資料分析']資深資料分析師(J11772)765920110050k-70k0資料分析['BI', '商業', '資料分析']BI5-10年20191125060.0
1071深圳維沃移動通信有限公司19875['年終分紅', '帶薪年假', '年度旅游', '崗位晉升']vivo2000人以上2019-11-20 17:19:03本科不需要融資開發|測驗|運維類2019-11-20sevenDays硬體[]00全職2019-11-29 10:34:390股票期權,精英團隊,彈性作業6474297['資料分析']商業資料分析經理40367820040k-80k0資料開發['資料分析']資料分析5-10年20191120260.0
1866南京上海冰鑒資訊科技有限公司93049['福利關懷豐厚', '組織管理扁平', '年終獎金豐厚', '技術實力強大']冰鑒科技150-500人2019-12-02 13:48:10博士C輪金融類1天前發布today資訊安全,資料服務[]00全職2019-12-03 09:49:450六險一金、年假、下午茶、年終2-4個月6608166['風險評估', '授信審查', '風控']模型總監1081695514050k-70k0風控['風險評估', '授信審查', '風控']風控3-5年2019122060.0
2445武漢北京位元組跳動科技有限公司62['扁平管理', '彈性作業', '大廚定制三餐', '就近租房補貼']位元組跳動2000人以上2019-11-21 11:15:59本科C輪開發|測驗|運維類2019-11-21today文娛丨內容['后端開發']00全職2019-12-02 14:48:460六險一金,高薪期權,免費三餐,租房補貼5949709['后端開發']后端架構師-武漢120145670040k-80k0后端開發[]其他后端開發不限20191121360.0
2507武漢北京位元組跳動科技有限公司62['扁平管理', '彈性作業', '大廚定制三餐', '就近租房補貼']位元組跳動2000人以上2019-11-21 11:15:59本科C輪開發|測驗|運維類2019-11-21today文娛丨內容['后端開發']00全職2019-12-02 14:48:460六險一金,高薪期權,免費三餐,租房補貼5949709['后端開發']后端架構師-武漢120145670040k-80k0后端開發[]其他后端開發不限20191121360.0
ser = df1.groupby('city').msal.mean()
ser
city
上海    20.198630
北京    21.044444
南京    13.411157
廈門    12.139098
天津    10.400000
廣州    14.800562
成都    12.573333
杭州    20.122881
武漢    12.401111
深圳    19.473077
蘇州    13.826531
西安     9.340237
長沙     9.394737
Name: msal, dtype: float64
ser.plot(kind = 'bar')
plt.xticks(rotation = 0)  # 橫坐標旋轉度數
plt.show()

?
在這里插入圖片描述

?

def my_mean(group):
    return np.round(np.mean(group),1)

# SAC --> Split - Aggragate - Combine
df1.groupby('city').msal.agg(['max','min',my_mean,np.ptp])
maxminmy_meanptp
city
上海45.01.520.243.5
北京52.52.521.050.0
南京60.01.513.458.5
廈門37.53.012.134.5
天津37.51.510.436.0
廣州40.01.514.838.5
成都50.01.512.648.5
杭州55.03.520.151.5
武漢150.02.512.4147.5
深圳65.01.019.564.0
蘇州42.53.513.839.0
西安67.52.59.365.0
長沙25.03.09.422.0
# 對多個列進行資料聚合不同的列使用不同的聚合方式
# 同一個列也可以作用多個聚合函式
df1.groupby('city')[['msal','companyId']].agg({
    'msal':my_mean,
    'companyId':['nunique','count']
})
msalcompanyId
my_meannuniquecount
city
上海20.2204365
北京21.0246450
南京13.4135242
廈門12.170133
天津10.44975
廣州14.8124178
成都12.6250450
杭州20.180118
武漢12.4246450
深圳19.5142260
蘇州13.86898
西安9.3113169
長沙9.490152

透視表

什么是透視表:根據A統計B

# 生成透視表  DataFrame、A、B、聚合函式
pd.pivot_table(data=df1,   # DataFrame
               index = 'city',   # A 被透視物件 原表格資料項(groupby屬性)
               values = ['msal','companyId'],   # B 需要透視的資料
               aggfunc = {   # 聚合函式
                   'msal':my_mean,
                   'companyId':'nunique'
               })
companyIdmsal
city
上海20420.2
北京24621.0
南京13513.4
廈門7012.1
天津4910.4
廣州12414.8
成都25012.6
杭州8020.1
武漢24612.4
深圳14219.5
蘇州6813.8
西安1139.3
長沙909.4
df2 = pd.read_excel('../files/data/2020年銷售資料.xlsx')
df2
銷售日期銷售資訊銷售區域銷售渠道銷售訂單品牌售價銷售數量銷售額
02020-01-01上海拼多多訂單182894-455上海拼多多182894-455八匹馬99838217
12020-01-01上海抖音訂單205635-402上海抖音205635-402八匹馬219296351
22020-01-01上海天貓訂單205654-021上海天貓205654-021八匹馬1698514365
32020-01-01上海天貓訂單205654-519上海天貓205654-519八匹馬169142366
42020-01-01上海天貓訂單377781-010上海天貓377781-010皮皮蝦2496115189
..............................
19402020-12-30北京京東訂單D89677北京京東D89677花花姑娘269266994
19412020-12-30福建物體訂單182719-050福建物體182719-050八匹馬79977663
19422020-12-31福建物體訂單G70083福建物體G70083花花姑娘2695514795
19432020-12-31福建抖音訂單211471-902/704福建抖音211471-902/704八匹馬59593481
19442020-12-31福建天貓訂單211807-050福建天貓211807-050八匹馬99272673

1945 rows × 9 columns

# 月度銷售額
pd.pivot_table(data = df2,
               index = '品牌',
               columns= ['銷售區域'],
               values = ['銷售額'],
               aggfunc =np.sum,
               margins=True,   # 添加總計列
               margins_name='總計')
銷售額
銷售區域上海北京南京安徽廣東江蘇浙江福建總計
品牌
八匹馬1689384.01703513.0317169.0239382.0214443.024992.03927.01141836.05334646
啊喲喂168858.0259090.049847.013697.026677.019104.08843.0147043.0693159
壁虎1573379.01381350.0195633.0148002.022146.05475.0202228.01150766.04678979
皮皮蝦2939357.02365844.0480544.055771.095826.099989.0NaN1854940.07892271
花花姑娘5239511.06767920.0724108.0438611.01258857.0387519.0472864.05883642.021173032
總計11610489.012477717.01767301.0895463.01617949.0537079.0687862.010178227.039772087
# 品牌銷售占比
temp = pd.pivot_table(data = df2,
                     index = '品牌',
                     values = '銷售額',
                     aggfunc = 'sum',
                     margins=True,
                     margins_name='總計')
temp
銷售額
品牌
八匹馬5334646
啊喲喂693159
壁虎4678979
皮皮蝦7892271
花花姑娘21173032
總計39772087
# 品牌銷售占比
temp.plot(kind = 'pie',autopct = '%.2f%%',subplots=True)
plt.show
<function matplotlib.pyplot.show(close=None, block=None)>

?
在這里插入圖片描述

?

# 各地區銷售額
pd.pivot_table(data = df2,
              index = '銷售區域',
              values = ['銷售額'],
              columns = '品牌',
              aggfunc = 'sum',
              margins=True,
              margins_name='總計')
銷售額
品牌八匹馬啊喲喂壁虎皮皮蝦花花姑娘總計
銷售區域
上海1689384.0168858.01573379.02939357.05239511.011610489
北京1703513.0259090.01381350.02365844.06767920.012477717
南京317169.049847.0195633.0480544.0724108.01767301
安徽239382.013697.0148002.055771.0438611.0895463
廣東214443.026677.022146.095826.01258857.01617949
江蘇24992.019104.05475.099989.0387519.0537079
浙江3927.08843.0202228.0NaN472864.0687862
福建1141836.0147043.01150766.01854940.05883642.010178227
總計5334646.0693159.04678979.07892271.021173032.039772087
# 各渠道品牌銷量
pd.pivot_table(data = df2,
              index = ['銷售渠道'],
              columns = ['品牌'],
              values =['銷售數量'],
              aggfunc = 'sum',
              margins = True,
              margins_name = '總計')
銷售數量
品牌八匹馬啊喲喂壁虎皮皮蝦花花姑娘總計
銷售渠道
京東542873331993090907221522
天貓9416926482459801588137027
物體360046221742684499113911
抖音297854120651995496612545
拼多多572271931193750908822398
總計271443381153811749943998107403
# 不同售價區間的閱讀銷量占比
# 分箱,將連續的資料放到離散的箱子中基于分箱的結果在進行分組
print('MAX:',df2['售價'].max())
print('MIN:',df2['售價'].min())
box = pd.cut(df2['售價'],bins = [50,300,550,800,1050,1300,1550])
temp2 = df2.groupby(box)['售價'].count()
temp2
MAX: 1499
MIN: 59





售價
(50, 300]       917
(300, 550]      745
(550, 800]      171
(800, 1050]      74
(1050, 1300]     32
(1300, 1550]      6
Name: 售價, dtype: int64
temp2.plot(kind = 'pie',autopct = '%.2f%%')
plt.show
<function matplotlib.pyplot.show(close=None, block=None)>

?
在這里插入圖片描述

?

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/301207.html

標籤:AI

上一篇:自己做量化交易軟體(44)小白量化實戰17--利用小白量化金融模塊在迅投QMT極速策略交易系統上仿大智慧指標回測及實戰交易設計

下一篇:《思維導圖應用實戰》畫出你的思維

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more