做過資料分析的程式員都知道:Excel、Tableau等這些親民工具都是資料分析的得力助手,
但用Excel做分析,繁瑣的每一步都是來自滑鼠點擊,中間如果一步有誤,很多步驟都需要重新調整,浪費大量時間,
這不,前天臨近下班時間,老板突然Q我:算一下近一年銷售額總額TOP5的品牌以及對應的銷售額,
接收完檔案我傻眼了,公司旗下有20個品牌,這些品牌涉及到128個類目,業務部門總共發來了128張表,每一份表格對應著一個細分行業的資料,像什么各類戶外服裝、垂釣裝備、救生裝備應有盡有,

每張表,以月的維度記錄著每個品牌的日期、訪客、客單、轉化、所屬類目(細分行業)等資料:

習慣性的打開Excel,我開始盤算:最終需求是要篩選出近一年銷售額總和排名前5的品牌,這一攤子資料,對單獨的一張表進行分類匯總,能夠得到該細分行業各品牌的銷售額,想要得到所有行業的銷售額總和,得分類匯總128次,最后對128次結果再次合并,
“這個任務看上去很艱巨,不過,考驗的主要是體力,”我一眼就“看穿”了事情的本質,右手食指在滑鼠上飛速跳動,以90秒一張表格的速度瘋狂推進,按照這個速度,不考慮疲勞值對速度的拖累,大概3.2個小時就能夠完成任務,
然而,剛開始還沒3分鐘,老板找到我:剛交你的任務暫時不用做了,新來的已經得出結論了,看著還挺專業,

多年來的職業敏感性驅使我立馬跟新同事聊了一下,“剛剛那些表分分鐘就搞定了,很簡單!”他演示給我看,“我就使用了幾行Python代碼…”
首先,匯入模塊,打開單個表格:

接著,匯總不同品牌在這個細分行業下的銷售額,沒有銷售額的欄位,可以通過訪客數轉化率客單價三者的乘積來計算:

按品牌來匯總銷售額,得到近一年各品牌銷售額合計:

對于單獨行業的銷售額,應該加一個區分的標簽以防覆寫,而打開時候的檔案名,具有天然的區分和防覆寫優勢,但要注意去掉檔案的后綴,

OK,單個表格處理完成,我們把這一系列操作推而廣之即可,用os.listdir方法來遍歷檔案名,批量回圈訪問并處理檔案,同時引入time計時,打算看一看,面對128張表,Python完成這些操作到底能夠比手動快多少:

WOC,整個程序一氣呵成,不到3秒,平均一張表格0.02秒!真香!
為了確保資料正常,來預覽一下:

這一串看起來很奇怪的銷售額,是pandas自作主張把實際銷售額變成了科學記數法形式來展示,要還原數值,需要更改一下原始的設定:

我本以為學會Excel走遍天下,沒想到Python效率這么高!
20年前,學英語不是為了成為翻譯員;10年前,學電腦不是為了成為打字員;今天,學Python資料分析與挖掘不是要都成為資料分析師,
而越來越多的互聯網人利用Python完成自動化辦公、表格處理、資訊搜集、資料分析、資料可視化等作業,至少釋放了80%的勞動力!
我們知道什么樣的程式員最受歡迎?
肯定不是只會寫代碼的碼農,而是技術過硬又懂業務的,可以通過資料分析,優化代碼解決實際業務問題的人才!
其實無論是做研發、系統架構,還是產品、運營,在數不清的場景下,用Python做資料分析與挖掘其實是基本功,它不是一個職位,而是一個技能,
關于Python技術儲備
學好 Python 不論是就業還是做副業賺錢都不錯,但要學會 Python 還是要有一個學習規劃,最后大家分享一份全套的 Python 學習資料,給那些想學習 Python 的小伙伴們一點幫助!
一、Python所有方向的學習路線
Python所有方向路線就是把Python常用的技術點做整理,形成各個領域的知識點匯總,它的用處就在于,你可以按照上面的知識點去找對應的學習資源,保證自己學得較為全面,

二、學習軟體
工欲善其事必先利其器,學習Python常用的開發軟體都在這里了,給大家節省了很多時間,

三、入門學習視頻
我們在看視頻學習的時候,不能光動眼動腦不動手,比較科學的學習方法是在理解之后運用它們,這時候練手專案就很適合了,

四、實戰案例
光學理論是沒用的,要學會跟著一起敲,要動手實操,才能將自己的所學運用到實際當中去,這時候可以搞點實戰案例來學習,

五、面試資料
我們學習Python必然是為了找到高薪的作業,下面這些面試題是來自阿里、騰訊、位元組等一線互聯網大廠最新的面試資料,并且有阿里大佬給出了權威的解答,刷完這一套面試資料相信大家都能找到滿意的作業,


這份完整版的Python全套學習資料已經上傳CSDN,朋友們如果需要可以微信掃描下方CSDN官方認證二維碼免費領取【保證100%免費】

Python資料、技術、課程、解答、咨詢也可以直接點擊下面名片,
添加官方客服斯琪↓
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/431475.html
標籤:AI
上一篇:R語言進行變數編碼(recode):把dataframe中連續變數基于條件運算式轉化為多個類別的離散變數(分類變數)、使用attach函式系結資料
