經常聽到資料科學家、大資料專家、資料分析師,這3個職業乍一聽,感覺是一個意思,但實際上,它們是不同的崗位,需要不同的技術,應用到不同的領域,

什么是資料科學?
處理非結構化和結構化資料,資料科學是一個包含與資料清理、準備和分析相關的所有內容的領域,
資料科學是統計、數學、編程、解決問題、捕獲資料、以不同的方式看待事物的能力以及清理、準備和對齊資料所有活動的結合,
什么是大資料?
大資料是指目前使用的傳統應用程式無法有效處理的大量資料,大資料的處理那些零散的未聚合的原始資料,通常不可能存盤在單臺計算機的記憶體中,大資料用于分析洞察力,這可以帶來更好的決策和戰略性業務舉措,
Gartner 對大資料給出了以下定義:“大資料是大容量、高速或多樣化的資訊資產,需要具有成本效益、創新的資訊處理形式,以增強洞察力、決策制定和流程自動化, ”

什么是資料分析?
資料分析是檢查原始資料以得出某些結論的科學,
資料分析涉及應用演算法或機械程序來獲得洞察力并運行多個資料集以尋找有意義的相關性,
它用于多個行業,使組織和資料分析公司能夠做出更明智的決策,以及驗證和反駁現有的理論或模型,資料分析的重點在于推理,即僅根據研究人員已經知道的內容得出結論的程序,

資料科學的應用
- 互聯網搜索:搜索引擎利用資料科學演算法在幾秒鐘內為搜索查詢提供最佳結果,
- 數字廣告:整個數字營銷范圍都使用資料科學演算法,從顯示橫幅到數字廣告牌,這是數字廣告的點擊率高于傳統廣告的主要原因,
- 推薦系統:推薦系統幫助電商、APP、內容平臺將千千萬萬的內容精準推送給潛在用戶,增加了用戶體驗,推薦系統一般基于用戶行為(搜索、瀏覽、互動)來進行推薦,

大資料的應用
一、金融服務大資料
信用卡公司、零售銀行、私人財富管理咨詢公司、保險公司、風隙訓金和機構投資銀行的運營都離不開大資料的運用,它們之間的共同問題是擁有存在于多個不同系統中的大量的多結構化資料,大資料可以解決這些問題,
大資料如何應用在金融服務領域:
- 客戶分析
- 合規分析
- 欺詐分析
- 運營分析
- 通信大資料
二、通信領域的拉新與留存
獲得新用戶、留住客戶是電信服務提供商的首要任務,因而分析每天客戶生成的大量資料顯得尤為關鍵,
三、零售大資料
無論是物體公司還是在線電商,了解客戶才能在競爭中立于不敗之地,大資料可以處理客戶來源、交易資料、商品品牌影響力、顧客忠誠度等眾多維度的資料,助力物體/電商生意更加紅火,

資料分析的應用
- 衛生保健
醫院的需求是高效率救助更多患者,這就涉及到醫療資源(醫生、設備、病床)的優化分配,通過資料分析軟體,可以最大效率提升資源利用率,避免資源浪費或低效使用,
- 旅行
通過移動APP/博客和社交媒體的資料分析可以優化購買體驗,幫助旅游網站深入了解客戶偏好,
此外,通過資料分析,旅游業可以得知哪一項優惠活動、套餐最受歡迎,哪個套餐盈利最大,基于這些分析,可以進行銷售追加,此外,基于社交媒體資料的資料分析還可以提供個性化的旅行服務,
- 游戲
資料分析可以幫助游戲公司了解游戲偏好,包括哪些主題皮膚、哪些武器、哪些場景受玩家歡迎,哪些引起用戶反感,
- 能源管理
使用資料分析來進行能源管理,包括智能電網管理、能源優化、能源分配和公用事業公司的樓宇自動化,可以提升能源/資源利用率,像國家電網,全國有無數個資料點,只有通過資料分析,工程師才能夠對整體的電能進行合理分配與監控,

成為資料科學家所需的技能
- 教育:88%擁有碩士學位,46%擁有博士學位
- 對 SAS 或 R 有深入的了解,對于資料科學,通常首選 R,
- Python 編碼:Python是資料科學中最常用的編碼語言,與 Java、Perl 和 C/C++ 一樣,
- Hadoop 平臺:雖然并不總是要求,但了解 Hadoop 平臺仍然是該領域的首選,有Hive或Pig方面的相關經驗,
- SQL 資料庫/編碼:盡管NoSQL和Hadoop 已成為資料科學的重要組成部分,但如果你需要在 SQL 中撰寫和執行復雜的查詢,它仍然是首選,
- 處理非結構化資料:資料科學家必須能夠處理非結構化資料,無論是在社交媒體、視頻源還是音頻上,

成為大資料專家所需的技能
- 分析技能:尋找解決方案時確定哪些資料是相關的至關重要,
- 創造力:你需要有能力創造新的方法來收集、解釋和分析資料策略,
- 數學和統計技能:無論是在資料科學、資料分析還是大資料中,傳統的數學與統計功能很有必要
- 計算機科學:程式員將不斷需要提出演算法來處理資料
- 業務技能:資料為業務服務,因此必須大資料專家必須懂業務
成為資料分析師所需的技能
- 編程技能:任何資料分析師都必須了解編程語言,例如R和Python
- 統計技能和數學
- 機器學習技能
- 資料整理技巧
- 溝通和資料可視化技能
- 資料直覺
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/423256.html
標籤:AI
上一篇:阿里云基本概念與基礎架構(一)
下一篇:一文詳解向量導數與矩陣導數
