主頁 > 資料庫 > 國產開源,GitHub 標星 47000+ ,百度飛槳從打響第一槍到戰役突圍

國產開源,GitHub 標星 47000+ ,百度飛槳從打響第一槍到戰役突圍

2020-09-25 04:56:18 資料庫

作者 | 阿司匹林

出品 | AI科技大本營(ID:rgznai100)

封圖 | CSDN付費下載自視覺中國

打響第一槍:占領高地

從 PaddlePaddle 到飛槳

2016 年,百度 PaddlePaddle 打響了國產 AI 框架開源的第一槍,

作為最早研究深度學習技術的公司之一,百度早在 2013 年即設立了深度學習研究院,并于 2016 年正式開源深度學習框架,而 PaddlePaddle 也身負百度搶占人工智能時代高地的重要使命,

2018 年 7 月,李彥宏在百度 AI 開發者大會上喊出了要讓“Everyone Can AI”的口號,其實這句口號后面還要加上一個限定——“通過百度的 AI 平臺”, 這也意味著,PaddlePaddle 就是這場攻堅戰中的突破點之一,

2019 年 4 月,時任百度高級副總裁(現百度 CTO)王海峰在 Wave Summit 深度學習開發者峰會上,為深度學習框架 PaddlePaddle 在百度內部的戰略地位進行了定調,PaddlePaddle 發布中文名“飛槳”開始強調自己更懂中國開發者,以及更加專注于深度學習模型的工業生產和部署,

隨著 AI 成為國家戰略,在自主可控的號召下,作為底層的深度學習框架更受關注,相比于國內的同行,百度更早的邁出了這一步,也就有了先發優勢,

經過 4 年的發展,飛槳在 GitHub 上已經有 62 個 Repositories,共識訓 47000+ Star,成為國產開源專案的佼佼者,

而 CSDN 聯合職場社交平臺脈脈聯合發布的 2020 年《中國 AI 應用開發者報告》也顯示,百度飛槳已經成為最受中國開發者歡迎的國產深度學習開源框架,

戰役突圍:研發攻堅

打造四大“秘籍”

自 2007 年 Theano 誕生以來,經過十余年發展,深度學習技術與應用突飛猛進,深度學習框架也處在不斷迭代與進化的程序

作為我國首個開源開放、功能完備的產業級深度學習平臺,飛槳想要保持自己的地位,也必須要有自己獨特的優勢,那么要如何定義飛槳的優勢?總的來說,飛槳有以下 4 大領先技術,

第一,同時支持動態圖和靜態圖的編程,能夠兼顧易用性和效率,在整個開發程序當中,演算法工程師既需要方便的介面,同時也需要高效的底層平臺的支持,飛槳平臺結合了動態圖的易用性和靜態圖的高性能,使開發者可以兼顧兩者的優勢,對開發者來說,這是大大降低了寫程式的成本和復雜度,

第二,針對大規模的工業化場景,飛槳提供大規模分布式訓練能力,在真正的工業場景應對自如,飛槳平臺推出了支持萬億規模引數模型的實時更新能力和訓練能力,面對大型分類任務時可以進行模型并行訓練,在訓練層面也可以支持資料并行訓練,

第三,端到端的部署是應用深度學習的一個非常關鍵的環節,飛槳提供非常完備的支持各種硬體的端到端的部署能力,能夠使得開發者推理、預測的程序足夠順暢,在移動端部署的模型體積上,飛槳可以縮減到非常小,眾多開發者可以更好地把模型用在相應場景的終端設備上,

第四,飛槳有大量在產業實踐當中沉淀出來的模型,并提供官方的支持,能夠保證開發者的應用效果是最佳的、真正可靠的,據悉,飛槳平臺上目前開源了 140+ 的模型,而且還有工業級的預訓練模型,在預訓練模型基礎上,開發者在使用時只要針對自己的場景進行小資料量的遷移學習就可以使用,

此外,飛槳也在迅速迭代,近日飛槳在動態圖和 API 體系剛剛進行了一次全面的升級,

升級之后,飛槳將提供更加完備和性能更優的動態圖功能,以及更全面的動態圖轉靜態圖運行功能,在開發上實作“動靜統一”,“動靜統一”的優勢是開發者可以兼顧效率與靈活度,在動轉靜方面,飛槳現在已經支持完備的語法覆寫和帶控制流的任務,且僅需一個裝飾器就可以觸發操作,統一的介面可以讓模型保存加載實作自動適配,在動態圖方面,飛槳提供了比靜態圖更簡潔靈活的混合精度訓練介面,并且實作媲美靜態圖的混合精度與量化訓練效果,

另外,飛槳還形成了貼合用戶使用習慣的全新 API 體系,目錄結構更清晰,對用戶更加友好;為了減少開發者的作業量,飛槳提供了包含視覺、NLP 等領域的模型和工具封裝的高層 API,以及最經典的模型結構;在兼容性上,飛槳可兼容 1.X版本的 API,并配備了完善的教程幫助用戶自主順利升級至新版 API,獲得更佳的體驗,

而且飛槳已可適配 22 種芯片型號,覆寫英特爾、英偉達、瑞芯微、寒武紀等15家硬體廠商,且對國產硬體的支持力度業界第一,

為了進一步實作軟硬結合,加速 AI 的發展,百度還先后推出了兩代昆侖芯片,目前,百度昆侖芯片一代已經大規模部署,在百度搜索引擎及云計算任務上部署了 2 萬片,據介紹,百度昆侖芯片在百度搜索引擎等部署場景中,相比英偉達T4 GPU 性能在不同模型下提升 1.5-3 倍,

而在剛剛過去的百度世界 2020 上,百度智能芯片總經理歐陽劍還預發布了國內首款云端通用AI處理器“百度昆侖2”,采用更先進的 7nm 工藝,性能最高可超過前代 3 倍,預計明年初量產,

百年樹人:培育生態

做 AI 人才的“黃埔軍校”

為了擴大自己的生態圈,吸引更多的開發者,百度也在持續建設自己 AI 生態系統,希望跟更多產業合作共贏,實作百度 AI 生態合作的長遠計劃,

除了 AI 技術,既懂應用場景又懂 AI 技術的復合型人才也是 AI 產業化程序的關鍵,

2019 年 1 月 19 日,百度宣布成立“黃埔學院”,開展深度學習架構師培養計劃,并借鑒了黃埔軍校大門對聯的橫批“革命者來”,將口號設定為“革新者來”,黃埔學院的宗旨是“為中國產業界培養第一批首席 AI 架構師”,

2020 年 9 月,百度黃埔學院第三期 65 位學員畢業,創辦以來已向業界輸出 135 位 AI 落地產業的高端人才,

此外,百度和各高校合作開設人工智能課程,培養了上千名 AI 專業教師,同時也面向產業 AI人群,培養更多復合型人才,截止目前,百度已經培養 AI 人才超過 100 萬,未來 5 年 ,百度還計劃培養 500 萬 AI 人才,

人能盡其才,物能盡其用,則為富強之大經,AI 人才正成為企業核心競爭力,更推動著中國技術革命與產業智能化發展持續向前全速前進,

今天,在飛槳平臺已經有 230 萬的開發者使用,服務到了 9 萬家企業,創建了 31 萬個模型,過去半年多的時間里,有 40% 到 50% 的增長,而這就是生態的力量,

從個人開發者,到高校開發者,再到企業開發者,一切都是為了壯大飛槳的生態圈,促進百度的 AI 落地,

合縱連橫:開源開放

創造產業升級的加速度

開源開放,是人工智能發展的重要趨勢之一,

在近期舉行的2020中關村論壇上,百度 CTO 王海峰表示,人工智能高速發展,已成為新一輪科技革命和產業變革的重要驅動力量,這其中,人工智能技術的開源創新起到了很大的作用,一方面,開源創新可以加速技術的創新發展,不斷拓展人類認知邊界和技術邊界;另一方面,所有開發者都可以基于開源開放的成果開發自己的專案、產品及業務,更便捷、高效、安全地推進技術創新與應用,

實際上,從十年前布局人工智能開始,百度即本著開源開放的精神,開放 AI 核心技術供全社會使用,早在 2012 年,百度就開放了翻譯的 API,如今,百度翻譯每天的翻譯量已經達到了 1000 億字符,2013 年,百度又開放了語音平臺,現在每天的呼叫量超過 150 億,2016 年,在開源飛槳的同時,百度也開放了百度大腦的AI 能力,現在每日呼叫量超過1萬億次,

作為開源軟體,飛槳一直在建設開源社區,目前,飛槳已經凝聚了 230 萬開發者,服務超過 9 萬家企業,創造出 31 萬多個模型,而飛槳推出的飛槳開發者 PPDE 計劃也共建了開源社區,組建了 22 個飛槳地方社群,100 多個高校社群,

而隨著開源開放的進一步推動,人工智能已成為新一輪科技革命和產業變革的重要驅動力量,2019 年 10 月,百度公司董事長兼首席執行官李彥宏在第六屆世界互聯網大會上提出,我們正在迎來智能經濟時代,智能經濟會催生很多新的業態,產業智能化也將成為新的潮流,

在產業與 AI 結合實作產業智能化的行程中,AI 平臺起著越來越重要的作用,飛槳的作用也越來越突顯,在業務實踐中,類似飛槳這樣成熟可靠,已被大量產業級應用驗證的開源平臺,不僅為技術開發和企業創新不斷降低著門檻,更為整個產業智能化升級不斷加速,

例如在工業安全領域,飛槳攜手國家電網和山東信通打造電網智能巡檢方案,分析準確率達到90%,報警回應速度從小時級提升為秒級;在林業巡檢領域,普宙飛行器科技有限公司基于飛槳深度學習技術,專門為森林巡檢行業定制開發了一款無人機自主飛行+應用管理平臺,可實作大范圍森林的自主巡邏、火情監測、非法入侵、森林樹木砍伐監測等功能,目前已阻止10余起非法砍伐……

只有當技術滲透進這個社會方方面面,被組織或個人所“感知”,AI 才能真正民主化,賦能千行萬業,而以百度飛槳為代表的人工智能技術,正在致力于與產業深入融合,幫助開發者們以一種史無前例的方式攻克產業難關,把過去的一個個“不可能”變成今天中國產業智能化的現實,讓每個普通人都可以真實地讀懂 AI,利用 AI,讀懂中國智能時代的黎明,

這場持久戰,百度已經悄悄突圍,

更多精彩推薦
  • Python讓你成為AI 繪畫大師,簡直太驚艷了!(附代碼)

  • 激發企業大“智慧” | 深度賦能AI全場景 揭秘你不知道的移動云

  • 關于Python 3.9,那些你不知道的事

  • 程式員刪庫被判 6 年,公司損失近億,云原生時代如何打造安全防線?

  • 常程跳槽小米,聯想:已付競業協議股權對價 500 萬,須償還

  • 硅谷2020最新大資料學習路線:科學使用這一招,12周助你成為資料分析師

  • 用以太坊承載的位元幣,還只是起步階段

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/123252.html

標籤:其他

上一篇:后悔走上Python自動化測驗這條路!!!

下一篇:騰訊AI Lab聯合清華、港中文帶來萬字干貨決議:圖深度學習的歷史、最新進展和應用

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:33:24 more
  • MySQL中binlog備份腳本分享

    關于MySQL的二進制日志(binlog),我們都知道二進制日志(binlog)非常重要,尤其當你需要point to point災難恢復的時侯,所以我們要對其進行備份。關于二進制日志(binlog)的備份,可以基于flush logs方式先切換binlog,然后拷貝&壓縮到到遠程服務器或本地服務器 ......

    uj5u.com 2023-04-20 08:28:06 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:27:27 more
  • 快取與資料庫雙寫一致性幾種策略分析

    本文將對幾種快取與資料庫保證資料一致性的使用方式進行分析。為保證高并發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ......

    uj5u.com 2023-04-20 08:26:48 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:26:35 more
  • 云時代,MySQL到ClickHouse資料同步產品對比推薦

    ClickHouse 在執行分析查詢時的速度優勢很好的彌補了MySQL的不足,但是對于很多開發者和DBA來說,如何將MySQL穩定、高效、簡單的同步到 ClickHouse 卻很困難。本文對比了 NineData、MaterializeMySQL(ClickHouse自帶)、Bifrost 三款產品... ......

    uj5u.com 2023-04-20 08:26:29 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:25:13 more
  • Redis 報”OutOfDirectMemoryError“(堆外記憶體溢位)

    Redis 報錯“OutOfDirectMemoryError(堆外記憶體溢位) ”問題如下: 一、報錯資訊: 使用 Redis 的業務介面 ,產生 OutOfDirectMemoryError(堆外記憶體溢位),如圖: 格式化后的報錯資訊: { "timestamp": "2023-04-17 22: ......

    uj5u.com 2023-04-20 08:24:54 more
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:24:03 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:23:11 more