?談及當下技術領域的熱詞,必定有云原生、大資料、AIoT,不僅因為這些新興技術擁有前所未有的創造力,更是因其中每一項技術都代表諸多未知的可能,而當這些技術相互碰撞時,將為軟體發展、技術進步、城市升級帶來無限想象,在云原生、大資料、人工智能以及開源領域均有實踐經驗的崔寶秋認為,類似于云原生+大資料這樣技術的“強強聯合”將成為云原生時代的發展趨勢,運維和基礎軟體開發者、服務端和前端開發者所關注的技術點各有不同,
記者 | 田瑋靖 受訪者 | 崔寶秋
出品 | 《新程式員》編輯部

提到小米集團,我們脫口而出的大多是“雷軍”;而提到小米+開源,很多人第一時間會想到小米集團副總裁崔寶秋,崔寶秋不僅身體力行地推動開源發展,更引領了小米的“云計算-大資料-人工智能技術”發展路線,2012年以首席架構師的身份加入小米的崔寶秋,當時主要負責米聊的后臺服務器團隊,在他看來,這家公司和他熟悉的硅谷互聯網科技公司有所不同,缺少了非常重要的集團層面的工程技術部和運維部,于是,他毅然決定基于米聊服務器團隊打造小米云平臺,“用云平臺這個名字主要有兩個考慮:一是這個團隊必須是為整個集團服務的底層平臺部門,不只是服務米聊業務;二是體現了‘云’的重要性,從云存盤到云計算,云是各種互聯網服務和大資料應用的基礎,這和今天人們講的云原生有不謀而合之處,”崔寶秋說道,
確實,“云”的重要性逐漸被大眾熟知,這體現在云原生與智能硬體的結合,為產品增添智能服務,為用戶提供貼心體驗;體現在云原生與人工智能(Artificial Intelligence,AI)的結合,通過人工智能一方面解決云原生領域的決策和優化問題,另一方面能夠使產品更具人工智能服務能力;也體現在云原生與大資料的結合,大資料是云原生治理整個數字化轉型生態的一個重要方向;更體現在“云”與開源互利協作所帶來的軟體、云環境、開源生態的大發展,
那么,云原生與大資料、人工智能、硬體、開源能夠碰撞出怎樣的火花?小米集團副總裁崔寶秋向《新程式員》透漏了很多資訊,也分享了諸多個人觀點與行業洞察,
互聯網技術離不開“云”
《新程式員》:2021年的作業中,你的精力是如何分配的?
崔寶秋:2021年主要在忙小米內部的人才培訓、技術合作、開源、安全和隱私等方面的作業,在培訓方面,從專業力、通識力,到領導力,我們要覆寫小米幾乎所有的員工,在專業力領域,因為小米的技術體系非常龐大,所以有很多壓力,整體來看,小米同學們對云計算、大資料、人工智能方面的需求比較多,
《新程式員》:在加入小米組建人工智能與云平臺團隊時,云計算、大資料等技識訓不是特別成熟,是什么因素讓你認定并主導了小米“云計算-大資料-人工智能技術”這條發展路線?
崔寶秋:我加入小米之前,先后在硅谷的Yahoo和LinkedIn從事搜索引擎與大資料方面的作業,這兩段作業經歷讓我對云計算和大資料有了非常深的認識,尤 其是大資料,來到小米后,我堅信大資料能給小米帶來無窮的價值,所以剛到小米我就開始力推大資料和資料科學,并到處倡導資料驅動和資料科學家的理念,可以說,我當時的終極目標是做大資料,沒有考慮人工智能(那是2012年,深度學習剛剛開始有些熱度,人工智能真正火起來是在4年之后的2016年),而大資料離不開云,所以就必須從云計算開始,必須打造云平臺團隊,2016年AlphaGo事件之后,以深度學習和大資料為基礎的新一代人工智能技術才被行業高度認同,小米也緊跟時代步伐,制定了“All in AI”的戰略,開始組建小米AI實驗室,大力投入人工智能,小米云平臺團隊也因此改名為“小米人工智能與云平臺”團隊,才有了現在看起來比較完整的“云計算-大資料-人工智能”技術發展路線,
《新程式員》:在中國移動互聯網的黃金時期,為什么你認為云平臺是移動互聯網公司必須擁有的互聯網屬性?
崔寶秋:在回答這個問題之前,我們需要先明確另一個問題:互聯網公司是什么?我認為,互聯網公司就是利用互聯網技術,在互聯網平臺上做內容與服務的分發并從中獲利的公司,移動互聯網就是今天的互聯網,互聯網技術離不開云,不管是云計算、大資料,還是人工智能,一個移動互聯網公司要做內容與服務的分發,離不開應用與互聯網服務,同樣離不開云,離不開云端的服務器,
云原生將向大資料方向發展
**《新程式員》:**很多人知道“云原生”,但究竟什么是“云原生”,業界有諸多定義且一直在變化,你理解的云原生是怎樣的?
崔寶秋:云原生是最近幾年比較火的概念,不同的人可能有不同的解讀,我理解的云原生是一種基于云計算的靈活性、可擴展性和彈性來構建并運行軟體應用程 序的理念和方法論,在云原生的理念中,所有應用在設計階段就應該考慮如何在云計算的環境下以最佳的方式運行,以發揮云計算的彈性、高容錯、自恢復和按需使用等優勢,云原生的方法論中往往覆寫了微服務、容器、CI/CD、敏捷開發、DevOps等現代的軟體開發技術和理念,
《新程式員》:云原生目前有哪些技術瓶頸和落地痛點?
崔寶秋:一個大型企業落地云原生有兩大類挑戰:一類是容器、編排等硬核技術,另一類是企業服務治理的治理類技術,第一類挑戰屬于硬核技術,這幾年的發展沉淀了一些成熟的基本能力,但隨著云原生在更廣泛領域的應用,我們也面臨著新的挑戰,例如如何能更安全、啟動更快、軟硬一體等,第二類挑戰屬于技術管理的挑戰,是技術、業務、組織之間整體協同的復雜問題,包括新舊技術團隊的劃分、存量業務的治理改造等,
《新程式員》:云原生最核心的就是面向用戶的應用部署,如何穩定、快速地在云上部署一套全生命周期的應用?
崔寶秋:云原生技術在業務側的結果就是改善應用部署,從這個角度看,以應用、服務為核心關注點就是非常自然的了,為達到這個目標,一般有兩條思路,一條是強化基礎服務即代碼思路,讓程式員通過“程式”定義、管理全生命周期;另一條是產品易用化思路,降低產品使用門檻,盡量封裝抽象程序中的安全、質量細節,讓人人都能部署高質量應用,前者更適合專業程式員,后者面向更廣泛的用戶,目前業界有從第一種方式向第二種方式側重的傾向,這也符合技術發展的趨勢,
《新程式員》:企業在構建云原生應用時,怎么才能最大程度發揮云原生的特性?
崔寶秋:云原生的推動焦點不是像虛擬化生態那樣從基礎設施開始自下而上推動變革,而是要求聚焦業務應用,從上而下拆解相關核心能力并落地,中大型的互聯網企業,還是要基于業務對云原生的需求敏捷構建自有的云原生應用和服務平臺,通過不斷積累相關技術能力和組織能力,推動增量業務的使用和存量業務的遷移,在計算存盤分離的基礎上盡量實作資源池化,才能最大程度發揮云原生相關特性,
《新程式員》:有人認為云原生將會向大資料方向發展,對此你有何看法?對于這個方向,你預測會有哪些實際的落地場景和應用?
崔寶秋:我比較認同這個看法,一部分原因是大資料在未來各個領域的重要性會日益明顯,越來越多的應用會離不開大資料,離不開依托于大資料的人工智能,傳統的基于Hadoop生態的大資料系統,存在著彈性不足、維護困難、資源利用率低等一系列問題,因此云原生的某些技術也適合治理大資料生態,例如,在線和離線計算集群的部署可以通過容器化治理實作削峰填谷,進而大量提升資源使用率;云原生應用對有狀態服務的強需求會推動基于高性能分布式存盤技術的飛速演進;容器的鏡像技術能大大加速大資料基礎軟體和系統的迭代更新頻率,確保整體環境的最終一致性等,可以說,大資料方向是云原生治理整個數字化轉型生態的一個重要方向,
《新程式員》:你認為未來云原生技識訓向哪些方向發展?開發者可以關注哪些方面?
崔寶秋:從小米的角度,我們認為云原生有以下幾個發展方向,
其一,容器周邊技術的核心突破,包括計算存盤分離、資源隔離、混合部署、軟硬體結合、安全技術等,解決容器承載有狀態應用以及提升資源利用率一系列問題,
其二,非Java生態的微服務開發框架,目前微服務體系最完善的是Java技術堆疊,其他主流研發語言還需要有更加成熟、民主化的方案來普遍應用,
其三,在數字化轉型的大背景下,傳統架構向微服務架構遷移的工具和解決方案,以及當前主流的低代碼等新技術與云原生的結合,
其四,業務邏輯和基礎服務極致分離,云原生的不可變基礎設施偏IaaS層面,未來PaaS和SaaS層面也會有大量的無狀態服務逐漸范訓和發展,目前典型的例子就是Serverless的大面積使用,
運維和基礎軟體開發者可以關注第一點和第四點,服務端和前端開發者可能更需要關注第二點和第三點,
云原生與AIoT密不可分
《新程式員》:小米集團是從什么時候開始布局云原生的?目前在云原生方向做了哪些事情?
崔寶秋:早在2015年我就讓團隊開始研究容器和微服務,之后很快就開始在一些場景中落地這些技術,有很長一段時間,集團內部同時布局Mesos和 Kubernetes,早期的Mesos比較成熟,但我一直更看好當時不太成熟的Kubernetes,現在看來當時的判斷是對的,
基于這些云原生技術,我們在降低了研發和運維的作業量的同時能支撐業務的高速發展,目前我們在公司范圍內擴大這些技術的應用,在原有研發、運維效率帶來的價值被提升之外,我們也更加注重資源效率的改善,通過云原生技術為業務帶來實質性的成本降低,
這個程序中,我們要解決云原生技術研發以及企業架構治理這兩類挑戰,云原生技術研發包括業務間的混布、利用公有云資源進行彈性伸縮等;企業架構治理包括推進存量服務的服務化治理與改造、規范研發流程、精細化治理資源成本等,
《新程式員》:小米機器學習平臺基于Kubernetes構建,而Kubernetes概念多且復雜,你們在開發程序中有沒有遇到技術難題或者典型問題?另外在使用 Kubernetes時,有哪些建議可以給到其他企業?
崔寶秋:小米在2016年開始根據內部機器學習和深度學習需求,基于Kubernetes構建小米的深度學習服務,開發者可以在云端使用GPU訓練模型,秒級啟動分布式訓練任務,兼容TensorFlow等深度學習框架,也可以一鍵部署訓練好的模型,或者創建基于GPU的開發環境,提供模型開發、訓練、調優、測驗、部署和預測一站式解決方案,
因為CPU機器普遍比較貴,遇到核心問題如何加速深度學習訓練及提升GPU集群資源利用率?我們主要使用RDMA網路提升、訓練網路性能,在Kubernetes調度框架的基礎上實作機器學習場景的調度器,支持更加靈活的GPU調度策略和資源搶占,訓練任務支持公有云彈性等,有效提升GPU集群的資源利用率,
云原生生態已經日趨成熟,CNCF社區也已包含基礎設施的專案,建議新的企業更加積極擁抱云原生和Kubernetes,加入云原生生態,利用生態紅利,站在巨 人肩膀上構建自己的業務,
《新程式員》:小米的硬體產品有很多,硬體+云原生技術是否會列入小米集團下一步的發展計劃中,計劃做哪些事情?
崔寶秋:“硬體+云原生”技術早已是小米集團的一部分,眾所周知,“手機×AIoT”是小米的核心戰略,這里面不管是手機還是任何AIoT設備,都是智能硬體、智能設備,而智能設備的一大特點就是互聯互通,并利用云計算、大資料和人工智能給用戶提供各種智能服務,所以,小米硬體和云原生技術一直是密不可分的,這也一直是小米技術發展的方向,
《新程式員》:未來,人工智能與云原生會碰撞出怎樣的火花?
崔寶秋:一方面,人工智能可以解決云原生領域的決策和優化問題,例如,AIOps技術就用于解決運維的決策問題,這背后是由于容器、微服務等一系列應用構建流程的標準化,會產生大量結構化資料,有了資料就可以通過人工智能實作智能決策和自動化執行,提升系統效率和可靠性,另一方面,云原生技術也能讓人工智能服務變得唾手可得,通過將人工智能的能力基于云封裝成服務,可以讓更多軟體參考豐富的人工智能服務的能力,提升軟體產品的用戶體驗,
云原生與開源互利協作
《新程式員》:你一直在推動開源的發展,請用幾個詞簡單概括你對開源的認識或態度?
崔寶秋:開放、共享、共建、未來、平臺、模式、競爭力,
《新程式員》:面對不斷更迭的技術市場,你認為開源的核心競爭力是什么?
崔寶秋:互聯網的力量,群體和社區的力量,
《新程式員》:可以談談開源和云原生的關系嗎?
崔寶秋:開源起源于早年的自由軟體運動,沒有自由軟體運動,就沒有GNU,就沒有GNU/Linux,就沒有今天的開源,不夸張地講,沒有自由軟體和開源軟體,就沒有今天的云計算、大資料和人工智能技術的快速成熟,也就沒有今天人們談論的云原生,經過這些年的發展,開源已經成為了主流的軟體開發協作模式,在云原生技術領域,CNCF開源基金會對云原生的發展起到了非常大的促進作用,相信未來開源模式會繼續促進云原生技術持續發展,
《新程式員》:有人說開源是云原生環境的首選或未來,你怎么看?原因是什么?
崔寶秋:我高度認同這個說法,因為我相信開源是軟體的未來,近些年出現了很多采用開源模式的商業公司,借助云的環境與生態快速發展成大型軟體企業,獲得了商業上的成功,于是也自然有更多公司復制這種模式,開源和云的結合是一種趨勢,
在這背后,是開源軟體廠商和云廠商積極地擁抱彼此的優勢,相互促進發展,開源模式為云廠商帶來了跨廠商的標準化,消除了用戶對單一廠商系結的顧慮;而云廠商的云原生環境也為開源軟體帶來了優秀的底層基礎設施,讓軟體的部署發布變得更容易、規模更大,這種互利的協作,相信還會持續,會給業界帶來更大的變化,
《新程式員》:未來所有的軟體都會走向開源嗎?你如何看待國內許多開源專案的不可持續性?
崔寶秋:我相信開源是軟體的未來,但這不等于所有的軟體都一定會開源,我認為通用的、有一定普世價值的軟體,尤其是那些具有長期價值、需要長期投入、大量參與者一起打造的軟體需要開源,國內很多開源專案不可持續,第一個原因是這些專案開源的初心就不對,有很多專案是為了開源而開源、為了KPI而開源,沒有長期和社區共建的必要性,原作者可能也根本沒有這方面的打算,第二個原因較普遍,是專案背后的作者或者企業沒有長期投入的資源和決心,第三個原因就是很多人對如何維護一個開源專案、如何打造一個活躍的開源社區沒有足夠經驗,
《新程式員》:目前,國內云原生開源社區的成熟度與參與度還不足夠,你有什么想對開發者、企業、開源社區說的嗎?
崔寶秋:首先,我比較樂觀,我認為我國的開源力量在迅速崛起,開源運動在國內如火如荼,我們的云原生社區的成熟度和參與度會越來越好,其次,我給開發者、企業和開源社區的一些建議是:建議大家都能真正理解開源的精神、理念和方法論,真正做到開放、平等、共享、共建,真正形成合力,共同打造屬于我們所有人的開源社區,少一些為開源而開源、為KPI而開源、純為技術品牌或者影響力而開源的現象,
本文出自《新程式員·云原生和全面數字化實踐》,在《新程式員003》中,我們聚焦“云原生時代的開發者”與“全面數字化轉型”兩大主題,阿里、位元組跳動、網易、快手、亞馬遜等互聯網大廠的云原生技術的賦能者,從技術定義、技術應用、實踐案例分享等方面,以直擊內核的硬核輸出全面決議云原生,幫助開發者在云原生時代快速找到適合自身發展的技術范式,
同時,我們也將對微軟、英特爾、華為、施耐德、西門子等首批開啟數字化轉型的企業展開報道,通過十多位技術專家分享的鮮活案例,一窺金融、新零售、工業物聯網等領域的數字化轉型成果,幫助更多關注數字化轉型的開發者從先驅者的經驗中獲得啟迪,
閱讀更多相關技術文章及行業資訊,歡迎訂閱《新程式員003》紙質書+電子書:https://mall.csdn.net/item/92470?utm_source=774607806

全年訂閱(001-004期)尊享更多會員福利

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/431478.html
標籤:AI
