數智化時代,資料已成為最核心、最具價值的生產要素,其中,如何應用可落地的技術,共享和保護資料,促進資料要素進一步流通,釋放資料價值,受到業內普遍關注,
隱私計算,被業內譽為打破“資料隱私安全與共享矛盾的唯一技術解”,是大資料、人工智能及產業創新驅動不可或缺的關鍵技識訓節,隨著資料與計算進一步融合,數字產業化加速推進,如何運用隱私計算實作資料“可用不可見”,形成業內亮眼、標桿性的應用案例,成為多領域客戶的共性需求,
這個答案,或許是翼方健數,公開資訊顯示,翼方健數致力于打造“資料和計算互聯網(IoDC)”,以多方安全計算、區塊鏈等技術為核心,從安全、可信等技術要求出發,正幫助行業各方實作資料可用不可見,保障資訊安全,挖掘資料的價值,

著眼實際,務實有效的資料平臺究竟是怎樣的?行業有哪些亟需解決的難題?在11月10日的Data X大會暨翼方健數戰略發布會上,翼方健數首席科學家張霖濤歸納行業的三個痛點:
首先,優秀的資料平臺必須要做到能匯聚不同源頭資料,還要在資料不可見的情況下挖掘資料價值,平臺需要解決的首要問題:如何保護資料隱私和安全?
其次,在IoDC場景下,資源分布在廣泛的網路中,如何利用技術支持應用的資料需求?
最后,資料資產分配產生的價值如何有效分配,如何確保貢獻者的長期權益?

從這些難題出發,張霖濤推匯出優秀的資料平臺應該具備的三大核心能力:
資料全生命周期管理:搭建從資料清洗、資料管理、資料標注、資料價值抽取,資料價值分配、資料交易等等的一系列工具和應用,資料真正能用、可用和好用,
堅實的隱私安全計算技術體系:圍繞XDP平臺的隱私安全計算能力,從單體平臺到聯邦平臺再到IoDC,從沙箱到TEE到MPC和聯邦學習,在隱私安全計算賽道建立最有競爭力的全堆疊解決方案,
AI驅動且可差異化應用:AI為核心,大資料驅動,在垂直行業利用資料和AI能力為行業客戶獲取最大化價值,
瞄準客戶成功的目標,圍繞“用隱私安全計算技術解鎖資料價值“,張霖濤詳細介紹翼方健數提出的路徑——全堆疊技術解決方案,才能為資料平臺的構建帶來新啟發,并為邁向資料和計算互聯網打下堅實基礎,
隱私安全計算平臺是核心底座
平臺為用,架構先行,為打造適合IoDC時代的全堆疊技術平臺,翼方健數先推匯出的是核心的XDP隱私安全計算平臺架構,

XDP平臺架構主要由四部分組成:
- 底層的XDP檔案系統(XFS,XDP File System)用以存盤資料,保證資料安全,
- 中間層是執行引擎XEE,
- 臨近應用的一層支持各種計算環境,包括安全沙箱、可信執行環境、安全計算引擎和聯邦學框架,
- 最頂層用來支持客戶的需求,部署各種應用,
張霖濤指出,底層部件XFS最為重要,如同物流倉,它決定了”資料究竟存在何處,結構是否清晰,能否支持快速呼叫“,
XFS專為IoDC打造,是一個分布式檔案系統,XFS主要提供四大能力:首先是提供高規格安全保護,基于密鑰管理系統,對資料實作強隔離、多層次的加密、細顆粒度的訪問控制及可編程的生命周期管理,保證資料遵循“最小使用原則”;
其次,XFS具備全方位的計算支持,可以滿足大資料和機器學習的多種需求;
此外,XFS具有卓越性能和跨平臺能力,可兼容NVMe,RDMA等高性能存盤技術,全面管理IoDC資料存盤資源;
最后是有經濟高效的使用方式,XFS支持如塊存盤、物件存盤等,可實作資料平滑遷移,
有這樣可靠的檔案系統,客戶可以放心匯聚、存盤資料,上層的XDP DaaS Engine(XDaaS) 的應用才可進一步對資料進行發現與整合,
XDaaS提供可擴展的主資料,實作多資料源間的有效融合,XDaaS同時提供高效的資料探查能力,最后實作cell級別的來源追蹤,在使用程序中,XDaaS還能對敏感資料加以保護,
資料到位后,按需調動資源,執行引擎XEE(XEE,XDP Execution Engine)開始進行運算,
XEE可使用多種底層計算基礎設施,支持云和私有化部署,對硬體環境要求不高,提供多種計算模式,包括批量處理流式計算等,此外,XEE支持基于瀏覽器的多種互動模式,因此,XEE可做到統籌管理IoDC中的全網路計算資源,

如何保障計算的安全性和可擴展性?PCT層運用了多種技術、環境與框架,
不同于傳統沙箱計算環境,翼數安全沙箱(XDP Secure Sandbox)滿足單體平臺上“軟體可信,用戶不可信”的安全假設,系統管理員在安全信任體系之外,能充分防范平臺運維的違規操作,它為單體平臺提供“零信任”的本地計算環境,
在有可信硬體情況下,翼方健數通過可信執行環境XTEE,為客戶提供安全、高效、通用的端到端可信執行環境,并運用硬體完成對軟體的驗證,簡而言之,XTEE可以加快遠程證明、提供TEE運行時加密檔案系統的支持,
對于上層的聯邦學習技術能力,一方面,翼方健數還打造了一套聯邦學習框架XFL,其從底層實際情況出發,具有豐富的自定義介面,兼具高安全性和高擴展性的特征,XFL支持海量插件,覆寫主流演算法,資料不出域,也能在支持主流環境下進行安全聯合建模,

除前期產品技術能力實作之外,翼方健數仍實時回應客戶訴求,持續迭代產品功能,
由于在客戶需求調研中發現,很多應用場景同步對機器學習和通用計算都有需求,為此,翼方健數開發密文計算框架XSC,
XSC框架具有高完備性、靈活部署和集成開放的跨平臺特性,XSC支持高效完備的演算法庫,可以部署各種硬體,支持集成其他的開源隱私計算框架,張霖濤還透露,聯邦學習框架XFL和密文計算框架XSC在未來都會開源,
“保姆級”的資料全生命周期管理

除讓資料實作安全、可信計算外,隱私計算平臺匯集資料后,在實際應用場景中,客戶又提出了新的疑問:如何解決資料管理,資料價值分配和資料確權的問題?
翼方健數認為,區塊鏈技術在這一板塊優勢明顯,但同樣需要和隱私安全計算技術打配合,
翼方健數通過結合隱私安全計算與區塊鏈技術,開發Xledger為XDP聯盟和IoDC提供不可篡改的資料存證與智能合約,對資料實作全生命周期管理,智能合約保障價值分配,保證資料所有者的權益,
如果客戶想要更高效率地獲取高質量資料,怎么辦?
翼方健數自主研發資料標注工具GoldFinger,不僅支持高效率的用戶標注,還可以更好服務AI應用需求,GoldFinger可以保證資料在使用時嚴格隔離,預標注能力還可擴展為眾包模式,兼顧效率與安全,
客戶在清洗資料時標準不明確,效果差,出現大量無效作業,何解?
那就回應需求,翼方健數開發資料治理工具DataWand,
傳統的ETL手段費時費力且沒有統一標準,清洗規則效果差,重復利用率低,也有資料泄露風險,
DataWand都可以解決以上問題,不僅可以對資料大規模標注,在保證資料安全情況下,演算法還能持續迭代,為后續的資料清洗提供服務,據張霖濤介紹,DataWand目前已經在城市級別資料中取得很好的應用效果,這也為后續客戶在選擇時提供了更多參考依據,
資料儲存在哪里?你們是技術供應商,交付后能否保證客戶有完全的控制權限?
張霖濤表示,翼方健數本身并不擁有資料,資料的控制權需要由資料擁有方來做授權,換句話說,翼方健數是“零資料的大資料公司”,
賦能各行業,AI驅動的差異化應用

隱私安全技術可以解決安全與效率的問題,
然而在客戶決策前,是否已有成功先例,仍是重要的拍板依據,
翼方健數早已在醫療、生信、政務等垂直領域完成多項AI業務挑戰,儲備諸多應用案例,
僅以醫療行業客戶為例,翼方健數建立業界領先的,基于深度學習的診療合理性內核,
診療模型基于采集的資料,通過與庫內特征比對,對疾病作出預測和預警,如做智能多點觸發疾控解決方案,以此來預測傳染病的發病情況和未來走勢,
基于知識圖譜,翼方健數輔助構建醫學資料庫,幫助醫生/科研人員系統地從各種資料中抽取出有效資訊,
診療合理性內核已經應用到醫院端的CDSS(臨床決策支持系統)和醫療質控中,進一步幫助醫生提質增效降風險,相關資料在授權后,還可應用于科研院所和政策研究機構,
全堆疊化解決方案,是隱私計算技術落地難的最優解法
張霖濤認為,若想通過隱私計算去最大化資料價值,單一技術顯然無法提供“完美”的解決方案,
如果要為各行各業創造真正的資料價值,使資料和計算資源充分流動,隱私安全計算企業或許還要考慮得更為現實且深遠,全堆疊化解決方案或許才是隱私計算技術落地難題的最優解法,
但是,對于技術供應商而言,最優解法注定會更為艱辛,抵達星辰大海之前,一路絕非坦途,
構建IoDC(資料和計算互聯網)是翼方健數的愿景與目標,若要達成這一目標,一方面,翼方健數需要不斷迭代各類技術方案,為客戶多想一步,適應應用場景的變化;另一方面,翼方健數還需促成行業共識,使不同的平臺間資料互通,為彼此產生價值,不過,這條路徑一旦走通之后,必定會撬動指數級的數字化市場份額,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/357267.html
標籤:AI
上一篇:Kafka在實時資料開發中的應用
