陳天奇開發的rabit,Rabit實作Allreduce和Broadcast的API,想問一下有人用過嗎。
最近寫程式需要實作集群中不同節點之間的通信,希望,可以得到大家的建議,謝謝大家
uj5u.com熱心網友回復:
樓主,您好不知道你的問題解決了沒有,最近我也在用xgboost進行分布式集群研究,rabit主要是從MPI的介面抽象出來,實際上的通信機制還是MPI,在xgboost中已經嵌入了rabit的介面,可以直接使用xgb.rabit進行使用,不久前又看到有人使用slurm進行集群調度實作分布式計算,目前我還僅僅是初識了一些分布式和集群的知識。
如果樓主的問題已經解決,希望樓主可以寫一些博客分享出來。
uj5u.com熱心網友回復:
我是做表示學習方向的,去年研究過一段時間rabit,摸索著安裝成功之后,后來發現rabit框架和我的研究內容不太相符,后來開始自己動手寫分布式框架就沒有再用過rabit了。rabit安裝相關的流程我寫過一篇博文,就在我的主頁。以后有問題可以一起交流呀 :)uj5u.com熱心網友回復:
難得碰到做分布式深度學習的同學啊!
uj5u.com熱心網友回復:
哈哈哈,大家可以多交流呀
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/14327.html
標籤:網絡通信/分布式開發
上一篇:有個編程小問題,麻煩大佬們幫忙看看,這個是怎么運行的
下一篇:ADOQuyer的問題,求教
