同時如何理解MR是基于資料流這句話呢?
uj5u.com熱心網友回復:
我理解的是這樣的,作業集是指行程已映射的物理記憶體部分(即這些記憶體塊全在物理記憶體中,并且CPU可以直接訪問),還有一部分不在作業集中的虛擬記憶體則可能在轉換串列中(CPU不能通過虛地址訪問,需要Windows映射之后才能訪問),還有一部分則在磁盤上的頁面檔案里,這里的spark作業集也就是基于記憶體的;而MR是頻繁與磁盤資料互動,也可以說是基于磁盤資料流的。希望繼續有更好的答案。轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/23943.html
標籤:Spark
上一篇:余生,不回頭,不浪費,不將就
下一篇:vmware6如何接入互聯網專線
