一.MapReduce流程介紹
假設我們有一個任務:用于統計一個檔案當中一個單詞出現的總次數,查詢結果保存到兩個檔案里,一個裝載a-p單詞出現的次數,一個檔案裝載q-z單詞出現的個數,下面是這個任務使用mapreduce實作的具體流程:

MapReduce當中需要注意的是:
1.一個MapReduce程式運行之后,Map和Reduce階段都可以并行執行,但是每次一個MapReduce程式只能處理一個任務,不能夠多個任務并行執行,一個任務當中的每一步可以并行執行,
2.MapReduce如果想要處理多個任務,只能進行串行執行
二.MapReduce中的行程
在進行分布式運行的時候,一共MapReduce任務僅有三個行程,如下所示:

三.MapReduce編程規范
1.Mapper階段

2.Reducer階段和Driver階段
在Mapper階段執行完畢之后,開始Reducer階段的執行,如下圖所示:

完畢!!!
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/247114.html
標籤:其他
上一篇:微眾銀行案例|容器化實踐在金融行業落地面臨的問題和挑戰
下一篇:移動通信
