各位高手,請問用MapReduce怎么實作這個演算法:
10分鐘內2個不同顧客在不同日期出現的次數。
比如
2021-03-10 09:00:00 張三
2021-03-10 09:01:00 李四
2021-03-10 09:02:00 王五
2021-03-29 10:00:00 張三
2021-03-29 10:01:00 李四
2021-03-30 09:03:00 張三
2021-03-30 09:05:00 李四
2021-03-30 09:15:00 王五
結果是 張三李四 3
張三王五 1
李四王五 2
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/270156.html
標籤:分布式計算/Hadoop
上一篇:hive啟動報錯
