我有兩個超大資料集,一個是ip地址串列,另一個是網路prefix串列。
例如:ip_list(192.168.0.1, 192.168.0.2, 192.168.1.9, 172.16.1.100...), prefix_list(192.168.0.0/16, 172.16.1.0/24...)
需要將左邊的ip和右邊所有prefix串列進行匹配,得出所有prefix中包含的ip個數。
例如對于以上例子最終結果應該為(192.168.0.0/16, 3), (172.16.1.0/24, 1),即對于ip串列(192.168.0.1, 192.168.0.2, 192.168.1.9, 172.16.1.100)有3個ip屬于192.168.0.0/16這個網段,有1個ip屬于172.16.1.0/24這個網段。
請問各位,這個用spark該如何實作呢?
uj5u.com熱心網友回復:
使用spark sql轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/98144.html
標籤:其他數據庫
下一篇:sql查詢問題 mysql
