我有兩個 csv 檔案,兩個檔案都有記錄。我想洗掉重復的記錄。我想獲得獨特的記錄。我怎樣才能用 Apache Nifi 做到這一點?
謝謝 !
輸入1.csv;
id,surname,name
1,ali,veli
2,mert,tolga
輸入2.csv;
id,surname,name
1,ali,veli
3,ahmet,ozan
輸出.csv ;
id,surname,name
1,ali,veli
2,mert,ay?e
3,ahmet,ozan
uj5u.com熱心網友回復:
您可以通過執行基于記錄的處理并結合 MergeRecord 將兩個 csv 檔案合并為一個來實作這一點,然后您可以使用 QueryRecord 處理器進行重復資料洗掉,例如:
SELECT * FROM FLOWFILE
INTERSECT
SELECT * FROM FLOWFILE
SELECT DISTINCT FROM FLOWFILE 將不起作用。這里是方解石檔案
輸出:

轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/391123.html
標籤:文件 apache-nifi
上一篇:如何用較少的代碼撰寫這些函式?
