AWK：比較2個csv檔案中的2列，輸出到第三列。如何獲得與另一個檔案不匹配的輸出？-有解無憂

我目前有以下腳本： awk -F, 'NR==FNR { a[$1 FS $4]=$0; next } $1 FS $4 in a { printf a[$1 FS $4]; sub($1 FS $4,""); print }' file1.csv file2.csv > combined.csv

這將比較來自兩個 csv 檔案的兩列 1 和 4，并將兩個檔案的結果輸出到 combine.csv。是否可以輸出檔案 1 和檔案 2 中與具有相同 awk 行的其他檔案不匹配的行？或者我需要做單獨的決議嗎？

File1
ResourceName,ResourceType,PatternType,User,Host,Operation,PermissionType
BIG.TestTopic,Cluster,LITERAL,Bigboy,*,Create,Allow
BIG.PRETopic,Cluster,LITERAL,Smallboy,*,Create,Allow
BIG.DEVtopic,Cluster,LITERAL,Oldboy,*,DescribeConfigs,Allow

File2
topic,groupName,Name,User,email,team,contact,teamemail,date,clienttype
BIG.TestTopic,BIG.ConsumerGroup,Bobby,Bigboy,[email protected],team 1,Bobby,[email protected],2021-11-26T10:10:17Z,Consumer
BIG.DEVtopic,BIG.ConsumerGroup,Bobby,Oldboy,[email protected],team 1,Bobby,[email protected],2021-11-26T10:10:17Z,Consumer
BIG.TestTopic,BIG.ConsumerGroup,Susan,Younglady,[email protected],team 1,Susan,[email protected],2021-11-26T10:10:17Z,Producer

combined
BIG.TestTopic,Cluster,LITERAL,Bigboy,*,Create,Allow,BIG.TestTopic,BIG.ConsumerGroup,Bobby,Bigboy,[email protected],team 1,Bobby,[email protected],2021-11-26T10:10:17Z,Consumer
BIG.DEVtopic,Cluster,LITERAL,Oldboy,*,DescribeConfigs,Allow,BIG.DEVtopic,BIG.ConsumerGroup,Bobby,Oldboy,[email protected],team 1,Bobby,[email protected],2021-11-26T10:10:17Z,Consumer

Wanted additional files:

non matched file1:
BIG.PRETopic,Cluster,LITERAL,Smallboy,*,Create,Allow

non matched file2:
BIG.TestTopic,BIG.ConsumerGroup,Susan,Younglady,[email protected],team 1,Susan,[email protected],2021-11-26T10:10:17Z,Producer```

again, I might be trying to do too much in one line? would it be wiser to run another parse?

uj5u.com熱心網友回復：

假設 $1 和 $4 的密鑰對在每個輸入檔案中是唯一的，然后在每個 Unix 機器上的任何 shell 中使用任何 awk：

$ cat tst.awk
BEGIN { FS=OFS="," }
FNR==1 { next }
{ key = $1 FS $4 }
NR==FNR {
    file1[key] = $0
    next
}
key in file1 {
    print file1[key], $0 > "out_combined"
    delete file1[key]
    next
}
{
    print > "out_file2_only"
}
END {
    for (key in file1) {
        print file1[key] > "out_file1_only"
    }
}

$ awk -f tst.awk file{1,2}

$ head out_*
==> out_combined <==
BIG.TestTopic,Cluster,LITERAL,Bigboy,*,Create,Allow,BIG.TestTopic,BIG.ConsumerGroup,Bobby,Bigboy,[email protected],team 1,Bobby,[email protected],2021-11-26T10:10:17Z,Consumer
BIG.DEVtopic,Cluster,LITERAL,Oldboy,*,DescribeConfigs,Allow,BIG.DEVtopic,BIG.ConsumerGroup,Bobby,Oldboy,[email protected],team 1,Bobby,[email protected],2021-11-26T10:10:17Z,Consumer

==> out_file1_only <==
BIG.PRETopic,Cluster,LITERAL,Smallboy,*,Create,Allow

==> out_file2_only <==
BIG.TestTopic,BIG.ConsumerGroup,Susan,Younglady,[email protected],team 1,Susan,[email protected],2021-11-26T10:10:17Z,Producer

out_file1_only 中的行順序將由in操作員改組- 如果這是一個問題，請告訴我們，因為這是一個簡單的調整來保留輸入順序。

轉載請註明出處，本文鏈接：https://www.uj5u.com/qiye/372811.html

標籤：文件 awk

上一篇：如何使用python將資料從csv檔案添加到json鍵中

下一篇：寫入硒資料時清空CSV