在for回圈中使用grep時如何在多行上格式化結果-有解無憂

在幾個檔案中，我想提取行（及其編號）

其中包含 ClNonZ 模式
并且具有值“真實”作為第一個屬性。

對于單一檔案，我得到了換行方面的尊重。

但是我有幾個檔案，所以我做了一個“for”回圈，然后在沒有換行的情況下顯示了一個檔案的多次出現

例子：

$ cat foo1.txt
A TEST 0.959660297 0 0.021231423 -0.0073 -0.0031 MhZisp
B REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ
C REAL 0.98089172 0 0 -0.0158 0.0124 MhNonZ
D TEST 0.704883227 0.265392781 0.010615711 -0.0087 -0.0092 MhZisp
E REAL 0.010615711 0.959660297 0.010615711 0.0476 0.0061 ClNonZ
F TEST 0.704883227 0.265392781 0.010458211 0.0865 0.0548 ClNonZ

$ cat foo2.txt
A TEST 0.715498938 0 0.265392781 -0.0013 -0.0309 Unkn
B REAL 0.927813163 0 0.053078556 -0.0051 -0.0636 MhZisp
C TEST 0.55626327 0.222929936 0.201698514 0.0053 -0.0438 MhZisp
D REAL 0.492569002 0.350318471 0.138004246 0.0485 0.0088 ClNonZ
E REAL 0.704883227 0.265392781 0.010615711 0.0476 0.0061 AbbbbZ
F REAL 0.180467091 0.800424628 0 0.0566    0.0103  ClNonZ

沒有回圈的 grep ：結果對我來說沒問題，有換行符：

$  grep -n ClNonZ foo1.txt  | awk '$2 == "REAL" {print $0}'

2:B REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ
5:E REAL 0.010615711 0.959660297 0.010615711 0.0476 0.0061 ClNonZ

grep 在 for 回圈中：糟糕的演示文稿，換行符消失了：

$  for file in `ls foo*` ; do line=`grep -n ClNonZ $file | awk '$2 == "REAL" {print $0}' `; if [[ -n "$line" ]]; then  echo $file ; echo $line ; echo " " ; fi ; done

foo1.txt
2:B REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ 5:E REAL 0.010615711 0.959660297 0.010615711 0.0476 0.0061 ClNonZ
 
foo2.txt
4:D REAL 0.492569002 0.350318471 0.138004246 0.0485 0.0088 ClNonZ 6:F REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ

我嘗試使用“while”而不是“for”（如@chepner 建議的http://mywiki.wooledge.org/BashFAQ/001中所述）但沒有成功。

你有什么想法可以幫助我嗎？

uj5u.com熱心網友回復：

這里的主要問題是您沒有雙引號參考變數參考，尤其是在echo $line(should be echo "$line") 中。這通常會導致這樣的問題。請參閱“我剛剛分配了一個變數，但echo $variable顯示了其他內容”和“我何時應該對引數擴展進行雙引號？” （簡短的回答：幾乎總是）。

Shellcheck.net擅長指出此類常見錯誤，并且還會為您的代碼提供一些其他好的建議。我推薦使用它！

但是，在這種情況下，我很想替換整個 bash grep awk 的東西，因為 awk 可以自己完成這一切：

awk 'FNR==1 {needheader=1}; ($0 ~ /ClNonZ/ && $2 == "REAL") {if (needheader) {print ""; print FILENAME; needheader=0}; print}' foo*.txt

解釋：

FNR==1 {needheader=1}-- 這在每個檔案的開頭觸發（FNR是當前檔案中的行號，所以如果它是 1，這是檔案的開頭）并設定一個變數，表示如果有匹配，則需要列印檔案名。
($0 ~ /ClNonZ/ && $2 == "REAL")-- 如果“ClNonZ”出現在該行中，并且第二個欄位是“REAL”，那么在{ }. 注意：您真的想在整行中搜索“ClNonZ”，還是只搜索最后一個欄位？如果它只是最后一個欄位，請使用$NF == "ClNonZ")
if (needheader) {print ""; print FILENAME; needheader=0}-- 如果這是該檔案中的第一個匹配項，則列印一個空行和檔案名，然后清除表示需要列印這些內容的變數。
print-- ...并列印該行。請注意，$0這里是隱含的，并且由于這仍然在{ }步驟 2 中，因此僅當行匹配時才會發生。
foo*.txt-- 只需將所有匹配的檔案名awk作為引數傳遞給它，然后讓它批量掃描所有檔案名。

uj5u.com熱心網友回復：

試試rq（https://github.com/fuyuncat/rquery/releases）
下面的命令很容易理解，它將搜索所有檔案并回傳任何等于'ClNonZ'的列和等于'REAL'的第二列。

[ rquery]$ ./rq -q "s @raw | f anycol(1,%,$)='ClNonZ' and @2='REAL'" samples/foo*
B REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ
E REAL 0.010615711 0.959660297 0.010615711 0.0476 0.0061 ClNonZ
D REAL 0.492569002 0.350318471 0.138004246 0.0485 0.0088 ClNonZ
F REAL 0.180467091 0.800424628 0 0.0566    0.0103  ClNonZ

轉載請註明出處，本文鏈接：https://www.uj5u.com/caozuo/520106.html

標籤：重击for循环grep格式输出

上一篇：將stdout和stderr重定向到不同的行程

下一篇：從兩個不同的輸出中劃分浮點數