在幾個檔案中,我想提取行(及其編號)
- 其中包含 ClNonZ 模式
- 并且具有值“真實”作為第一個屬性。
對于單一檔案,我得到了換行方面的尊重。
但是我有幾個檔案,所以我做了一個“for”回圈,然后在沒有換行的情況下顯示了一個檔案的多次出現
例子:
$ cat foo1.txt
A TEST 0.959660297 0 0.021231423 -0.0073 -0.0031 MhZisp
B REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ
C REAL 0.98089172 0 0 -0.0158 0.0124 MhNonZ
D TEST 0.704883227 0.265392781 0.010615711 -0.0087 -0.0092 MhZisp
E REAL 0.010615711 0.959660297 0.010615711 0.0476 0.0061 ClNonZ
F TEST 0.704883227 0.265392781 0.010458211 0.0865 0.0548 ClNonZ
$ cat foo2.txt
A TEST 0.715498938 0 0.265392781 -0.0013 -0.0309 Unkn
B REAL 0.927813163 0 0.053078556 -0.0051 -0.0636 MhZisp
C TEST 0.55626327 0.222929936 0.201698514 0.0053 -0.0438 MhZisp
D REAL 0.492569002 0.350318471 0.138004246 0.0485 0.0088 ClNonZ
E REAL 0.704883227 0.265392781 0.010615711 0.0476 0.0061 AbbbbZ
F REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ
沒有回圈的 grep :結果對我來說沒問題,有換行符:
$ grep -n ClNonZ foo1.txt | awk '$2 == "REAL" {print $0}'
2:B REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ
5:E REAL 0.010615711 0.959660297 0.010615711 0.0476 0.0061 ClNonZ
grep 在 for 回圈中:糟糕的演示文稿,換行符消失了:
$ for file in `ls foo*` ; do line=`grep -n ClNonZ $file | awk '$2 == "REAL" {print $0}' `; if [[ -n "$line" ]]; then echo $file ; echo $line ; echo " " ; fi ; done
foo1.txt
2:B REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ 5:E REAL 0.010615711 0.959660297 0.010615711 0.0476 0.0061 ClNonZ
foo2.txt
4:D REAL 0.492569002 0.350318471 0.138004246 0.0485 0.0088 ClNonZ 6:F REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ
我嘗試使用“while”而不是“for”(如@chepner 建議的http://mywiki.wooledge.org/BashFAQ/001中所述)但沒有成功。
你有什么想法可以幫助我嗎?
uj5u.com熱心網友回復:
這里的主要問題是您沒有雙引號參考變數參考,尤其是在echo $line(should be echo "$line") 中。這通常會導致這樣的問題。請參閱“我剛剛分配了一個變數,但echo $variable顯示了其他內容”和“我何時應該對引數擴展進行雙引號?” (簡短的回答:幾乎總是)。
Shellcheck.net擅長指出此類常見錯誤,并且還會為您的代碼提供一些其他好的建議。我推薦使用它!
但是,在這種情況下,我很想替換整個 bash grep awk 的東西,因為 awk 可以自己完成這一切:
awk 'FNR==1 {needheader=1}; ($0 ~ /ClNonZ/ && $2 == "REAL") {if (needheader) {print ""; print FILENAME; needheader=0}; print}' foo*.txt
解釋:
FNR==1 {needheader=1}-- 這在每個檔案的開頭觸發(FNR是當前檔案中的行號,所以如果它是 1,這是檔案的開頭)并設定一個變數,表示如果有匹配,則需要列印檔案名。($0 ~ /ClNonZ/ && $2 == "REAL")-- 如果“ClNonZ”出現在該行中,并且第二個欄位是“REAL”,那么在{ }. 注意:您真的想在整行中搜索“ClNonZ”,還是只搜索最后一個欄位?如果它只是最后一個欄位,請使用$NF == "ClNonZ")if (needheader) {print ""; print FILENAME; needheader=0}-- 如果這是該檔案中的第一個匹配項,則列印一個空行和檔案名,然后清除表示需要列印這些內容的變數。print-- ...并列印該行。請注意,$0這里是隱含的,并且由于這仍然在{ }步驟 2 中,因此僅當行匹配時才會發生。foo*.txt-- 只需將所有匹配的檔案名awk作為引數傳遞給它,然后讓它批量掃描所有檔案名。
uj5u.com熱心網友回復:
試試rq(https://github.com/fuyuncat/rquery/releases)
下面的命令很容易理解,它將搜索所有檔案并回傳任何等于'ClNonZ'的列和等于'REAL'的第二列。
[ rquery]$ ./rq -q "s @raw | f anycol(1,%,$)='ClNonZ' and @2='REAL'" samples/foo*
B REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ
E REAL 0.010615711 0.959660297 0.010615711 0.0476 0.0061 ClNonZ
D REAL 0.492569002 0.350318471 0.138004246 0.0485 0.0088 ClNonZ
F REAL 0.180467091 0.800424628 0 0.0566 0.0103 ClNonZ
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/520106.html
下一篇:從兩個不同的輸出中劃分浮點數
