我有 336 個 txt 檔案,每個 txt 檔案有 4 列。我需要幫助來查找所有 txt 檔案中第 2 列(基因)中常見或匹配的字串,并在新的 txt 檔案中提取該資訊。
例如:“kdpDE beta”存在多少次,如果存在則在輸出 txt 檔案的下一列中列印“1”,如果“kdpDE beta”不存在則列印“0”。
謝謝您的幫助。
File_1.txt
Name Gene Family Class
KB2908 kdpE beta aminoglycoside lactamase
KB2908 ugd peptide transferase
File_2.txt
Name Gene Family Class
KB2909 kdpE beta aminoglycoside lactamase
KB2909 ugd peptide transferase
KB2909 PmrF macrolide phosphotransferase
uj5u.com熱心網友回復:
您可以使用grepwithwc來獲取檔案中某個字串的計數。您可以使用腳本回圈遍歷它,以便對目錄中的每個檔案執行此操作。下面會回圈遍歷目錄,統計每個檔案出現的次數<search term>,并輸出到一個名為output.txt.
for FILE in *; do
echo $FILE >> output.txt
grep -o -i '<search term>' $FILE | wc -l >> output.txt
echo >> output.txt
done
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/410228.html
標籤:
上一篇:用逗號替換空格,括號內的文本除外
下一篇:將字串從一個位置剪切到一個字符
