我有一個看起來像這樣的檔案:
1 snp1 0.0 4
1 snp2 0.2 6
1 snp3 0.3 4
1 snp4 0.4 3
1 snp5 0.5 5
1 snp6 0.6 6
1 snp7 1.3 5
1 snp8 1.3 3
1 snp9 1.9 4
檔案按第 3 列排序。我想要每隔 0.5 個單位按第 3 列分組的第 4 列的平均值。例如它應該像這樣輸出:
1 snp1 0.0 4.4
1 snp6 0.6 6.0
1 snp7 1.3 4.0
1 snp9 1.9 4.0
我可以像這樣列印沒有平均值的所有位置:
awk 'NR==1 {pos=$3; print $0} $3>=pos 0.5{pos=$3; print $0}' input
但我無法弄清楚如何列印第 4 列的平均值。如果有人可以幫助我找到解決此問題的方法,那就太好了。謝謝!
uj5u.com熱心網友回復:
像這樣的事情,也許:
awk '
NR==1 {c1=$1; c2=$2; v=$3; n=1; s=$4; next}
$3>v 0.5 {print c1, c2, v, s/n; c1=$1; c2=$2; v=$3; n=1; s=$4; next}
{n =1; s =$4}
END {print c1, c2, v, s/n}
' input
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/317373.html
上一篇:Unix將時間格式轉換為整數值
