任務
我需要使用軟體 plink 進行關聯研究。輸入所有資料并進行所有計算后,我得到一個檔案/表,如下所示:
CHR SNP A1 A2 TEST AFF UNAFF CHISQ DF P
1 rs10458597 T C TREND 4/230 13/973 0.1565 1 0.6924
1 rs2185539 T C TREND 7/231 0/1000 29.75 1 4.92e-08
1 rs11240767 T C TREND 10/228 15/985 6.206 1 0.01273
1 rs12564807 G A TREND 0/238 0/1000 NA NA NA
1 rs3131972 A G TREND 82/156 259/741 6.618 1 0.0101
1 rs3131969 A G TREND 86/150 253/733 9.629 1 0.001916
1 rs3131967 T C TREND 73/157 212/768 9.407 1 0.002162
1 rs1048488 C T TREND 60/178 203/791 2.435 1 0.1187
1 rs12562034 A G TREND 60/172 256/734 1.008e-06 1 0.9992
我只對 p 值(最后一列)感興趣,需要生成一個 QQ 繪圖。為了實作這一點,我想用熊貓讀取檔案,但我找不到正確讀取檔案的方法。
以前的嘗試
我嘗試使用 Excel 來解釋檔案并生成正確的檔案,.csv但由于檔案太大,Excel 總是無法這樣做并且崩潰/僅生成表的三分之一。
我還嘗試使用以下命令來讀取帶有 Pandas 的檔案,但我得到了錯誤的輸出:
命令
df = pd.read_csv(path, sep='\t', engine='python') # attempt 1
df = pd.read_csv(path, sep='\t', lineterminator='\r') # attempt 2
輸出:

uj5u.com熱心網友回復:
用pd.read_fwf()試試:
df = pd.read_fwf(r'c:\test\test_file.txt')
print(df)
輸出:
CHR SNP A1 A2 TEST AFF UNAFF CHISQ DF P
0 1 rs10458597 T C TREND 4/230 13/973 0.156500 1.0 6.924000e-01
1 1 rs2185539 T C TREND 7/231 0/1000 29.750000 1.0 4.920000e-08
2 1 rs11240767 T C TREND 10/228 15/985 6.206000 1.0 1.273000e-02
3 1 rs12564807 G A TREND 0/238 0/1000 NaN NaN NaN
4 1 rs3131972 A G TREND 82/156 259/741 6.618000 1.0 1.010000e-02
5 1 rs3131969 A G TREND 86/150 253/733 9.629000 1.0 1.916000e-03
6 1 rs3131967 T C TREND 73/157 212/768 9.407000 1.0 2.162000e-03
7 1 rs1048488 C T TREND 60/178 203/791 2.435000 1.0 1.187000e-01
8 1 rs12562034 A G TREND 60/172 256/734 0.000001 1.0 9.992000e-01
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/350290.html
