在處理表達譜資料的時候,你是否遇到過在設定行名的時候,出現行名不同重復的問題,那時候的你會怎么處理呢?當年的我,花費了很大的力氣,最后才解決這個問題,由剛開始的用excel一個一個手動洗掉,到現在用腳本洗掉,這個程序用了很長時間,
現在為了讓初學者更容易解決這個問題,不再走小編當前走過的艱難老路,小編將該部分功能進行封裝,并做了可視化的界面,方便大家更好的理解和使用!
首先,該軟體是用python包裝,大家需要在使用前安裝python3.8及以上的版本,安裝完成后,退出殺毒軟體,解壓壓縮包,壓縮包下有這么幾個檔案,其實111.csv檔案為小編為大家準備的測驗檔案
在檔案夾下dist\duplicated\duplicated.exe,雙擊該程式,
選擇檔案所在的位置
在測驗之前,我們需要知道根據哪一列進行去重,我們測驗資料重復的這列名稱為‘gene’

按照上面顯示,直接運行,這時候在去重的這個檔案下多了一個result.csv的檔案,
那么這列的保留重復行的方式是什么意思?
none:為所有重復的,全部洗掉
first:對于重復的,僅僅只保留第一次出現的那一行
last:對于重復的,僅僅只保留最后一次出現的那一行
mean:對于重復的行,取平均值
操作是不是很簡單,大家有興趣也可以試試哈!
可以加我微信獲取壓縮包

也可以自行下載,壓縮包已經上傳,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/278433.html
標籤:其他
