我正在處理大約 1800 個 SARS-CoV-2 的全基因組序列,我只想保留兩個“|”之間的“EPI_ISL_NC045512”模式。這將是我的字串:
>New|hCoV-19/Belize/BZ-CML-TCMC-BZ002-0820/2020|EPI_ISL_NC045512|2020-08-12NC045512
actcacgcagtataattaataactaattactgtcgttgacaggacacgagtaactcgtctatcttctgcaggctgcttacggtttcgtccgtg
我還需要保留 ">" 我試過 (>)(. )([EPI. ])(. ) 但它沒有用
uj5u.com熱心網友回復:
一個簡單的可能是這個: |(EPI([A-Z0-9_] ))|
僅假設A-Z 0-9和_您的圖案,其結果是在第1組(由括號包圍)。
uj5u.com熱心網友回復:
如果你想保持>在一個組和一個組中,你可以使用 2 個捕獲EPI_ISL_NC045512組
(>)[^>]*\|(EPI[^|]*)\|
(>)>在第 1 組中捕獲[^>]*\|可選擇匹配任何字符>,然后匹配|(EPI[^|]*)捕獲EPI后跟任何炭除了|在第2組\|比賽|
正則運算式演示
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/354309.html
標籤:正则表达式
