目的
利用磁珠上的探針對mRNA進行捕獲,每個磁珠的含有一段特異的序列,成為UMI。按照一個磁珠只捕獲一個轉錄本的特性,利用UMI即可將相同的轉錄本的read進行聚類,進行后續的組裝,定量和可變剪切的分析。
任務要求:
根據UMI的組成特點,從read中找到UMI,并將UMI序列和read的barcode關系進行記錄。
說明:
下列是UMI的組成特點:
GGAAACAGCTATGACCATGNNNNNNNNNNNNNNNNTTTTTTTT
固定序列:GGAAACAGCTATGACCATG
UMI序列:NNN為隨機的16 bp umi序列
尋找的策略師需要同時滿足幾個條件:
1) 遍歷fastq,找到固定序列
2) 間隔16bp后,找到3個oligo dT序列
(注意考慮反向互補序列)
滿足這兩個條件便能建立他們之間的關系:
1. 找到UMI序列
2. 找到對應的barcode編號
3. 建立UMI和barcode的對應關系表
資料:
/hwfssz5/ST_BIGDATA/USER/xujunhao/project/course/result/split_read.1_rename.fq.gz
/hwfssz5/ST_BIGDATA/USER/xujunhao/project/course/result/split_read.2_rename.fq.gz
求個大佬說一下應該怎么做,最好能有代碼感謝
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/124647.html
標籤:應用程序開發區
下一篇:shell腳本撰寫
