免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發新帖
查看: 14340 | 回復: 0
打印 上一主題 下一主題

gff文件的utr的合并排序 [復制鏈接]

論壇徽章:
0
跳轉到指定樓層
1 [收藏(0)] [報告]
發表于 2022-07-19 11:39 |只看該作者 |倒序瀏覽
合并兩個gff3一個是EVM整合三方預測(重頭預測、同源預測、轉錄組預測)得來的 evm.gff3,該文件格式如下:含有gene,mrna,exon,cds的信息,且按照染色體和位置信息進行的排序。chr14   EVM     gene    271     990     .       -       .       ID=evm.TU.chr14.1;Name=EVM%20prediction%20chr14.1
chr14   EVM     mRNA    271     990     .       -       .       ID=evm.model.chr14.1arent=evm.TU.chr14.1;Name=EVM%20prediction%20chr14.1
chr14   EVM     exon    876     990     .       -       .       ID=evm.model.chr14.1.exon1arent=evm.model.chr14.1
chr14   EVM     CDS     876     990     .       -       0       ID=cds.evm.model.chr14.1arent=evm.model.chr14.1
chr14   EVM     exon    499     676     .       -       .       ID=evm.model.chr14.1.exon2arent=evm.model.chr14.1
chr14   EVM     CDS     499     676     .       -       2       ID=cds.evm.model.chr14.1arent=evm.model.chr14.1
chr14   EVM     exon    271     406     .       -       .       ID=evm.model.chr14.1.exon3arent=evm.model.chr14.1
chr14   EVM     CDS     271     406     .       -       1       ID=cds.evm.model.chr14.1arent=evm.model.chr14.1

chr14   EVM     gene    43465   47546   .       -       .       ID=evm.TU.chr14.2;Name=EVM%20prediction%20chr14.2
chr14   EVM     mRNA    43465   47546   .       -       .       ID=evm.model.chr14.2arent=evm.TU.chr14.2;Name=EVM%20prediction%20chr14.2




另一個是從轉錄組預測提取的UTR.gff3,格式如下:只含有UTR信息
chr10   transdecoder    three_prime_UTR 20357313        20358140        .       +       .       ID=asmbl_10002.p1.utr3p1arent=asmbl_10002.p1
chr10   transdecoder    three_prime_UTR 20359576        20359752        .       -       .       ID=asmbl_10003.p1.utr3p1arent=asmbl_10003.p1
chr10   transdecoder    three_prime_UTR 20359576        20359752        .       -       .       ID=asmbl_10004.p1.utr3p1;Parent=asmbl_10004.p1
chr10   transdecoder    five_prime_UTR  20365069        20365102        .       +       .       ID=asmbl_10005.p1.utr5p1;Parent=asmbl_10005.p1
chr10   transdecoder    three_prime_UTR 20367505        20367513        .       +       .       ID=asmbl_10005.p1.utr3p1;Parent=asmbl_10005.p1
chr10   transdecoder    five_prime_UTR  20371655        20371704        .       -       .       ID=asmbl_10007.p1.utr5p1;Parent=asmbl_10007.p1
chr10   transdecoder    five_prime_UTR  20370885        20370904        .       -       .       ID=asmbl_10007.p1.utr5p2;Parent=asmbl_10007.p1




問題:如何將兩個文件合并,按照染色體順序排列,同時第四列按從小到大的序列排列,最終格式類似于evm.gff3那種,一個基因為分割區,每個基因分割區依次的第三列依次為"gene,mRNA,exon,CDS,UTR".
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規則 發表回復

  

北京盛拓優訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網監中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區
中國互聯網協會會員  聯系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉載本站內容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP
   日韩综合区视频第一页导航,无码JK粉嫩小泬在线观看,午夜精品A片一区二区三区,日日躁夜夜躁狠狠躁麻豆,大胆国模,免费观看无遮挡www的网站