ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python中统计基因组所含scaffolds总数、碱基总个数

2022-08-08 13:02:40  阅读:363  来源: 互联网

标签:python 基因组 len gc file test home total scaffolds


 

001、

(base) root@PC1:/home/test# ls               ## 测试数据及脚本
a.fasta  test.py
(base) root@PC1:/home/test# cat a.fasta      ## 测试数据
>scaffold_1
CCCGGGTAAAACGGGTCTTCAAGAAAACGCTCCTCCGTTAATGCCGGCCGATTCAAATAA
CCTCTGGCAACACCCGCTCCGGCAATGTATAGTTCACCGATACATCCAACAGGCAGCATC
GGCCC
>scaffold_2
CTGTTGCTCCTGTTGCTCCTGTTGATCCCGTTGCACCTGTTGGTCCAGTCGGTCCAATTC
>scaffold_3
TTGATCCAGTGGCTCCGGTTACTCCAGTTGATCCTGTTGCGCCTGTTGCTCCAGTTTCTC
CGGTTGGTCCGGTTGATCCGGTTGCACCTGTTACTCCAGTGGCTCCGGTTACTCCCGTCG
CTGTTGCTCCTGTTGCTCCTGTTGATCCCGTTGCACCTGTTGGTCCAGTCGGTCCAATTC
(base) root@PC1:/home/test# cat test.py      ## 脚本
#!/usr/bin/python

in_file = open("a.fasta", "r")
out_file = open("result.txt", "w")

import re
total_sca = 0
total_len = 0
total_len_gc = 0

for i in in_file:
    i = i.strip()
    if i[0] == ">":
        total_sca += 1
    else:
        total_len += len(i)
        total_len_gc += len(re.findall("[GCgc]", i))

print("n_scofflod", "total_len", "total_len_gc", "proportion_gc", file = out_file, sep = "\t")
print(total_sca, total_len, total_len_gc, total_len_gc/total_len, file = out_file, sep = "\t")

in_file.close()
out_file.close()
(base) root@PC1:/home/test# python test.py       ## 执行程序
(base) root@PC1:/home/test# ls
a.fasta  result.txt  test.py
(base) root@PC1:/home/test# cat result.txt       ## 查看统计结果
n_scofflod      total_len       total_len_gc    proportion_gc
3       365     203     0.5561643835616439

 

参考:https://mp.weixin.qq.com/s?__biz=MzIxNzc1Mzk3NQ==&mid=2247491482&idx=1&sn=596fd0f0e7d41757e1e539f3223a8c8c&chksm=97f5af82a08226943da69bca8228480d4b708ca2c89f8008281f140682e8814b43cf49d60762&scene=178&cur_album_id=2403674812188688386#rd

 

标签:python,基因组,len,gc,file,test,home,total,scaffolds
来源: https://www.cnblogs.com/liujiaxin2018/p/16561436.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有