从.PBS文件计算序列长度

时间:2016-07-12 15:51:12

标签: python bioinformatics

我是新来的。我正在寻找生物信息学类型任务的帮助。任务是计算.pbs文件中所有序列的总长度。

打开文件时,显示如下内容:

长度为102

长度为1100

长度为101

长度为111200

长度为102

我看到长度像列表一样给出,带有字母和数字。我需要帮助找出要编写的python代码以将所有长度加在一起。并非所有的金额都是一样的。

到目前为止,我的代码是:

f = open('lengthofsequence2.pbs.o8767272','r')

lines = f.readlines()

f.close()

def lengthofsequencesinpbsfile(i):

    for x in i:

        if

            return x +=

print lengthofsequencesinpbsfile(lines)

我不知道如何处理for循环。我想在“长度为......”之后的数字中计算数字

谢谢!

2 个答案:

答案 0 :(得分:-1)

"The Length is "有14个字符,因此line[14:]将为您提供与您所追求的数字相对应的子字符串(从第14个字符开始),然后您只需将其转换为int在添加到您的总数之前添加int(line[14:])total += int(line[14:])

答案 1 :(得分:-1)

  1. 您需要解析输入以获取要使用的数据 一个。 x.replace('长度为','') - 这会删除不需要的文字。
    湾int(x.replace('长度为','')) - 将数字字符转换为
        整数
  2. 添加到总计:总计+ = int(x.replace('长度为',''))
  3. 所有这些都可以使用谷歌直接访问。我查找了python字符串函数和类型转换函数。我只是简单地看了一下python并且从未编程过它,但我认为这两个项目应该可以帮助你做你想做的事。