Question

我有800个关于蛋白质的文本文件。实际上我应该在800中制作一个矩阵800来比较蛋白质之间的相互作用。我在列表中输入了他们的名字。因为在程序中编写所有名称很困难。现在我想在python编程中打开它们来使用。但我不知道该计划是做什么的。

import csv
from os import listdir
from os.path import isfile,join
Protein_List = [f for f in listdir("/home/rezvane/GENE6") if isfile(join("/home/rezvane/GENE6",f))]
Matrix_Interaction = [[]*7]
Number_of_Interaction = 0
for i in range(7):
    CC_Interaction = []
    fh = open("/home/rezvane/GENE6/O15209:ZBTB22.txt")
    test = False
    for line in fh.readline():
        if "CC   -!- INTERACTION" in line:
            test = True
        if "CC   -!- SUBCELLULAR LOCATION" in line:
            break
        if test:
            data = line.split(";")[0][9:]
            CC_Interaction.append(data)
    for j in range(7):
        if Protein_List[j] in CC_Interaction:
            Matrix_Interaction[i][j] = 1
            Number_of_Interaction +=1
        else:
            Matrix_Interaction[i][j] = 0
print Matrix_Interaction
print Number_of_Interaction

Answer 1

不要在代码中写入您的文件名。相反，请执行以下操作之一：

将文件名存储在某种数据存储中，如XML文件或数据库，并使用该数据存储打开文件，或
根据有关蛋白质的现有信息编写一个生成文件名的函数。

此外，考虑这样的可能性：您应该将数据存储或导入到数据库中，而不是使用单独的文本文件，并使用该数据库来分析和操作蛋白质数据而不是文本文件。

如何用python打开很多文本文件

1 个答案: