我有800个关于蛋白质的文本文件。实际上我应该在800中制作一个矩阵800来比较蛋白质之间的相互作用。我在列表中输入了他们的名字。因为在程序中编写所有名称很困难。现在我想在python编程中打开它们来使用。但我不知道该计划是做什么的。
import csv
from os import listdir
from os.path import isfile,join
Protein_List = [f for f in listdir("/home/rezvane/GENE6") if isfile(join("/home/rezvane/GENE6",f))]
Matrix_Interaction = [[]*7]
Number_of_Interaction = 0
for i in range(7):
CC_Interaction = []
fh = open("/home/rezvane/GENE6/O15209:ZBTB22.txt")
test = False
for line in fh.readline():
if "CC -!- INTERACTION" in line:
test = True
if "CC -!- SUBCELLULAR LOCATION" in line:
break
if test:
data = line.split(";")[0][9:]
CC_Interaction.append(data)
for j in range(7):
if Protein_List[j] in CC_Interaction:
Matrix_Interaction[i][j] = 1
Number_of_Interaction +=1
else:
Matrix_Interaction[i][j] = 0
print Matrix_Interaction
print Number_of_Interaction
答案 0 :(得分:1)
不要在代码中写入您的文件名。相反,请执行以下操作之一:
将文件名存储在某种数据存储中,如XML文件或数据库,并使用该数据存储打开文件,或
根据有关蛋白质的现有信息编写一个生成文件名的函数。
此外,考虑这样的可能性:您应该将数据存储或导入到数据库中,而不是使用单独的文本文件,并使用该数据库来分析和操作蛋白质数据而不是文本文件。