我尝试组合来自不同文件的数据,以便对于每个项目 - 来自一个文档的OTU编号及其指定的种类可以与另一个文档中的OTU序列组合,其中OTU编号在一行中,并在下一行中排序。
我已经设法从第一个文档中附加了我需要的数据,但是我无法在第二个文档中为相同的OTU添加任何内容。
有人有任何建议吗?
tax_file=open("C:\\Users\\Line\\Documents\\regnorme\\Bioinformatic\\New_folder1\\tax_new\\16s_tree\\16s_tree5\\taxonomy_tree5.txt")
fasta_file=open("C:\\Users\\Line\\Documents\\regnorme\\Bioinformatic\\New_folder1\\tax_new\\16s_tree\\16s_tree5\\fasta_tree5.2.txt")
OTUs_in_shared=('Otu0001', ... other otus here ...., 'Otu2381')
Vermi_OTUs = []
for line in tax_file:
if line.startswith("Otu"):
if line.split()[0] in OTUs_in_shared:
if line.split()[7].startswith("Verminephrobacter"):
OTU={'OTUnr':(line.split()[0]), 'Family':(line.split()[6]),
'Genera':(line.split()[7])}
Vermi_OTUs.append(OTU)
for line in Vermi_OTUs:
for line in fasta_file:
if 'OTUnr' in line.split():
if 'sequence' not in OTU:
OTU['sequence']=[]
OTU['sequence'].append(line.split()[0])
print(Vermi_OTUs)