如何组合来自不同文档的不同数据?

时间:2017-09-23 08:00:15

标签: python taxonomy

我尝试组合来自不同文件的数据,以便对于每个项目 - 来自一个文档的OTU编号及其指定的种类可以与另一个文档中的OTU序列组合,其中OTU编号在一行中,并在下一行中排序。

我已经设法从第一个文档中附加了我需要的数据,但是我无法在第二个文档中为相同的OTU添加任何内容。

有人有任何建议吗?

tax_file=open("C:\\Users\\Line\\Documents\\regnorme\\Bioinformatic\\New_folder1\\tax_new\\16s_tree\\16s_tree5\\taxonomy_tree5.txt")

fasta_file=open("C:\\Users\\Line\\Documents\\regnorme\\Bioinformatic\\New_folder1\\tax_new\\16s_tree\\16s_tree5\\fasta_tree5.2.txt")

OTUs_in_shared=('Otu0001', ... other otus here ...., 'Otu2381')

Vermi_OTUs = []
for line in tax_file:
if line.startswith("Otu"):
    if line.split()[0] in OTUs_in_shared:
        if line.split()[7].startswith("Verminephrobacter"):
            OTU={'OTUnr':(line.split()[0]), 'Family':(line.split()[6]), 
'Genera':(line.split()[7])}
            Vermi_OTUs.append(OTU)

for line in Vermi_OTUs:
    for line in fasta_file:
        if 'OTUnr' in line.split():
            if 'sequence' not in OTU:
                OTU['sequence']=[]
        OTU['sequence'].append(line.split()[0])
print(Vermi_OTUs)

0 个答案:

没有答案