如何在Python中制作元素的反向列表

时间:2019-02-08 07:52:41

标签: python list dictionary count tf-idf

我有所有术语的主列表和许多子列表(所有子列表都存储在文件中,我正在从文件中读取它们),这些文件中的列表看起来就像我在下面编写它们的方式。我想找到倒排的列表,即在其他文档中没有出现元素。

masterList={ 'token1' : 30, 'token2' : 28, 'token3' : 27, 'token4' : 26, 'token5' : 24, 'token6' : 20, 'token7' : 19, 'token8' : 18, 'token9' : 15, 'token10' : 12, 'token11' : 10, 'token12' : 6}  
idFCount={ 'token1' : 0, 'token2' : 0, 'token3' : 0, 'token4' : 0, 'token5' : 0, 'token6' : 0, 'token7' : 0, 'token8' : 0, 'token9' : 0, 'token10' : 0, 'token11' : 0, 'token12' : 0}  
childList1={ 'token1' : 6, 'token2' : 6, 'token3' : 3, 'token6' : 3, 'token7' : 2,  'token11' : 1, 'token12' : 1}  
childList2={ 'token1' : 10, 'token2' : 3, 'token3' : 1, 'token12' : 1}  
childList3={ 'token4' : 8, 'token6' : 7, 'token8' : 7, 'token9' : 3, 'token10' : 2,  'token11' : 2, 'token12' : 1}  
childList4={ 'token1' : 9, 'token5' : 6, 'token6' : 5, 'token8' : 3, 'token7' : 3,  'token9' : 1, 'token12' : 1}  

directoryList=['childList1' , 'childList2', 'childList3', 'childList4']  

for directoryName in directoryList :  

    for elements in directoryName.items() :  
        print (elements)
        idFCount[element[0]]=idFCount[element[0]]+1

从上述问题中,我想要一个类似的输出:

idFCount={ 'token1' : 3, 'token2' : 2, 'token3' : 2, 'token4' : 1, 'token5' : 1, 'token6' : 3, 'token7' : 2, 'token8' : 2, 'token9' : 2, 'token10' : 1, 'token11' : 2, 'token12' : 4}

但是当我这样做的时候,我得到了错误的价值

注意:在上面的代码中,directoryList不起作用,但是在原始代码中,我正在加载页面

docTypetermfrequency = open(directoryName, 'rb')  
fileTermFreq = pickle.load(docTypetermfrequency)  
for elements in fileTermFreq.items() :  
    idFCount[elements[0]]=idFCount[elements[0]]+1

您可以在此处找到所有代码并输入输出文件。

1 个答案:

答案 0 :(得分:0)

您有两个错误:

directoryList={'childList1' , 'childList2', 'childList3', 'childList4'}  # First error

for directoryName in directoryList :  

    for elements in directoryName.items() :  
        print (elements)
        idFCount[element[0]]=idFCount[element[0]]+1 # Second error

您的代码应为:

directoryList=[childList1 , childList2, childList3, childList4] 

for directoryName in directoryList :
    for elements in directoryName.items() :
        print (elements)
        idFCount[elements[0]]=idFCount[elements[0]]+1