我有2个文件,我想比较共性。 我使用字典来存储2个文件的单词的频率。现在我想在这两个文件中找到频率超过1且常见的单词。
答案 0 :(得分:0)
假设你的意思是每个文件中出现的词数至少三次(在#34;超过2"在你的标题中而不是"超过频率1和#34;在帖子的主体):
def frequent_common_words(frequencies_1, frequencies_2):
frequent_words_1 = filter(lambda x: freqencies_1[x] > 2, frequencies_1.keys())
frequent_words_2 = filter(lambda x: freqencies_2[x] > 2, frequencies_2.keys())
return [word for word in frequent_words_1 if word in frequent_words_2]