频率高于2档python的常用词

时间:2018-03-09 18:28:26

标签: python dictionary

我有2个文件,我想比较共性。 我使用字典来存储2个文件的单词的频率。现在我想在这两个文件中找到频率超过1且常见的单词。

1 个答案:

答案 0 :(得分:0)

假设你的意思是每个文件中出现的词数至少三次(在#34;超过2"在你的标题中而不是"超过频率1和#34;在帖子的主体):

def frequent_common_words(frequencies_1, frequencies_2):
  frequent_words_1 = filter(lambda x: freqencies_1[x] > 2, frequencies_1.keys())
  frequent_words_2 = filter(lambda x: freqencies_2[x] > 2, frequencies_2.keys())
  return [word for word in frequent_words_1 if word in frequent_words_2]