将文本文件排序为由模式确定的列表

时间:2016-12-07 21:40:20

标签: python list file frequency

我有一个文本文件:

hello my name is bill    hello there    hello there    hiya    hiya    hiya

每个短语用四个空格分隔。如何按频率订购这些单词(在新行上)。

任何帮助表示感谢。

1 个答案:

答案 0 :(得分:0)

您可以使用collections.Counter

from collections import Counter
with open("your file.txt", "r") as f:
    phrases = Counter(f.read().split("    "))

for phrase, occurrences in sorted(phrases.items(), key=lambda _: _[1], reverse=True):
    print "Phrase: {} -- Occurrences: {}".format(phrase, occurrences)