我有一个文本文件:
hello my name is bill hello there hello there hiya hiya hiya
每个短语用四个空格分隔。如何按频率订购这些单词(在新行上)。
任何帮助表示感谢。
答案 0 :(得分:0)
您可以使用collections.Counter
。
from collections import Counter
with open("your file.txt", "r") as f:
phrases = Counter(f.read().split(" "))
for phrase, occurrences in sorted(phrases.items(), key=lambda _: _[1], reverse=True):
print "Phrase: {} -- Occurrences: {}".format(phrase, occurrences)