{}
我想分割文件,然后想要打印最多次使用的单词。
但我甚至无法创建字典,上面的代码打印出空字典R
。
P.S。我没有添加代码的第一部分,用于打开文件,计算总行数以及以大写形式打印所有行。
答案 0 :(得分:1)
您可以使用collections.Counter()
将文本作为输入,并返回一个字典,记录文件中每个单词的频率。
<强> sample.txt的:强>
hello this file is good
file is is good excellent
用于阅读和记录单词频率的代码:
import collections
with open("sample.txt", "r") as datafile:
lines = datafile.read()
words = lines.split()
words_hist = collections.Counter(words)
print words_hist
输出:
{'is': 3, 'good': 2, 'file': 2, 'this': 1, 'excellent': 1, 'hello': 1}
根据您发布的解决方案,您似乎错误地读取了输入文件。所以我稍微编辑了你的方法:
counts = dict()
with open("sample.txt", "r") as datafile:
x = datafile.read().split()
for word in x:
words = word.split()
print words
counts[word] = counts.get(word,0) + 1
print counts
答案 1 :(得分:0)
你问过最常见的词。我已经展示了三个最常见的词。
In [102]: line
Out[102]: ' Mom can I have an ice cream?Mom I Mom Mom'
In [103]: li=line.split()
In [104]: li
Out[104]: ['Mom', 'can', 'I', 'have', 'an', 'ice', 'cream?Mom', 'I', 'Mom', 'Mom']
In [105]: collections.Counter(li)
Out[105]: Counter({'Mom': 3, 'I': 2, 'ice': 1, 'an': 1, 'can': 1, 'have': 1, 'cream?Mom': 1})
In [106]: collections.Counter(li).most_common(3)
Out[106]: [('Mom', 3), ('I', 2), ('ice', 1)]