每个人,我是Python的新手,我得到了一个我想分析的文本文件,看看每个单词的使用次数。我已经尝试了一段时间,但我得到了ex:[('t', 1), ('i', 1), ('m', 1), ('e', 1), ('.', 1)]
的输出。当我在寻找输出时:('easy',5)等。
我的文本文件中的文字示例: “不可能相信公司提供的信息 - 即使他们已经确认支付已经支付并已付款(已经需要一周),他们也可以回复你并说它不是。他们也拒绝对此类案件承担任何责任。他们也没有帮助您进行任何退款,但只是将您介绍给小额索赔法庭,如果您在国外拥有相当多的客户,这并不是一个好的建议。“
感谢您的帮助!
以下是我目前的代码:
from nltk import FreqDist
text = open('GC_review.txt')
for word in text.read().split():
fdist1 = FreqDist(word)
print (fdist1.most_common(100))
答案 0 :(得分:2)
您关注以下代码:
0
我希望这会有所帮助.. :)
答案 1 :(得分:1)
您正在计算文字中的字母而不是文字中的字数。改变这些行:
for word in text.read().split():
fdist1 = FreqDist(word)
为:
fdist1 = FreqDist(text.read().split())
不需要循环。