使用文本文件计算PYTHON中的某些单词

时间:2018-10-19 23:44:35

标签: python

我需要很多帮助。我正在尝试使用文本文件仅计算文本中的某些单词。我一直在寻找可以尝试寻求帮助的时间,但似乎找不到任何帮助。

需要敏感的情况 我需要使用的单词是: 伟大,美好,完美,美好,奇妙,爱,爱,快乐,享受,神话般

2 个答案:

答案 0 :(得分:0)

您可以使用正则表达式(例如“ re.findall”或“ re.finditer”表达式)搜索单词,然后遍历整个文件。

    list = []
    with open("file.txt") as f:
        words = f.read()
        list.append(re.findall(r"great", words))

然后您可以通过len函数计算单词数。 根据要求,可能需要对代码进行少量修改。 浏览正则表达式页面以获取更多信息。

您甚至可以使用str.count()。

答案 1 :(得分:0)

collections.Counter提供了许多用于单词计数的选项

from collections import Counter

with open('alice.txt') as f:
    content = f.read()

c = Counter(content.split())

print(c['you'])

lst = ['me', 'them', 'us']

for i in lst:
    print(f'{i}: {c[i]}')

for word, count in c.most_common(5):
    print(word + ':', count)
301
me: 46
them: 49
us: 10
the: 1664
and: 780
to: 773
a: 662
of: 596