Question

我想计算在html文件中可以找到一个特定单词的次数。 html文件是从url下载的：

with urlopen(url) as response:
   source = response.read()

由于html文件中没有特定的行，因此我在浏览文件中搜索特定的单词时遇到了麻烦...是否有一种简单的方法来做到这一点？

Answer 1

尝试以下代码：

num_occ = source.count("your_specific_word")

Answer 2

因此，如果要寻找网页抓取工具，请选择beautiful soup或scrapy

否则，您只需使用count即可根据文本中出现的次数来计算

with urlopen(url) as response:
   source = response.read()
noOfOccurances = source.count(searchWord)