我想计算在html文件中可以找到一个特定单词的次数。 html文件是从url下载的:
with urlopen(url) as response:
source = response.read()
由于html文件中没有特定的行,因此我在浏览文件中搜索特定的单词时遇到了麻烦...是否有一种简单的方法来做到这一点?
答案 0 :(得分:2)
尝试以下代码:
num_occ = source.count("your_specific_word")
答案 1 :(得分:1)
因此,如果要寻找网页抓取工具,请选择beautiful soup或scrapy
否则,您只需使用count即可根据文本中出现的次数来计算
with urlopen(url) as response:
source = response.read()
noOfOccurances = source.count(searchWord)