在Python中的html文件中搜索特定单词

时间:2019-07-29 11:42:25

标签: python html

我想计算在html文件中可以找到一个特定单词的次数。 html文件是从url下载的:

with urlopen(url) as response:
   source = response.read()

由于html文件中没有特定的行,因此我在浏览文件中搜索特定的单词时遇到了麻烦...是否有一种简单的方法来做到这一点?

2 个答案:

答案 0 :(得分:2)

尝试以下代码:

num_occ = source.count("your_specific_word")

答案 1 :(得分:1)

因此,如果要寻找网页抓取工具,请选择beautiful soupscrapy

否则,您只需使用count即可根据文本中出现的次数来计算

with urlopen(url) as response:
   source = response.read()
noOfOccurances = source.count(searchWord)

Python string count

相关问题