使用BeautifulSoup检查HTML中列表中的字符串是否存在

时间:2019-06-20 11:28:22

标签: python beautifulsoup

我正在使用以下代码在经过解析的HTML中查找文本:

searched_word = "News"
results = parsedHTML.body.find_all(string=re.compile('.*{0}.*'.format(searched_word)), recursive=True)
if results:
    doStuff()

这可行,但我想改用一个列表,例如:

searched_words = ["News", "Team"]

并且如果我解析的HTML在其内容中包含任何这些字符串元素,则应返回True以及在HTML中找到的元素。我不知道该怎么做到。

1 个答案:

答案 0 :(得分:1)

这可能有帮助。

searched_words = ["News", "Team"]
pattern = re.compile("|".join(searched_words))
results = parsedHTML.body.find_all(string=pattern, recursive=True)
if results:
    doStuff()