使用机械化python在url中搜索文本

时间:2020-04-13 15:25:26

标签: python regex mechanize

您好,我需要检查网址页面中是否包含诸如“ good”之类的文本。 我看到'''.body.include?()'''但这对我不起作用,请帮助我 我知道网站在支票还可以的时候说了新话,所以我尝试了这个

if "Good news" in isitwp_response:
    rowdict['iswordpresswebsite'] = "yes"
else:
    rowdict['iswordpresswebsite'] = "no

但这对我不起作用。

1 个答案:

答案 0 :(得分:1)

您需要解析信息。尝试将bs4BeautifulSoup类一起使用。 首先,响应本身不会告诉您任何信息。尝试isitwp_response.read()获取该站点的实际信息。

喂汤

soup = bs4.BeautifulSoup(isitwp_response.read(),'html.parser')

find()函数将返回您正在搜索的文本(如果有的话)。 (在其他站点上进行了测试)

if soup.find(text='Good news')==None:
    return(False)
else:
    return(True)