我是Python新手并在python中使用请求。我被要求在xyz.com上做登录,我能够做到。并提取所有与讨论相关的表内容。在这些链接的每一个中,我需要找到“The”这个词的出现。我该怎么办?我的代码如下:
tags=content2.findAll("td",{'class':'topic starter'})
for i in tags:
thread_link=i.find('a').get('href')
print(thread_link)
result3=session.post(thread_link)
content3=bs4.Beautifulsoup(result3.text,'html.parser')
tag3=content3.find("the",count+1)
print(count)
我必须找到每个链接的出现并打印出来!!
答案 0 :(得分:3)
您可以使用str.count,查看here了解更多详情
for i in tags:
thread_link=i.find('a').get('href')
result3=session.post(thread_link)
count = result3.text.count("the")
print(count)
答案 1 :(得分:1)
你没有正确地这样做。您的tag3将找到the
标记。代码也很乱。你可以使用正则表达式
为了你的事业。在这里,我们将在结果文本中搜索the
。
import re
for i in tags:
thread_link=i.find('a').get('href')
print(thread_link)
result3=session.post(thread_link)
count=len(re.findall('\sthe\s',result3.text))
print(count)