如何选择href类标签?
html代码示例:
<a title="bla" class="example"> text </a>
所以我希望通过“标题”或“类”来识别要从哪个标签中获取,然后在a标签中输出文本,所以在这种情况下输出将是
text
我正在使用的代码
from bs4 import BeautifulSoup
import requests
source = requests.get('http://www.example.com').text
soup = BeautifulSoup(source, 'lxml')
for profile in soup.select(" select input here "):
print(profile.text.encode("utf-8"))
答案 0 :(得分:3)
除了@Stack在评论中建议的内容:
soup.find_all('a', {'title': 'bla'})
soup.find_all('a', {'class': 'example'})
您可以使用CSS selectors执行此操作(我甚至看到您已经在那里拨打select()
电话:
soup.select("a[title=bla]")
soup.select("a.example")