Python Beautifulsoup4:

时间:2016-03-28 18:10:09

标签: python web-scraping beautifulsoup

有人能指出我如何为这个html表单独提取发件人和收件人地址吗?我没有太多运气挖掘有关如何搜索嵌套标签的文档..换句话说,我需要像:soupy.select('td[style="color: \#99999"],如果content = SENDER ..那么请查看下一个{{1标记并从中提取内容。'我甚至不知道如何表达这个哈哈。

<a>

1 个答案:

答案 0 :(得分:3)

按文字找到td 并获取next sibling

sender = soup.find("td", text="SENDER:")
print(sender.find_next_sibling("td").get_text(strip=True))

请注意,您可以通过选中onclick以包含“发件人”来直接转到发件人链接:

print(soup.select_one("a[onclick*=sender]").get_text(strip=True))