有人能指出我如何为这个html表单独提取发件人和收件人地址吗?我没有太多运气挖掘有关如何搜索嵌套标签的文档..换句话说,我需要像:soupy.select('td[style="color: \#99999"]
,如果content = SENDER ..那么请查看下一个{{1标记并从中提取内容。'我甚至不知道如何表达这个哈哈。
<a>
答案 0 :(得分:3)
按文字找到td
并获取next sibling:
sender = soup.find("td", text="SENDER:")
print(sender.find_next_sibling("td").get_text(strip=True))
请注意,您可以通过选中onclick
以包含“发件人”来直接转到发件人链接:
print(soup.select_one("a[onclick*=sender]").get_text(strip=True))