Python Beautifulsoup获取属性值

时间:2018-05-25 16:22:34

标签: python beautifulsoup

我很难获得正确的语法来使用HTML 5.0在Beautifulsoup中提取属性的值。

所以我使用正确的语法隔离了soup中标记的出现,其中存在HTML 5问题:

tags = soup.find_all(attrs={"data-topic":"recUpgrade"})

只使用标签[1]:

date = tags[1].find(attrs={"data-datenews":True})

和日期是:

<span class="invisible" data-datenews="2018-05-25 06:02:19" data-idnews="2736625" id="horaCompleta"></span>

但现在我想提取日期时间“2018-05-25 06:02:19”。无法获得语法。

见证/帮助。

1 个答案:

答案 0 :(得分:4)

您可以使用键值对

访问attrs

<强>实施例

from bs4 import BeautifulSoup
s = """<span class="invisible" data-datenews="2018-05-25 06:02:19" data-idnews="2736625" id="horaCompleta"></span>"""
soup = BeautifulSoup(s, "html.parser")
print(soup.span["data-datenews"])

<强>输出:

2018-05-25 06:02:19