我很难获得正确的语法来使用HTML 5.0在Beautifulsoup中提取属性的值。
所以我使用正确的语法隔离了soup
中标记的出现,其中存在HTML 5问题:
tags = soup.find_all(attrs={"data-topic":"recUpgrade"})
只使用标签[1]:
date = tags[1].find(attrs={"data-datenews":True})
和日期是:
<span class="invisible" data-datenews="2018-05-25 06:02:19" data-idnews="2736625" id="horaCompleta"></span>
但现在我想提取日期时间“2018-05-25 06:02:19”。无法获得语法。
见证/帮助。
答案 0 :(得分:4)
您可以使用键值对
访问attrs<强>实施例强>
from bs4 import BeautifulSoup
s = """<span class="invisible" data-datenews="2018-05-25 06:02:19" data-idnews="2736625" id="horaCompleta"></span>"""
soup = BeautifulSoup(s, "html.parser")
print(soup.span["data-datenews"])
<强>输出:强>
2018-05-25 06:02:19