我想在h2标签中获取文字
<p>Mi. 5. Dezember 2018</p>
<h2>Slam: Jägerschlacht</h2>
<p>Einlass 19:30 Uhr // Beginn 20:30 Uhr</p>
<p>Tickets: 4€</p>
在this页面中带有xpath。问题是我找不到所有div正确的xpath。我使用此python代码时得到的所有信息
from lxml import html
import requests
page = requests.get("https://www.gruener-jaeger-stpauli.de/")
tree = html.fromstring(page.content)
text = tree.xpath("/html/body/div/div/div/div/div/div/div[1]/div/div[2]/div/div/div[1]/div/a[1]/h2")
print (text)
是[<元素h2位于0x25ae6341a98>]
答案 0 :(得分:0)
最好使用手写XPath而不是生成的路径。
尝试这样获得第一个var isRelative = !redirectUrl.match(/(\:|\/\\*\/)/); // Don't allow "//" (with optional "\"'s) or ":"
元素(使用h2
选择所有文本节点子元素)
/text()
或放下"//a[contains(@class, 'event_box_gj')][1]/h2/text()")
以获取全部。