使用xpath从嵌套的div中提取文本

时间:2018-11-29 19:39:19

标签: xpath

我想在h2标签中获取文字

<p>Mi. 5. Dezember 2018</p>
<h2>Slam: Jägerschlacht</h2>
<p>Einlass 19:30 Uhr // Beginn 20:30 Uhr</p>
<p>Tickets: 4€</p>

this页面中带有xpath。问题是我找不到所有div正确的xpath。我使用此python代码时得到的所有信息

from lxml import html
import requests

page = requests.get("https://www.gruener-jaeger-stpauli.de/")
tree = html.fromstring(page.content)
text = tree.xpath("/html/body/div/div/div/div/div/div/div[1]/div/div[2]/div/div/div[1]/div/a[1]/h2")

print (text)

是[<元素h2位于0x25ae6341a98>]

1 个答案:

答案 0 :(得分:0)

最好使用手写XPath而不是生成的路径。

尝试这样获得第一个var isRelative = !redirectUrl.match(/(\:|\/\\*\/)/); // Don't allow "//" (with optional "\"'s) or ":" 元素(使用h2选择所有文本节点子元素)

/text()

或放下"//a[contains(@class, 'event_box_gj')][1]/h2/text()") 以获取全部。