Question

快速而简单：

<a href="some content">Click here</a>

如何在python上使用xpath提取“some content”和“click me”？

到目前为止，我有以下内容（仅从href结果中提取“一些内容”）：

import lxml.etree as LE
import requests

r = requests.get("http://localhost")
html = r.text
root = LH.fromstring(html)
print root.xpath('//a/@href')

谢谢你。

Answer 1

您只能使用XPath选择其中一个，但您可以选择所有<a>个元素，然后选择href属性和文本内容，如下所示：

for elt in root.xpath('//a'):
    print(elt.attrib['href'], elt.text_content())

Answer 2

from selenium import webdriver
browser = webdriver.Chrome()
some_content = 
browser.find_element_by_xpath(THE_WEB_ELEMENT_XPATH).get_attribute("href")

在python 2.7上使用xpath提取href值

2 个答案: