在python 2.7上使用xpath提取href值

时间:2013-03-07 13:09:34

标签: python xpath

快速而简单:

<a href="some content">Click here</a>

如何在python上使用xpath提取“some content”和“click me”?

到目前为止,我有以下内容(仅从href结果中提取“一些内容”):

import lxml.etree as LE
import requests

r = requests.get("http://localhost")
html = r.text
root = LH.fromstring(html)
print root.xpath('//a/@href')

谢谢你。

2 个答案:

答案 0 :(得分:4)

您只能使用XPath选择其中一个,但您可以选择所有<a>个元素,然后选择href属性和文本内容,如下所示:

for elt in root.xpath('//a'):
    print(elt.attrib['href'], elt.text_content())

答案 1 :(得分:-1)

from selenium import webdriver
browser = webdriver.Chrome()
some_content = 
browser.find_element_by_xpath(THE_WEB_ELEMENT_XPATH).get_attribute("href")