Question

我正在尝试使用libxml2.parseFile在Python上搜索XPath。出于某种原因，我无法将这个功能用于在线文件：关于如何快速解决这个问题的任何想法？

Answer 1

我建议使用lxml，“Pythonic绑定C库libxml2和libxslt”：

from lxml.html import parse
import urllib

SOURCE = 'http://stackoverflow.com/unanswered'

htmlpage = urllib.urlopen(SOURCE)
tree = parse(htmlpage).getroot()

print (tree.xpath('//div[1]'))

htmlpage.close()

libxml2.parseFile用于在线文件？

1 个答案: