我正在尝试使用libxml2.parseFile
在Python上搜索XPath。出于某种原因,我无法将这个功能用于在线文件:关于如何快速解决这个问题的任何想法?
答案 0 :(得分:0)
我建议使用lxml,“Pythonic绑定C库libxml2和libxslt”:
from lxml.html import parse
import urllib
SOURCE = 'http://stackoverflow.com/unanswered'
htmlpage = urllib.urlopen(SOURCE)
tree = parse(htmlpage).getroot()
print (tree.xpath('//div[1]'))
htmlpage.close()