我正在运行python 2.7.2 我安装了lxml和cssselect
我的代码是
from lxml import etree, html
r = html.parse(start_url)
all_titles = r.cssselect('span.titles') #should return a list of results
all_urls = r.cssselect('span.links') #and this as well
我正在抓取一个包含标题及其相关链接的网页。
但是我遇到了这个错误: 'lxml.etree._ElementTree'对象没有属性'cssselect'
答案 0 :(得分:14)
ElementTree
没有cssselect
方法,而HtmlElement
对象则有。{/ p>
使用ElementTree.getroot
获取HtmlElement
对象:
r = html.parse(start_url).getroot()