无法检索行

时间:2012-12-09 14:24:13

标签: python scrapy

我正在使用scrapy 0.14

贝洛是我的代码

start_urls = ['http://lakebagger.com/ur/']

def parse(self, response):
    hxs = HtmlXPathSelector(response)
    stores=hxs.select('//table[@id]//tr')
    print len(stores)

我无法访问 tbody 中的行(tr),而不能访问 thead 行。我怎样才能访问这些行?

提前谢谢。看起来像HtmlXpathSelector无法准确地运行xpath

1 个答案:

答案 0 :(得分:2)

此时,我会说这是环境问题,虽然不是操作系统问题,因为我设法在Windows 7上运行类似的脚本。输入“pip freeze”的结果是什么?

我是:

Scrapy==0.16.2
Twisted==12.2.0
distribute==0.6.32
egenix-pyopenssl==0.13.0-1.0.0g-1
lxml==3.0.1
pyOpenSSL==0.9
pywin32==216
w3lib==1.2
zope.interface==3.8.0

此外,我确实认为您应该发布完整的蜘蛛代码以供检查,因为缺少的行中可能存在导致问题的内容。

编辑:根据您的评论,这可能与版本有关,因为您运行的是0.14。你考虑升级吗?

注意:我按照these steps安装了scrapy。