我正在尝试使用scrapy(python 3)提取数据。这是结构。
这两个表的提取方式为:
tables = response.xpath('//div[@class="w3-margin-top"]/table')
表[0]具有10个标签,表1具有约40个标签。
当我尝试在迭代时提取行时,
for table in tables:
rows = table.xpath('.//tbody/tr')
print(len(rows))
我得到的结果分别是10和0。
答案 0 :(得分:1)
正如评论中所说,Chrome代码检查器显示了某种已经执行JavaScript的规范化代码,这可能会严重影响您看到的代码。
要查看用于抓取的可靠数据,请使用Ctrl+U