使用Scrapy与多个表只有样式信息

时间:2014-02-07 00:45:08

标签: web-scraping scrapy html-table

当我尝试从网站上的几个表中提取某个表的HTML文本时,我遇到了麻烦。源代码下没有id或类信息。每个表都以此开头:

<table style='width:800px;border:solid  #48f 1px;text-align:left;line-height:14px;font-size:11px;'>...

<table style='width:900px;border:solid  #48f 1px;text-align:left;line-height:18px;font-size:11px;'>...

<table style='width:650px;line-height:22px;'>...

如何使用Scrapy选择第三个表格?还是另一种方法?

1 个答案:

答案 0 :(得分:0)

使用xpath你可以按位置选择它们,对于第三个表:

//table[3]

请注意,xpath索引从1开始

有关更多xpath语法,请参阅w3schools