在网上scrapy时找不到表格内容(隐藏表格)

时间:2018-05-16 21:00:57

标签: python scrapy

我正在尝试抓取以下网址,表格内容是我感兴趣的,但看起来桌子隐藏在某个地方:

右键单击表格上的检查,我可以得到== $ 0(以下) 但是在scrapy shell中,如果我执行response.xpath('// * [@ table]'),它将返回任何内容,这意味着我无法通过这种方式刮取内容.... 请帮忙解决这个问题,谢谢。

1 个答案:

答案 0 :(得分:0)

表是空的原因是你试图scrapy包含表数据的错误url,正确的是:

http://www.cmegroup.com/CmeWS/mvc/xsltTransformer.do?xlstDoc=/XSLT/md/blocks-records.xsl&url=/da/BlockTradeQuotes/V1/Block/BlockTrades?exchange=XCBT,XCME,XCEC,DUMX,XNYM&foi=FUT,OPT,SPD&assetClassId=0&tradeDate=05172018&sortCol=time&sortBy=desc

" 05172018"上面的网址上的文字看起来像这种格式的日期过滤器:MMDDYYYY