为什么不能使用给定ID的XPath抓取查找表?

时间:2018-09-03 22:24:45

标签: python xpath scrapy

我是编程的新手,但是我一直在遵循此Scrapy教程在此处抓取NFL数据:http://brutalsimplicity.github.io/2016/07/25/scrapy.html

我们正在使用此链接(https://www.pro-football-reference.com/boxscores/201409040sea.htm),我们希望在最底端有一个大型的Play播放表。

在本教程中,它说我们想要的表ID是“ pbp_data”,但是我找到了相同的表,现在的ID是“ pbp”,并带有此代码

<table class="sortable stats_table now_sortable sliding_cols" id="pbp" data-cols-to-freeze="2">

我以前从未使用过Python或XPath,所以我只是按照他们说的在我的外壳上执行response.xpath('//table[@id ="pbp"]')的指示,但是由于某些原因,当我按Enter键时什么也没显示。

我对XPath的理解是否存在问题,还是我在做些错误时弄乱了?

谢谢!

1 个答案:

答案 0 :(得分:1)

如果使用view(response),则会注意到您要抓取的数据已注释:

<div class="placeholder"></div>
<!--
   <div class="table_outer_container">
      <div class="overthrow table_container" id="div_pbp">
  <table class="sortable stats_table" id="pbp" data-cols-to-freeze=2>
... -->

this answer会帮助您吗?