我是编程的新手,但是我一直在遵循此Scrapy教程在此处抓取NFL数据:http://brutalsimplicity.github.io/2016/07/25/scrapy.html。
我们正在使用此链接(https://www.pro-football-reference.com/boxscores/201409040sea.htm),我们希望在最底端有一个大型的Play播放表。
在本教程中,它说我们想要的表ID是“ pbp_data”,但是我找到了相同的表,现在的ID是“ pbp”,并带有此代码
<table class="sortable stats_table now_sortable sliding_cols" id="pbp" data-cols-to-freeze="2">
我以前从未使用过Python或XPath,所以我只是按照他们说的在我的外壳上执行response.xpath('//table[@id ="pbp"]')
的指示,但是由于某些原因,当我按Enter键时什么也没显示。
我对XPath的理解是否存在问题,还是我在做些错误时弄乱了?
谢谢!
答案 0 :(得分:1)
如果使用view(response)
,则会注意到您要抓取的数据已注释:
<div class="placeholder"></div>
<!--
<div class="table_outer_container">
<div class="overthrow table_container" id="div_pbp">
<table class="sortable stats_table" id="pbp" data-cols-to-freeze=2>
... -->
this answer会帮助您吗?