网址未更改时,Python Web抓取

时间:2020-11-10 03:39:22

标签: python beautifulsoup python-requests anaconda

我正在使用python进行网络抓取投影。我应该抓取这个网站(https://www.fec.gov/data/receipts/?committee_id=C00703975&two_year_transaction_period=2020&data_type=processed)。我遇到的问题是,当您浏览数据时,URL永远不会改变。我不确定如何进行。根据我在抓取网站时的经验,切换页面时,URL会更改,但是此页面不会更改,它只会浏览同一页面上的数据。谢谢!

1 个答案:

答案 0 :(得分:1)

此网站处理大量数据,并且它是动态的。在同一布局中,显示的数据将不断变化。解决问题的另一种方法(可能不是最好的方法)是导出数据并将其保存到暂存区并处理该数据。您可以定期从https://www.fec.gov/data/browse-data/?tab=bulk-data

刷新暂存区

这大大减少了对抓取程序的需求,并使您专注于实际数据分析。

相关问题