标签: python web-scraping beautifulsoup
我目前正在学习如何使用Python / BeautifulSoup抓取网站,并且想知道为什么某些网页可以被抓取而其他网页不能被抓取。
例如:
某些页面是否具有某种防止刮擦的安全性?
答案 0 :(得分:0)
为了测试特定网页是否可以被抓取,我会尝试做的第一件事是针对scrapy shell运行该网页,然后我将回复返回到view(response),因此该响应中返回的任何内容都可以删除。
scrapy shell
view(response)