抓取后网站错误

时间:2017-02-02 15:57:36

标签: python web-scraping

我制作了一个简单的刮刀来访问一张专辑,并从azlyrics.com上搜集每首歌曲的歌词。

经过大约一个小时的工作,该网站崩溃了,但出现了错误:

Chrome:

  

www.azlyrics.com没有发送任何数据。 ERR_EMPTY_RESPONSE

Tor,firefox,waterfox:

  

重置连接在页面加载时重置了与服务器的连接。

我的家庭网络上的所有设备都是一样的。如果我使用移动数据通过我的手机访问它,它工作正常。

我尝试用ipconfig / release / renew修复它,但它没有用。 我不知道我还能做什么,或者为什么它甚至发生了。任何帮助是极大的赞赏。

1 个答案:

答案 0 :(得分:3)

显然,您的知识产权被网站禁止进行可疑活动。有几种方法:

  • 与网站所有者交谈。这是最直接,最好的方式
  • 更改您的IP,例如通过连接公共代理池或Tor连接。这有点脏,而且不那么健壮,例如你可以被用户代理或刮刀的其他一些属性禁止。