Python美丽的汤和Urllib 403错误

时间:2013-07-18 22:19:09

标签: python beautifulsoup urllib http-status-code-403

我正在使用带有BeautifulSoap4和urllib的Python 2.7.5从歌词网站中提取(大量)数据并将它们存储到XML文件中。代码运行良好,直到一个神秘的地方,Python似乎进入一个连续工作阶段,没有取得任何进展,也没有抛出错误。退出Python后,如果我尝试访问歌词网站,我会收到此错误:

禁止

您无权访问此服务器上的/。

此外,尝试使用ErrorDocument处理请求时遇到403 Forbidden错误。

我尝试了两个不同的网站,最后我得到了同样的错误。

除非我使用代理

,否则Python无法从该网站提取数据

我有办法解决这个问题吗?

谢谢!

0 个答案:

没有答案