我正在使用带有BeautifulSoap4和urllib的Python 2.7.5从歌词网站中提取(大量)数据并将它们存储到XML文件中。代码运行良好,直到一个神秘的地方,Python似乎进入一个连续工作阶段,没有取得任何进展,也没有抛出错误。退出Python后,如果我尝试访问歌词网站,我会收到此错误:
禁止
您无权访问此服务器上的/。
此外,尝试使用ErrorDocument处理请求时遇到403 Forbidden错误。
我尝试了两个不同的网站,最后我得到了同样的错误。
除非我使用代理
,否则Python无法从该网站提取数据我有办法解决这个问题吗?
谢谢!