我想知道是否有任何方法可以使用Python从受限制的网页上抓取html。
我已经能够在网页上执行登录,但是我想在登录后抓取另一个页面,但是该页面的URL表示为以下格式:-
除了不受限制的部分之外,我无法获取整个页面的HTML。如何获得受限网页的整个HTML? 到目前为止,这是我的代码:
main_url/Restricted/Index.aspx
欣赏答案。
答案 0 :(得分:2)
尝试使用代理。使用适当的强代理,您可以绕过网站的安全性机制,但它也取决于安全性的类型。
如上答案所述,如果需要,您也应该传递cookie。
pls提供有关您如何抓取的更多信息。请共享代码。