我一直在阅读关于beautifulSoup,http标题,身份验证,Cookie以及有关机械化的内容。
我正试图用python抓住我最喜欢的艺术网站。就像我发现刮刀的异常艺术一样。现在我正在尝试登录,但我尝试的基本身份验证代码示例不起作用。
所以问题,如何找出网站使用的身份验证类型,以便我知道我正在尝试以正确的方式登录?当他们试图阻止僵尸程序时,包括有效的用户代理等内容。
承担我的无知,因为我是HTTP,python和scraping的新手。
答案 0 :(得分:0)
您感兴趣的任何网站都不太可能使用基本身份验证。您将需要一个管理cookie的机械化库,您需要将登录信息提交到网站的登录页面。