Python dryscrape用饼干刮页

时间:2016-01-18 10:07:56

标签: python web-scraping python-requests

我想从网站获取一些数据,这需要登录。
我通过请求

登录
url = "http://example.com"
response = requests.get(url, {"email":"a@gmail.com", "password":"12345"})
cookies = response.cookies

然后我想从一些JS页面获取数据。通过请求是不可能的,因此我必须使用 dryscrape

import dryscrape
url = "http://example.com/js-page"
sess = dryscrape.Session()
sess.visit(url)

是否可以将Cookie传递给访问(),或者我必须寻找其他解决方案?

1 个答案:

答案 0 :(得分:6)

为什么不通过dryscrape登录?

session = dryscrape.Session()
session.visit('<url_where_is_login_form>')
name = session.at_xpath('//*[@name="username"]') # Where <input name="username">
name.set("<login>")
password = session.at_xpath('//*[@name="password"]') # Where <input name="password">
password.set("<password>")
# Push the button
name.form().submit()
session.visit("<url to visit with proper cookies>")