我试图通过https://www.voyages-sncf.com/billet-train使用请求获得一些火车票时间和价格。 到目前为止,我似乎无法到达任何地方。
url = 'https://www.voyages-sncf.com/billet-train'
formData = {
'ORIGIN_CITY': 'PARIS',
'DESTINATION_CITY': 'BORDEAUX',
'OUTWARD_DATE': '30/09/2017',
'TRAVEL_TYPE': 'AS',
'OUTWARD_SCHEDULE_TYPE': 'DEPARTURE_FROM',
'OUTWARD_TIME': '07h'
}
s = requests.Session()
r = s.post(url, headers=headers, data=formData, proxies = proxyDict)
print(r)
print(r.headers)
首先,我不知道为什么我会获得200个http代码... 此外,我唯一能够登陆的是错误页面(在Request.history之后)
print(r.history)
print(r.history[0].headers["Location"])
print(r.history[1].headers["Location"])
print(r.history[2].headers["Location"])
print(r.history[3].headers["Location"])
手工做同样的事情并观察发生了什么我可以看到填写表单会将我重定向到:
https://www.voyages-sncf.com/recherche-en-cours?hid=2BH,
然后到voyages-sncf.com/vsc/proposals/findProposals?hid=2BH,
然后最终到voyages-sncf.com/proposition?clientId=4765cf49-d109-4a93-83ff-3c21182d7891&language=fr&country=FR,其中的价格和时间是。
我认为请求可以处理重定向但我必须遗漏一些东西...... 有人可以解释一下发生了什么吗?