我正在尝试在抓取Amazon时设置cookie,以免被捕获并看起来像是真实用户。
我正在尝试复制网站的行为。我已经完全分析了标头,请求和响应签名等。唯一改变的是cookies
,还有csm-hit
和visitCount
。我了解visitCount
更新背后的逻辑,但不了解csm-hit
的逻辑。
这是csm-hit
cookie。
tb:s-Y4SB9X78SYQB53MGCQWE|1551555477343&t:1551555479805&adb:adblk_no
具有以下格式:-
tb:s - ALPHANUMERIC | EPOCH_TIME &t EPOCH_TIME &adb:adblk_no
此字母数字字符(看起来像base64编码)不断变化。在重新加载/重定向到亚马逊之外时,它将调用函数updateCsmHit
,该函数随后将更新csm-hit
值,然后在下次向服务器发出请求时再次使用相同的更新值。如果此Cookie尚未保存在浏览器中,则不会在请求中发送csm-hit
,而是在我们退出Amazon时保存它。
我已经使用Chrome开发工具分析了完整的源代码,但是无法破解生成此字母数字值的逻辑。
我想了解如何生成此值,以便可以使用相同的逻辑来复制它的生成?有人可以使用Chrome开发工具在这方面为我提供帮助。
有人知道csm-hit
的意义吗?
PS:请不要建议我每次都使用相同的csm-hit
。我想知道这是怎么产生的。