我已经看了很多关于cookiejar的教程,但我的问题是我想要scape的网页使用javascript创建cookie,我似乎无法检索cookie。有没有人能解决这个问题?
答案 0 :(得分:3)
如果所有页面都具有相同的JavaScript,那么您可以解析HTML以找到该段代码,并从中获取cookie将设置为的值?
这会使你的抓取很容易受到第三方网站变化的影响,但最常见的情况是刮擦。 (请注意,第三方网站所有者可能不喜欢您以这种方式获取内容。)
答案 1 :(得分:1)
我也回复了您的other question:看看mechanize。它可能是我所知道的最全功能的抓取模块:如果发送了cookie,那么我相信你可以使用这个模块来实现它。
答案 2 :(得分:0)
也许您可以使用Python绑定(如python-spidermonkey或pyv8)在JavaScript引擎中执行JavaScript代码,然后检索cookie。或者,无论如何,当javascript代码在客户端执行时,您可以将生成cookie的代码转换为Python。
答案 3 :(得分:0)