如何将href中的javascript:__ doPostBack链接转换为wget / curl / lynx可以理解的普通url?

时间:2014-04-22 04:31:10

标签: javascript shell hyperlink wget lynx

我首先搜索了SO,然后发现了这个问题。 How to click a link that has javascript:__doPostBack in href?但它只在python中给出答案。

我需要的是,当浏览一个网站时,一些页面(2,3,4等)的链接如下:

javascript:__doPostBack('AspNetPager1','2')
javascript:__doPostBack('AspNetPager1','3')
javascript:__doPostBack('AspNetPager1','4')

如果我点击它,它将显示下一页,但真实的网址不会显示在浏览器中。

所以我的问题是,如何将javascript链接转换为可追溯的真实网址并将其转换为wget/curl/lynx

我的目的是使用工具(wget / curl / lynx)通过脚本逐个下载这些页面。但由于这些javascript:__doPostBack,我找不到一个好办法。

1 个答案:

答案 0 :(得分:0)

你无法通过分析来做到这一点。 __doPostBack可能是任意复杂的。

您应该做的是安装Firebug(假设您使用的是Firefox),激活网络选项卡,按" Persist",然后单击该按钮。 “网络”选项卡将显示实际的网络流量,您可以从中推断出真实的网址。实际上,您只需右键单击您感兴趣的特定网络请求,然后选择"复制为cURL"它会在你的粘贴缓冲区中添加卷曲指令 - 包括cookie和标题等内容。

Chrome内置了类似的功能。