我首先搜索了SO,然后发现了这个问题。 How to click a link that has javascript:__doPostBack in href?但它只在python中给出答案。
我需要的是,当浏览一个网站时,一些页面(2,3,4等)的链接如下:
javascript:__doPostBack('AspNetPager1','2')
javascript:__doPostBack('AspNetPager1','3')
javascript:__doPostBack('AspNetPager1','4')
如果我点击它,它将显示下一页,但真实的网址不会显示在浏览器中。
所以我的问题是,如何将javascript链接转换为可追溯的真实网址并将其转换为wget/curl/lynx
?
我的目的是使用工具(wget / curl / lynx)通过脚本逐个下载这些页面。但由于这些javascript:__doPostBack
,我找不到一个好办法。
答案 0 :(得分:0)
你无法通过分析来做到这一点。 __doPostBack
可能是任意复杂的。
您应该做的是安装Firebug(假设您使用的是Firefox),激活网络选项卡,按" Persist",然后单击该按钮。 “网络”选项卡将显示实际的网络流量,您可以从中推断出真实的网址。实际上,您只需右键单击您感兴趣的特定网络请求,然后选择"复制为cURL"它会在你的粘贴缓冲区中添加卷曲指令 - 包括cookie和标题等内容。
Chrome内置了类似的功能。