Question

我首先搜索了SO，然后发现了这个问题。 How to click a link that has javascript:__doPostBack in href?但它只在python中给出答案。

我需要的是，当浏览一个网站时，一些页面（2,3,4等）的链接如下：

javascript:__doPostBack('AspNetPager1','2')
javascript:__doPostBack('AspNetPager1','3')
javascript:__doPostBack('AspNetPager1','4')

如果我点击它，它将显示下一页，但真实的网址不会显示在浏览器中。

所以我的问题是，如何将javascript链接转换为可追溯的真实网址并将其转换为wget/curl/lynx？

我的目的是使用工具（wget / curl / lynx）通过脚本逐个下载这些页面。但由于这些javascript:__doPostBack，我找不到一个好办法。

Answer 1

你无法通过分析来做到这一点。 __doPostBack可能是任意复杂的。

您应该做的是安装Firebug（假设您使用的是Firefox），激活网络选项卡，按＆＃34; Persist＆＃34;，然后单击该按钮。 “网络”选项卡将显示实际的网络流量，您可以从中推断出真实的网址。实际上，您只需右键单击您感兴趣的特定网络请求，然后选择＆＃34;复制为cURL＆＃34;它会在你的粘贴缓冲区中添加卷曲指令 - 包括cookie和标题等内容。

Chrome内置了类似的功能。

如何将href中的javascript：__ doPostBack链接转换为wget / curl / lynx可以理解的普通url？

1 个答案: