如何将具有javascript:do_postback的链接转换为url?

时间:2016-06-17 21:38:23

标签: javascript asp.net web-scraping

我尝试将网址提供给请求网址进行批量提取或抓取的抓取网站,但我感兴趣的网页采用apsx格式,所有网页都编码为

href="javascript:__doPostBack('AspNetPager1','3')
href="javascript:__doPostBack('AspNetPager1','4')
href="javascript:__doPostBack('AspNetPager1','5')

是否有办法获取页面链接的网址,以便我可以将其提供给批量提取模式?

我在stackoverflow上发现的类似帖子是

How to convert a link that has javascript:__doPostBack in href to normal url which wget/curl/lynx can understand?

但是我没有按照答案,我已经安装了萤火虫,但我不确定从网络流量中提取网址的原因是什么?"实际上需要。我不熟悉python或计算机语言,我只是试图通过用户友好的网站(例如import.io)从网站中提取文本。

0 个答案:

没有答案