我尝试将网址提供给请求网址进行批量提取或抓取的抓取网站,但我感兴趣的网页采用apsx格式,所有网页都编码为
href="javascript:__doPostBack('AspNetPager1','3')
href="javascript:__doPostBack('AspNetPager1','4')
href="javascript:__doPostBack('AspNetPager1','5')
是否有办法获取页面链接的网址,以便我可以将其提供给批量提取模式?
我在stackoverflow上发现的类似帖子是
但是我没有按照答案,我已经安装了萤火虫,但我不确定从网络流量中提取网址的原因是什么?"实际上需要。我不熟悉python或计算机语言,我只是试图通过用户友好的网站(例如import.io)从网站中提取文本。