因此,我正在尝试获取网站的内容,但是该内容仅在单击“图表”链接时出现,这是一个像这样的javascript命令:
javascript:__doPostBack('fcc1$dgrC$ctl02$ctl00',''
来自这样的元素:
<a href="javascript:__doPostBack('fcc1$dgrC$ctl02$ctl00','')">Chart</a>
这是网站:
这是当您单击“图表”时发生的情况:
您可以看到链接没有改变,因此获取图表代码的唯一方法是通过某种方式发送该javascript命令
如何查找所有图表链接? 如何在图表链接上进行“虚拟点击”? 然后,如何获取新的html?
非常感谢您的帮助!
答案 0 :(得分:0)
如果这些链接确实被javascript监听器“点击”,则可能很难找到要点击的真实链接。
相反,您可以使用工具来模拟python中的Web浏览器,然后在该链接上“单击”以转到下一页。我使用过的最好的是机械汤:https://mechanicalsoup.readthedocs.io/en/stable/introduction.html。
答案 1 :(得分:0)
doPostBack仅设置__EVENTTARGET和__EVENTARGUMENT表单字段并提交表单。这些“”只是引号。