Selenium:在javascript调用时获取终极href / link而不点击它

时间:2018-03-31 13:00:03

标签: javascript python selenium

我正在网上搜索一个长链的html链接表(允许在ToS下)。但是,所有链接都是javascript调用(href =“javascript:;”),因此使用get_attribute()来获取链接将无法正常工作。我不想实际点击所有链接,因为它会为每个链接下载一个大的pdf文件

是否有可能获得被调用的终极href / link,而无需实际点击链接并下载文件?

谢谢!

1 个答案:

答案 0 :(得分:1)

是的,但并不容易 - 您需要查看超出这些链接的JavaScript,可能是动态生成的链接。

此处描述了执行此操作<a href="javascript:;"></a>的想法 What does href expression <a href="javascript:;"></a> do?

简而言之:在正确呈现<a>的HTML中,您需要设置href,但有时没有直接链接或以某种方式进行计算 - 所以您需要查看javascript执行处理这些链接的代码 - 可能是您需要找到的click个事件监听器