我正在网上搜索一个长链的html链接表(允许在ToS下)。但是,所有链接都是javascript调用(href =“javascript:;”),因此使用get_attribute()来获取链接将无法正常工作。我不想实际点击所有链接,因为它会为每个链接下载一个大的pdf文件
是否有可能获得被调用的终极href / link,而无需实际点击链接并下载文件?
谢谢!
答案 0 :(得分:1)
是的,但并不容易 - 您需要查看超出这些链接的JavaScript,可能是动态生成的链接。
此处描述了执行此操作<a href="javascript:;"></a>
的想法
What does href expression <a href="javascript:;"></a> do?
简而言之:在正确呈现<a>
的HTML中,您需要设置href
,但有时没有直接链接或以某种方式进行计算 - 所以您需要查看javascript执行处理这些链接的代码 - 可能是您需要找到的click
个事件监听器