如何从href =“ javascript:...”获取页面链接?

时间:2020-05-21 07:31:33

标签: javascript python href screen-scraping

我正在使用Python进行网页抓取。我需要获取所有搜索结果页面的链接。但是,我发现href值不是常规的html链接,而是以下内容。如何获得正确的页面链接?谢谢!

<a href="javascript:showDocumentSearchResult('20','20','en','','0', '10','srt', 'docdt', 'desc');">2</a>

<a href="javascript:showDocumentSearchResult('20','40','en','','0', '10','srt', 'docdt', 'desc');">3</a>

1 个答案:

答案 0 :(得分:0)

您需要在JS代码中找到showDocumentSearchResult函数(尽管它可能在单独的文件中)。然后知道该函数的功能,就可以通过Python模拟这种动作。

请参见以下示例:https://webscraping.pro/download-a-file-from-a-link-in-python/