我正在使用Python进行网页抓取。我需要获取所有搜索结果页面的链接。但是,我发现href值不是常规的html链接,而是以下内容。如何获得正确的页面链接?谢谢!
<a href="javascript:showDocumentSearchResult('20','20','en','','0', '10','srt', 'docdt', 'desc');">2</a>
<a href="javascript:showDocumentSearchResult('20','40','en','','0', '10','srt', 'docdt', 'desc');">3</a>
答案 0 :(得分:0)
您需要在JS代码中找到showDocumentSearchResult
函数(尽管它可能在单独的文件中)。然后知道该函数的功能,就可以通过Python模拟这种动作。
请参见以下示例:https://webscraping.pro/download-a-file-from-a-link-in-python/