通过Google搜索返回的链接下载所有pdf文件

时间:2016-05-16 04:27:24

标签: python pdf web-scraping

美好的一天,

请告知我可以使用的过程,以便能够从谷歌搜索返回的[pdf]前缀的链接下载pdf,例如“astronomy pdf”。这个过程应该包括一个通过所有结果页面而不仅仅是第一个结果的方法。

我之前为使用python(urllib,BeautifulSoup,webbrowser)的网页上的文字编写了一个刮刀,但是我不介意用另一种方式[perl,bash等]来做这件事。

请告知以上是否需要进一步。感谢您提供的任何帮助和建议。

0 个答案:

没有答案