python - tumblr - notes - wget或其他解决方案

时间:2013-05-27 16:45:28

标签: python selenium wget tumblr scrape

我想在给定的tumblr帖子中下载所有笔记。

此帖子例如http://ronbarak.tumblr.com/notes/40692813320/4Y70Zzacy?

经过谷歌和本网站的一些研究后,我决定使用这种方法 - 通过python执行wget命令,然后在python中进行处理。

更新:对不起,我之前没有说过。代码可以提供,但它只会下载第一页的笔记。它没有深入挖掘。

import os

os.system("wget --recursive --domains=ronbarak.tumblr.com --include-directories=notes http://ronbarak.tumblr.com/notes/40692813320/4Y70Zzacy?")

有人可以指出我需要在我的wget变量中进行更改,或者它是否永远无法工作。

0 个答案:

没有答案