我想在给定的tumblr帖子中下载所有笔记。
此帖子例如http://ronbarak.tumblr.com/notes/40692813320/4Y70Zzacy?
经过谷歌和本网站的一些研究后,我决定使用这种方法 - 通过python执行wget命令,然后在python中进行处理。
更新:对不起,我之前没有说过。代码可以提供,但它只会下载第一页的笔记。它没有深入挖掘。
import os
os.system("wget --recursive --domains=ronbarak.tumblr.com --include-directories=notes http://ronbarak.tumblr.com/notes/40692813320/4Y70Zzacy?")
有人可以指出我需要在我的wget变量中进行更改,或者它是否永远无法工作。