我需要为自己整理一个小项目,我需要一些功能来下载页面以供离线查看。是否有一个库可以下载给定页面及其嵌入的图像,并编辑img标签以反映图像的本地位置。
我知道有很多网站下载器,但是我找不到可以直接在我的代码中使用的东西。
我在python中完成了一些基本脚本,因此非常欢迎Python。但几乎任何语言都可以。
答案 0 :(得分:1)
您正在寻找BeautifulSoup。
答案 1 :(得分:1)
python网络抓取工具怎么样? http://code.google.com/p/pywebcrawler/
OR,Anemone(红宝石)? http://anemone.rubyforge.org/
答案 2 :(得分:1)
是的,BeautifulSoup + python urllib模块
答案 3 :(得分:0)
我能想到的最简单的解决方案。
wget -p example.com