网站下载程序库

时间:2010-03-15 14:50:31

标签: offline-browsing

我需要为自己整理一个小项目,我需要一些功能来下载页面以供离线查看。是否有一个库可以下载给定页面及其嵌入的图像,并编辑img标签以反映图像的本地位置。

我知道有很多网站下载器,但是我找不到可以直接在我的代码中使用的东西。

我在python中完成了一些基本脚本,因此非常欢迎Python。但几乎任何语言都可以。

4 个答案:

答案 0 :(得分:1)

您正在寻找BeautifulSoup

答案 1 :(得分:1)

python网络抓取工具怎么样? http://code.google.com/p/pywebcrawler/

OR,Anemone(红宝石)? http://anemone.rubyforge.org/

答案 2 :(得分:1)

是的,BeautifulSoup + python urllib模块

答案 3 :(得分:0)

我能想到的最简单的解决方案。

wget -p example.com