存档的网页内容无需访问网站

时间:2012-11-30 08:44:50

标签: open-source html-content-extraction webarchive

我想在不去实际网站的情况下获取网页数据。

http://archive.org/web/web.php是保存网站快照的示例。问题是数据很老(5-6个月)。

我们是否有其他存档存储可以找到最近的html内容?

由于

1 个答案:

答案 0 :(得分:0)

你想卷曲网站吗? 你可以用php来cURL一些网页:
http://php.net/manual/en/book.curl.php

或者你可以在Unix中使用command,wget或curl:
http://linux.about.com/od/commands/l/blcmdl1_curl.htm