我将如何创建WebPage Copier应用程序

时间:2011-01-15 01:05:33

标签: java c++ webpage

您好我在网上进行了大量研究,但在大多数情况下,我在研究的所有时间都没有连接到WWW。所以我想开始创建一个网站复印机应用程序...我知道HHTrack网站复印机,但该程序有它的局限性,例如它无法复制任何维基百科页面..可能导致它访问“目标”服务器在允许在某种程度上访问的指定端口上。但我正在寻找的基本上不是复制“整个”网站而只是它的一部分。如果手动执行,复制网页的过程很简单。 1)转到URL。 2)单击文件>将页面另存为。 3)确保保存为“完整页面”。 3个简单的步骤。怎么做自动化?我可以使用一个宏,但只是做了更多的工作。努力的三倍......

我可能会为Firefox创建一个插件,您可以将其放入要保存到计算机上的URL列表中。但我不太熟悉API / SDK,我可能会看看HHTrack Src,有点野蛮的一些部分,并把一个很好的拼图放在一起。但是,如果我想从头开始这样做,我需要在C,C ++或Java中查看哪些API?我不是在寻找一个gui。但只是一个简单的程序。你有什么想法?

如果你想知道我在研究什么。数学,电信,编程,计算机体系结构,磁学。书籍需要花钱,有时会提供超出您需要的信息,并且不像上网本那样便携。只是因为我研究这些领域并不意味着我知道这一切......这么多的帮助将是最有帮助的。

2 个答案:

答案 0 :(得分:2)

Wget --mirror http://example.com

答案 1 :(得分:0)

你可能也想检查wget: 对于Java: http://www.koders.com/java/fid8A3F9CE8B64CA6212A5018CF8A345BCC58796ACE.aspx?s=Quota#L95

对于C ++: 检查这个旧的Stack OverFlow问题并回答: Options for web scraping - C++ version only