用于比较两个站点结构的工具

时间:2009-04-01 19:56:10

标签: web compare

是否有人知道任何可以比较两个几乎完全相同的网站的工具?

简单地说,我有一个沙箱网站和生产网站,想知道它们之间的区别,知道要移动到生产网站的内容。

谢谢!

编辑:

好的,我看到我错过了一条重要的信息(对不起!)。这两个站点都是在线的,基于CMS(Drupal),因此我需要一些可以在两个站点上运行的爬行工具,并显示沙箱中存在的页面,而不是生产中的页面。

感谢所有回答的人!

10 个答案:

答案 0 :(得分:9)

使用httrack下拉网站的副本,然后使用您喜欢的文件比较工具来查看差异。 (我更喜欢WinMerge,它可以递归运行两​​个文件夹,可以选择忽略空格差异和空白行,甚至可以在Linux下使用WINE运行良好。)

P.S。您甚至可能希望通过HTML Tidy运行下载的HTML文件,以便在进行比较之前对它们进行标准化/漂亮格式化。


另一种方法是database comparison。你仍然会对原始网站文件(不是蜘蛛网版)进行文件比较。从内存来看,Drupal数据库的架构并不难理解,特别是如果您只对节点内容感兴趣的话。

答案 1 :(得分:8)

Beyond Compare ...纯粹的超棒

答案 2 :(得分:4)

WinMerge是一个免费/开源工具,允许您比较文件和目录。

您可以只显示一个目录中相同,不同或存在的文件。 然后,您可以通过将文件从一个目录复制到另一个目录来使两个目录相同。

答案 3 :(得分:3)

正如阳光所说,使用爬虫和差异工具。

对于爬虫我更喜欢httrack over wget。 许多网站现在使用从css引用的图像。 我上次检查时,wget无法加载从css引用的文件。 除此之外,它有一个很好的GUI。

截至diff工具: 我从Windows 3.1天开始使用FileSync。 肯定有更多花哨的差异工具,但这个工具是精益和干净的工作。 在unix上,你总是可以做diff -r。 如果你的机器上有eclipse,它有一个很好的差异查看器,可以比较两个目录。

答案 4 :(得分:1)

如果您正在运行Linux,

Meld对此有好处。它可以在Debian / Ubuntu存储库中使用。

答案 5 :(得分:1)

使用wget抓取网站,将内容与某些diff工具进行比较。

或者,在脚本文件上使用diff工具,然后将DB转储到文本(csv)文件中,并进行比较。

答案 6 :(得分:0)

超越比较是伟大的。 Syncback(http://www.2brightsparks.com/downloads.html)有一个免费版本,您可以使用任何合并工具,如araxis或winmerge

答案 7 :(得分:0)

将您的代码放入Subversion或其他一些源代码控制中。准备部署后,“svn update”将仅更新已更改的内容。

'svn diff'将显示差异。

答案 8 :(得分:0)

DiffMerge是另一个支持目录差异的免费跨平台工具。

答案 9 :(得分:0)

您还可以使用某些在线比较服务,例如CopyScapeChangeDetection