是否有人知道任何可以比较两个几乎完全相同的网站的工具?
简单地说,我有一个沙箱网站和生产网站,想知道它们之间的区别,知道要移动到生产网站的内容。
谢谢!
编辑:
好的,我看到我错过了一条重要的信息(对不起!)。这两个站点都是在线的,基于CMS(Drupal),因此我需要一些可以在两个站点上运行的爬行工具,并显示沙箱中存在的页面,而不是生产中的页面。
感谢所有回答的人!
答案 0 :(得分:9)
使用httrack下拉网站的副本,然后使用您喜欢的文件比较工具来查看差异。 (我更喜欢WinMerge,它可以递归运行两个文件夹,可以选择忽略空格差异和空白行,甚至可以在Linux下使用WINE运行良好。)
P.S。您甚至可能希望通过HTML Tidy运行下载的HTML文件,以便在进行比较之前对它们进行标准化/漂亮格式化。
另一种方法是database comparison。你仍然会对原始网站文件(不是蜘蛛网版)进行文件比较。从内存来看,Drupal数据库的架构并不难理解,特别是如果您只对节点内容感兴趣的话。
答案 1 :(得分:8)
Beyond Compare ...纯粹的超棒
答案 2 :(得分:4)
WinMerge是一个免费/开源工具,允许您比较文件和目录。
您可以只显示一个目录中相同,不同或存在的文件。 然后,您可以通过将文件从一个目录复制到另一个目录来使两个目录相同。
答案 3 :(得分:3)
正如阳光所说,使用爬虫和差异工具。
对于爬虫我更喜欢httrack over wget。 许多网站现在使用从css引用的图像。 我上次检查时,wget无法加载从css引用的文件。 除此之外,它有一个很好的GUI。
截至diff工具: 我从Windows 3.1天开始使用FileSync。 肯定有更多花哨的差异工具,但这个工具是精益和干净的工作。 在unix上,你总是可以做diff -r。 如果你的机器上有eclipse,它有一个很好的差异查看器,可以比较两个目录。
答案 4 :(得分:1)
Meld对此有好处。它可以在Debian / Ubuntu存储库中使用。
答案 5 :(得分:1)
答案 6 :(得分:0)
超越比较是伟大的。 Syncback(http://www.2brightsparks.com/downloads.html)有一个免费版本,您可以使用任何合并工具,如araxis或winmerge
答案 7 :(得分:0)
将您的代码放入Subversion或其他一些源代码控制中。准备部署后,“svn update”将仅更新已更改的内容。
'svn diff'将显示差异。
答案 8 :(得分:0)
DiffMerge是另一个支持目录差异的免费跨平台工具。
答案 9 :(得分:0)
您还可以使用某些在线比较服务,例如CopyScape或ChangeDetection